联系管理员

开通文章发布权限

扫码 添加微信
微信图片
电话:18888888888 QQ:

Flink集群部署手册(Standalone运行模式)

Apache Flink是由Apache软件基金会开发的开源流处理框架,其核心是用Java和Scala编写的分布式数据流引擎。Flink以数据并行和流水线方式执行任意流数据程序,Flink的流水线运行时系统可以执行批处理和流处理程序。此外,Flink的运行时本身也支持迭代算法的执行。

Flink运行架构

3c145361777e1e0d88e83f00fc7c5300.png

一、环境准备

Flink下载

Flink下载地址
按照flink-1.17.1 下载Flink

wget https://archive.apache.org/dist/flink/flink-1.17.1/flink-1.17.1-bin-scala_2.12.tgz

安装java环境

yum install java-11-openjdk.x86_64 -y
tar -zxvf flink-1.17.1-bin-scala_2.12.tgz

四、修改配置文件

本项修改均在flink目录/flink-1.17.1/conf/的flink-conf.yaml文件中进行

1、修改JobManager节点地址

修改项修改值
jobmanager.rpc.address值修改为第一台服务器地址,地址是设置master
jobmanager.bind-host值修改为 0.0.0.0
rest.address值修改为master的服务器地址
rest.bind-address值修改为 0.0.0.0

2、修改TaskManager节点地址

修改项修改值
taskmanager.bind-host值修改为 0.0.0.0
taskmanager.host值修改为当前节点服务器IP

3、JobManager和TaskManager组件优化配置

修改项修改项说明
jobmanager.memory.process.size对JobManager进程可使用到的全部内存进行配置, 包括JVM元空间和其他开销,默认为1600M,可以根据集群规模进行适当调整。
taskmanager.memory.process.size对TaskManager进程可使用到的全部内存进行配置, 包括JVM元空间和其他开销,默认为1728M,可以根据集群规模进行适当调整。
taskmanager.numberOfTaskSlots对每个TaskManager能够分配的Slot数量进行配置, 默认为1,可根据TaskManager所在的机器能够提供给Flink的CPU数量决定。所谓Slot就是TaskManager中具体运行一个任务所分配的计算资源。
parallelism.defaultFlink任务执行的并行度,默认为1。优先级低于代码中进行的并行度配置和任务提交时使用参数指定的并行度数量。

 

五、分配节点

1、分配master节点

进入flink目录/flink-1.17.1/conf/目录修改master文件

vim master

将master内容修改为master节点IP+8081端口

2、分配work节点

进入flink目录/flink-1.17.1/conf/目录修改work文件

vim work

将work内容修改为work节点IP,每个IP回车隔离

六、启动\停止Flink集群

启动

在第一台服务器(master节点)进入flink目录/flink-1.11.1/bin执行start-cluster.sh

停止

在第一台服务器(master节点)进入flink目录/flink-1.11.1/bin执行stop-cluster.sh

七、访问

查看Flink Web UI界面,访问master地址+8081端口

1a64805165d81bacd434ae3e2a1dd399.png

注意:集群中Available Task Slots数量是所有work节点中

相关文章

neo4j部署手册
Neo4j是一个高性能的,NOSQL图形数据库,它将结构化数据存储在网络上而不是表中。它是一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎,但是它将结构化数据存储在网络(从数学角度叫做图)上而不是表中。Neo4j也可以被看作是一个高性能的图引擎,该引擎具有成熟数据库的所有特性。程序员工作在一个面向对象的、灵活的网络结构下而不是严格、静态的表中——但是他们可以享受到具备完全的事务特性、企业级的数据库的所有好处。
DataX和DataX-WEB 安装步骤
DataX 是阿里云 DataWorks数据集成 的开源版本,在阿里巴巴集团内被广泛使用的离线数据同步工具/平台。DataX 实现了包括 MySQL、Oracle、OceanBase、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、 MaxCompute(ODPS)、Hologres、DRDS, databend 等各种异构数据源之间高效的数据同步功能。
K8S集群搭建手册(集群版)
kubernetes,简称K8s,是用8代替名字中间的8个字符“ubernete”而成的缩写。是一个开源的,用于管理云平台中多个主机上的容器化的应用,Kubernetes的目标是让部署容器化的应用简单并且高效(powerful),Kubernetes提供了应用部署,规划,更新,维护的一种机制。
Apollo部署手册
Apollo(阿波罗)是携程框架部门研发的分布式配置中心,能够集中化管理应用不同环境、不同集群的配置,配置修改后能够实时推送到应用端,并且具备规范的权限、流程治理等特性,适用于微服务配置管理场景。

评论

快捷导航

把好文章收藏到微信

打开微信,扫码查看

关闭

还没有账号?立即注册