Flink 任务提交模式
Flink分布式计算框架可以基于多种模式部署,每种部署模式下提交任务都有相应的资源管理方式,例如:Flink可以基于Standalone部署模式、基于Yarn部署模式、基于Kubernetes部署模式运行任务,以上不同的集群部署模式下提交Flink任务会涉及申请资源、各角色交互过程,不同模式申请资源涉及到的角色对象大体相同,下面我们以Flink运行时架构流程为例来总体了解下Flink任务提交后涉及到对象交互流程,以便后续学习不同任务提交模式下任务提交流程。
上图是Flink运行时架构流程,涉及集群启动、任务提交、资源申请分配整个流程,大体步骤如下:
启动Flink集群首先会启动JobManager,Standalone集群模式下同时启动TaskManager,该模式资源也就固定;其他集群部署模式会根据提交任务来动态启动TaskManager;当在客户端提交任务后,客户端会将任务转换成JobGraph提交给JobManager;JobManager首先启动Dispatcher用于分发作业,运行Flink WebUI提供作业执行信息;Dispatcher启动后会启动JobMaster并将JobGraph提交给JobMaster,JobMaster会将JobGraph转换成可执行的ExecutionGraph。JobMaster向对应的资源管理器ResourceManager为当前任务申请Slot资源;在Standalone资源管理器中会直接找到启动的TaskManager来申请Slot资源,如果资源不足,那么任务执行失败;其他资源管理器会启动新的TaskManager,新启动的TaskManager会向ResourceManager进行注册资源,然后ResourceManager再向TaskManager申请Slot资源,如果资源不足会启动新的TaskManager来满足资源;TaskManager为对应的JobMaster offer Slot资源;JobMaster将要执行的task发送到对应的TaskManager上执行,TaskManager之间可以进行数据交换。以上就是Flink任务提交的整体流程信息,在Flink中任务提交还有多种模式,不同的Flink集群部署模式支持的任务提交模式不同,对应的任务执行流程略有不同,向Flink集群中提交任务有三种任务部署模式,分别如下:
(相关资料图)
会话模式- Session Mode单作业模式- Per-Job Mode(过时)应用模式- Application Mode以上三种任务提交模式的主要区别在于Flink集群的生命周期不同、资源的分配方式不同以及Flink 应用程序的main方法执行位置(Client客户端/JobManager)不同。
下面分别进行介绍:
一、会话模式(Session Mode)
Session模式下我们首先会启动一个集群,保持一个会话,这个会话中通过客户端提交作业,集群启动时所有的资源都已经确定,所以所有的提交的作业会竞争集群中的资源。这种模式适合单个作业规模小、执行时间短的大量作业。
优势:只需要一个集群,所有作业提交之后都运行在这一个集群中,所有任务共享集群资源,每个任务执行完成后就释放资源。
缺点:因为集群资源是共享的,所以资源不够了,提交新的作业就会失败,如果一个作业发生故障导致TaskManager宕机,那么所有的作业都会受到影响。
二、单作业模式(Per-Job Mode)
为了更好的隔离资源,Per-job模式是每提交一个作业会启动一个集群,集群只为这个作业而生,这种模式下客户端运行应用程序,然后启动集群,作业被提交给JobManager,进而分发给TaskManager执行,作业执行完成之后集群就会关闭,所有资源也会释放。
优势:这种模式下每个作业都有自己的JobManager管理,独享当下这个集群的资源,就算作业发生故障,对应的TaskManager宕机也不影响其他作业。如果一个Application有多个job组成,那么每个job都有自己独立的集群。
缺点:每个作业都在客户端向集群JobManager提交,如果一个时间点大量提交Flink作业会造成客户端占用大量的网络带宽,会加重客户端所在节点的资源消耗。
注意:Per-Job 模式目前只有yarn支持,Per-job模式在Flink1.15中已经被弃用,后续版本可能会完全剔除,替代的是Application模式,主要原因就是Application模式把main方法的初始化放到了集群组件的JobManager中,这样对于客户端来说从性能上有很大优化。
三、应用模式(Application Mode)
Session 模式和Pre-Job模式都是在客户端将作业提交给JobManager,这种方式需要占用大量的网络带宽下载依赖关系并将二进制包发送给JobManager,此外,我们往往提交多个Flink 作业都是在同一个客户端节点,这样更加剧了客户端所在节点的资源消耗,为了降低客户端这种资源消耗,我们可以使用Application Mode。
Application模式与Per-job类似,只是不需要客户端,每个Application提交之后就会启动一个JobManager,也就是创建一个集群,这个JobManager只为执行这一个Flink Application而存在,Application中的多个job都会共用该集群,Application执行结束之后JobManager也就关闭了。这种模式下一个Application会动态创建自己的专属集群(JobManager),所有任务共享该集群,不同Application之间是完全隔离的,在生产环境中建议使用Application模式提交任务。
以上三种Flink任务部署方式生产环境中优先选择Application模式,三者区别总结如下:
Session 模式是先有Flink集群后再提交任务,任务在客户端提交运行,提交的多个作业共享Flink集群;Per-Job模式和Application模式都是提交Flink任务后创建集群;Per-Job模式通过客户端提交Flink任务,每个Flink任务对应一个Flink集群,每个任务有很好的资源隔离性;Application模式是在JobManager上执行main方法,为每个Flink的Application创建一个Flink集群,如果该Application有多个任务,这些Flink任务共享一个集群。Flink不同的集群部署模式支持不同的任务提交方式,后续会重点介绍Standalone资源管理和Yarn资源管理任务提交模式的支持。
关键词:
-
大数据Flink进阶(十三):Flink 任务提交模式-今日看点
Flink分布式计算框架可以基于多种模式部署,每种部署模式下提交任务都有相应的资源管理方式,例如:Flink可以基于Standalone部署模式、基于Yarn部
-
曝泰勒斯威夫特和男友分手 结束长达6年的恋情 微资讯
曝泰勒斯威夫特和男友分手结束长达6年的恋情
-
宽豆角怎么做好吃 制作宽豆角的方法
1、原料:宽豆角(300g)、二条椒(1根)、生姜(少量)、大蒜(3瓣)、大葱(少量)、食盐适量、生抽适量、鸡精少量、味精少量、植物油适量。2、豆角去
-
索菲亚2022年度拟10派7元 前沿热点
索菲亚4月10日公布2022年年度分红预案:向全体股东每10股派发现金红利7元(含税),合计派发现金红利总额为6 35亿元。
-
天天热推荐:英媒:特朗普刑事指控事件暴露美国社会深度撕裂
当地时间8日,英国《卫报》发表评论文章称,美国前总统特朗普4月4日出庭接受问讯时,庭审现场外集会民众的对立和媒体报道都暴
-
今日观点!福田区推进首席法律咨询专家制度 39名法律专家获聘
读特客户端·深圳新闻网2023年4月9日讯(深圳商报记者张钧政)4月6日,福田区法学会推进首席法律咨询专家制度工作会议暨专家聘任仪式举行,会
-
今日看点:ChatGPT火爆#元宇宙房产崩盘,林俊杰买虚拟地产浮亏91%
鞭牛士4月9日消息,据媒体报道,今年以来,随着虚拟货币价格下跌、多家平台爆雷,元宇宙房产的价格也跟着“崩”了。目前全球最大的元宇宙地产
-
每日资讯:过河拆桥!桑切斯借助前夫认识世界首富,恋爱后马上跟前夫说拜拜
世界首富杰夫·贝佐斯在55岁的时候向媒体宣布,他找到了人生的又一个伴侣劳伦·桑切斯。首富与前妻麦肯齐迅速离婚,并分了为数不多的财产给妻
-
视频丨打开“村BA”的正确姿势
视频加载中 4月8日晚,宜宾珙县洛亥镇将迎来2023年珙县首届“双拥杯”暨社区(行政村)篮球运动会的夺冠之夜。还没开赛,球场就已经里三层外
-
广深港高铁双向客流持续走高|天天快讯
记者8日从中国国家铁路集团有限公司获悉,今年一季度,国家铁路运输呈现客运稳步快速恢复、货运持续高位运行的良好态势,累计发送旅客7 53亿人
-
昊字的寓意和含义取名_昊字的寓意
1、昊是一个汉字,读音为hào(注音:ㄏㄠˋ),常用于人名。2、形容广阔无限(指天)的意思。3、总笔画数为8,部首为曰,
-
咽喉感觉有异物感但吞咽正常_刚怀上几天有什么感觉
1、大部分刚怀孕的女性都没什么感觉,主要是月经推迟了或者还没发作。2、部分女性可能出现白带增多、乳房胀痛、腰酸等不适。3
-
大兴安岭地区中级人民法院:创建“无讼社区” 推动诉源治理
大兴安岭地区中级人民法院:创建“无讼社区”推动诉源治理
-
世界观察:央行最新发声!事关买房、物价、存款保险……信息量巨大
3日,国新办举行“权威部门话开局”系列主题新闻发布会,中国人民银行行长易纲,中国人民银行副行长、国家外汇管理局局长潘功胜,中国人民
-
基金调研丨长信基金调研新大正
根据披露的机构调研信息,4月6日,长信基金对上市公司新大正进行了调研。从市场表现来看,新大正近一周股价下跌2 91%,近一个月下跌9 80%。基
-
主业买书 副业阅读:库房淘书历险记
淘书如打仗,仓库如战场。去年此时在朋友圈刷到“九宫格”,晒的是“最大书市”“中图仓库”“25元一斤”,京城爱书人集体出动,看着收获颇丰
-
纳微科技:4月7日融资净买入185.89万元,连续3日累计净买入3247.55万元
4月7日,纳微科技(688690)融资买入2000 56万元,融资偿还1814 66万元,融资净买入185 89万元,融资余额6 79亿元,近3个交易日已连续净买入累
-
十万左右的车排行榜,10万左右的车哪款好 天天热消息
现在很多家庭在购买汽车的时候,首先考虑的就是汽车的空间,因为空间大,就代表着可以装更多的东西,毕竟现在买车几乎都是为了家庭使用。当家
-
直播预告丨这4种珍稀保护动物,试试你能猜出几个?
熊猫一天究竟要睡几个小时。这种低调的国宝到底是牛还是羊。……4月8日是“国际珍稀动物保护日”
-
工地上拖欠工资不给!包工头!怎么办|每日看点
工地上拖欠工资不给!包工头!怎么办