Spark中Standalone、Yarn和Mesos三种资源管理和任务调度框架的对比

12 篇文章 1 订阅
订阅专栏
5 篇文章 0 订阅
订阅专栏

Spark on Standalone

Standalone是SparkCore自带的集群资源管理框架,类似于MR V1.0采用的模式(JobTracker),内部实现了容错性和资源管理。

内部架构:Client、Master、Worker

                                            

Spark on Standalone的运行流程是将程序代码解析成DAG结构,并再细分到各个Executor和Task去进行并行计算。同时它具有Master的HA,对故障可以进行主备切换。且具有管理每个应用程序资源的功能,可以和Hadoop部署在一起并访问HDFS的数据。

Spark on Mesos

Mesos是Apache下的开源分布式资源管理框架,它被称为是分布式系统的内核。Mesos最初是由加州大学伯克利分校的AMPLab开发的,后在Twitter得到广泛使用。它可以运行Spark作业,MapReduce任务或任何其他服务应用程序。它提供基于Java,Python和C ++的API。它可以在Linux或Mac OSX上运行。

内部架构:Mesos-master,mesos-slave,framework和executor

      (1)Mesos采用了Master HA机制

      (2)Mesos 采用了双层调度框架,允许任何实现任何调度算法,每个算法都能根据自己的策略进行接收或是拒绝分配请求,并且可以容纳成千上万种调度程序以多租户的方式运行在同一个集群:

第一层,由 Mesos 将资源分配给框架;

第二层,框架自己的调度器将资源分配给自己内部的任务。

    

(3)Mesos可实现粗、细粒度资源调度:

      粗粒度模式(Coarse-grained Mode):程序运行之前就要把所需要的各种资源(每个 executor 占用多少资源,内部可运行多少个 executor)申请好,运行过程中不能改变。

      细粒度模式(Fine-grained Mode):为了防止资源浪费,对资源进行按需分配。与粗粒度模式一样,应用程序启动时,先会启动 executor,但每个 executor 占用资源仅仅是自己运行所需的资源,不需要考虑将来要运行的任务,之后,mesos 会为每个 executor 动态分配资源,每分配一些,便可以运行一个新任务,单个 Task 运行完之后可以马上释放对应的资源。

Spark on Yarn

Yarn是Hadoop生态圈中一种新的资源管理器,可以为上层应用提供统一的资源管理和任务调度,它的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处。它的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处。

Yarn针对MapReduce V1.0 的作业机制带来的单点故障、性能瓶颈、且仅支持MapReduce的情况,针对JobTracker而引出了Yarn。至此,Yarn不仅解决了以上问题,还成为了Hadoop生态圈中最重要的资源管理和调度者。

Yarn的内部组件:ResourceManager、NodeManager、ApplicationMaster、Container、Task:

      当前YARN支持内存和CPU两种资源类型的管理和分配

      每个NodeManager可分配的内存和CPU的数量可以通过配置选项设置

      在Yarn内部,是通过调度器(容量调度器、FIFO调度器、公平调度器)来管理和调度集群资源的

                      

根据任务运行流程的不同,Spark on Yarn分为Yarn Client和Yarn Cluster:

      Yarn Client:任务运行在本地,直接可以在运行的时候查看任务的运行状况,日志文件可以在控制台直接查看;在程序测试和运行中小型任务时可以选用该模式。

      Yarn Cluster:运行大任务时采用该模式,任务运行在集群中,非常方便;在任务运行中无法查看任务状态,只能通过向集群发送查询请求后才能看到任务日志文件。

Standalone、Yarn和Mesos的对比:

1、Standalone为Spark自带,内部集成容错性和资源管理,负载较高

2、可以在Mesos框架上再次部署Yarn框架,Yarn比Mesos更成熟

3、Mesos采用双层调度机制,而 Yarn只能通过RM和调度器来管理集群资源,只能使用一种调度模式

4、Mesos可实现粗、细粒度资源调度,可动态分配资源,而 Yarn 只能实现静态资源分配

5、至于是使用Mesos还是Yarn,要根据公司的大数据架构决定。如公司的Hadoop架构更成熟就部署Yarn

Borg/Mesos/Yarn三大主流资源管理与调度系统对比
Kaiyang_Shao的博客
05-07 5088
0. 前言 Mesos(Twitter)、YARN(apache)和Borg(google)三个资源管理与调度系统可以说是目前资源管理和调度系统的先导者,现有的大多数资源管理和调度系统都从这三个系统吸纳设计思想。对这三个系统的对比总结有助于更好的了解目前资源管理与调度系统的状态和未来的发展趋势。 需要特别说明的是,borg系统所提出的思想直接影响了资源管理和调度系统的发展,例如其提出的在线任务和...
Spark的分布式运行模式 Local,Standalone, Spark on Mesos, Spark on Yarn, Kubernetes
u012137473的博客
12-18 1596
Spark的分布式运行模式,Local,Standalone, Spark on Mesos, Spark on Yarn, KubernetesLocal模式Standalone模式Spark on Mesos模式Spark on YarnKubernetes模式 Local模式 Standalone模式的单机版,Master和Worker分别运行在一台机器的不同进程上 Standalone模式...
Spark提交任务(Standalone和Yarn)
weixin_34161083的博客
11-24 312
Spark Standalone模式提交任务   Cluster模式: ./spark-submit \--master spark://node01:7077\--deploy-mode cluster--class org.apache.spark.examples.SparkPi\--driver-memory 1g \ --executor-memory 1g \ --e...
hadoopYarnsparkStandAlone调度模式的对比
weixin_43866709的博客
05-28 505
YARN的基本思想是将JobTracker的两个主要功能(资源管理和作业调度/监控)分离,主要方法是创建一个全局的ResourceManager(RM)和若干个针对应用程序的ApplicationMaster(AM)。这里的应用程序是指传统的MapReduce作业或作业的DAG(有向无环图)。 YARN 分层结构的本质是 ResourceManager。这个实体控制整个集群并管理应用程序向基础计算...
spark on yarnstandalone的区别
嘿!没错,我是李先生
01-10 2404
相同点 standalone是spark自身携带的资源管理框架yarnhadoop资源管理框架。都是对核心和内存进行管理和分配。 不同点 底层实现方式不一样。standalone是比较简单的资源管理,给application分配核心时,分配多少就占用多少,但核心和内存分配自由度大。而yarn是以container为单位分配的,粒度较粗,当然可以自行设置container资源的大小。yarn有fifo调度器,容量调度器,公平调度器这三种资源分配策略,可以动态实现资源的扩缩,更灵活,更重。 另外,s
yarnmesos_MesosYARN:两个集群的故事
danpu0978的博客
05-20 852
yarnmesos 这是两个孤立集群的故事。 第一个集群是Apache Hadoop集群。 这是一个孤岛,其资源与Hadoop及其流程完全隔离。 第二个集群是我对不属于Hadoop集群的所有资源的描述。 之所以将它们分解,是因为Hadoop使用Apache YARN(又是另一个资源协商器)来管理自己的资源。 这对Hadoop很好,但是当队列没有大数据工作负载时,这些资源经常会被利用不足。 ...
spark初始化源码阅读sparkonyarn的client和cluster区别
10-20
Spark 是一个大数据处理的开源框架,它可以在多种集群管理器上运行,如 YARNMesosStandalone。Spark on YARNSparkYARN 集群管理器上的实现。了解 Spark 的初始化源码对于深入理解 Spark 的工作原理和...
SparkCore分布式部署解析:Standalone、YARNMesos
SparkCore源码阅读,主要涵盖了Spark三种部署方式:Standalone、YARNMesos。本文档特别指出,Standalone模式是Spark的基础部署模式,无需依赖其他资源管理系统,具有完整的服务架构。 在深入源码之前,首先了解...
springboot整合spark连接远程服务计算框架使用standAlone模式
最新发布
08-15
这是Spark自带的一种资源管理器,可以独立于其他集群管理器(如YARNMesos)运行。在Standalone模式下,每个节点都既是worker又是driver,可以处理任务并调度其他节点的任务。这种方式简单易用,适合小型或型规模...
spark几种集群管理器总结(超详细)
大柳的博客
01-07 3721
介绍 当前支持三种集群管理器: Spark独立集群管理器(Standalone),一种简单的Spark集群管理器,很容易建立集群,基于Spark自己的Master-Worker集群 Apache Mesos,一种能够运行Haoop MapReduce和服务应用的集群管理器 Hadoop YARNSpark可以和Hadoop集成,利用Yarn进行资源调度 如果在集群仅有Spark程序,那么可以使用Spark独立的集群管理器。如果有其他的mapreduce程序,那么需要使用Yarn或者Mesos管理器。
Spark的安装(Standalone模式,高可用模式,基于Yarn模式)
01-20
目录 sparkStandalone模式安装  一、安装流程 1、将spark-2.2.0-bin-hadoop2.7.tgz  上传到 /usr/local/spark/ 下,然后解压 2、进入到conf修改名字 改为  .sh 结尾的 3、编辑 spark-env.sh 4、修改slaves 的名字  并且编辑他 5、发送到其他两台虚拟机上 6、修改ect/proflie下面的配置环境 7、到spark的sbin目录下 修改启动命令 8、启动之后的jps数目 二、检测是否安装成功 1、进谷歌浏览器看看(端口号是8080 和tomcat端口号是一样的,注意后期一块启动的冲突问题) 2、按
mesosyarn区别
lionzl的专栏
03-12 543
 视频地址:Apache Mesos vs. Hadoop YARN #WhiteboardWalkthrough 总结: 1、最大的不同点在于他们所采用的scheduler:mesos让framework决定mesos提供的这个资源是否适合该job,从而接受或者拒绝这个资源。而对于yarn来说,决定权在于yarn,是yarn本身(自行替应用程序作主)决定这个资源是否适合该job,对
spark 三种部署模式的区别-standalone模式,yarn模式与mesos模式的比较总结
星月情缘的博客
06-22 2953
在这三种部署模式standalone 作为 spark 自带的分布式部署模式,是最简单也是最基本的 spark 应用程序部署模式,这里就不再赘述。这里就讲一下 yarnmesos 的区别: (1) 就两种框架本身而言,mesos上可部署 yarn 框架。而 yarn 是更通用的一种部署框架,而且技术较成熟。 (2) mesos 双层调度机制,能支...
Spark之资源调度和任务调度
lixinkuan的博客
09-20 724
一、前述 Spark的资源调度和任务调度是个很重要的模块,只要搞懂原理,才能具体明白Spark是怎么执行的,所以尤其重要。同时,本文分别介绍了粗粒度和细粒度模式的资源申请。 二、流程图(Standalone-client提交任务方式) Spark资源调度和任务调度的流程: 1、启动集群后,Worker节点会向Master节点汇报资源情况,Master掌握了集群资源情况。 2、当Spa...
SparkOnYarnStandAlone模式的区别
淡定一生2333的博客
08-31 4455
了解了Yarn上的程序如何启动之后(详情《Yarn初步了解》),本文来分析一下Spark On Yarn程序的启动流程,具体来说是Client模式下Spark On Yarn程序是如何启动的。 Spark on Yarn是如何运行起来的: 从SparkContext的启动开始看进去。SparkContext初始化内部具体细节可以看下本人之前写的《SparkContext初始化流...
MesosYARN的区别以及它们如何协同工作
xiaomin1991222的专栏
05-05 250
Hadoop 2.0之后把对集群资源的管理从MapReduce v1的JobTracker提取出来,在YARN进行了实现。虽然YARN支持了多种不同的计算框架,但依旧没有很好的解决集群资源的弹性伸缩问题。本文介绍了一个新的项目- Myriad,它把YARNMesos两者的优势结合起来,不仅使YARN的运行使用更加灵活,而且让整个数据心的扩容变得更简单。 这是一个关于两个集群的故事。第...
YarnSparkStandAlone调度模式的对比
longwenyanlan的博客
12-02 2150
YarnSparkStandAlone调度模式的对比: MapReduce的maptask和reducetask都是在YarnChild进行计算的,YarnChild是一个进程,使用jps命令可以看到 1.yarn的ResourceManager和Spark的master作用:都是管理子节点,资源调度,接收任务请求 2.yarn的nodemanager和spark的worker:管...
YarnSparkStandAlone调度模式对比
liu_xue_xue的专栏
08-02 397
YarnSparkStandAlone调度模式对比 ResouceManager Master 管理子节点、资源调度、接收任务请求 NodeManger Worker 管理当前节点,并管理子进程 YarnChild Executor 运行真正的计算逻辑的(Task) Client SparkSubmit (Client + ApplicaitonMaster)提交app,管理该任务的Execut...
spark 笔记(一) stand alone 和yarn-cluster的部分区别
Keep Thinking And Learning
06-17 5660
公司最近的spark集群由原来的standalone迁移到spark on yarn了,在迁移相关的程序时,发现调整还是有一些的,以下分别是两个版本提交的部分shell命令,从命令可以看出其区别,这个区别主要是spark on yarn的工作方式不太一样,造成提交的方式也不太一样。     standalone方式的脚本为: spark-submit --class com.bg.tools
写文章

热门文章

  • 机器学习之关联规则(支持度和置信度、Apriori算法) 38310
  • (史上最全傻瓜式教程)CM+CDH安装搭建全过程 7007
  • Hadoop安全保护机制(Kerberos&LADP)详解 5076
  • 机器学习之朴素贝叶斯计算全过程 3602
  • CM+CDH安装搭建全过程(总结版) 3202

分类专栏

  • Hadoop 5篇
  • Linux 5篇
  • 大数据 12篇
  • 机器学习 5篇
  • 算法 5篇
  • 数据库 2篇
  • PostgreSQL 1篇
  • SQL 2篇
  • Spark 1篇
  • 云计算 1篇
  • 物联网 1篇

最新评论

  • (史上最全傻瓜式教程)CM+CDH安装搭建全过程

    程序员老钟: 就配置好cdh、cm的yum源后,一台一台的通过yum装Cloudera Agent,其余的都一样

  • (史上最全傻瓜式教程)CM+CDH安装搭建全过程

    十里京: 如果三台主机的root密码不一样怎么办呢?密码我不能修改表情包

  • (史上最全傻瓜式教程)CM+CDH安装搭建全过程

    程序员老钟: 看一下cm-server的状态,以及是否安装成功了,看一下有没有安装日志

  • (史上最全傻瓜式教程)CM+CDH安装搭建全过程

    qq_42287442: 操作步骤到启动CM的时候出了问题,/var/log/cloudera-scm-server 目录下没有日志文件。启动失败,看不到详细的日志

  • 机器学习之关联规则(支持度和置信度、Apriori算法)

    Donreen: 比如x是面包,y是牛奶,x并y就是面包和牛奶同时出现,x交y就是空集了

最新文章

  • (史上最全傻瓜式教程)CM+CDH安装搭建全过程
  • CM+CDH安装搭建全过程(总结版)
  • Hadoop安全保护机制(Kerberos&LADP)详解
2021年2篇
2020年2篇
2019年12篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

玻璃钢生产厂家河南玻璃钢现代雕塑商丘景观园林玻璃钢雕塑北京艺术商场美陈哪家好潍坊北海玻璃钢卡通雕塑三明仿铜西式玻璃钢雕塑玻璃钢成品雕塑报价惠州玻璃钢雕塑制品厂家云南人物玻璃钢雕塑销售厂家江西市政工程玻璃钢花盆宿迁玻璃钢仿铜雕塑定做价格贵阳玻璃钢果蔬雕塑邵阳玻璃钢雕塑工厂江西步行街玻璃钢雕塑定做价格玻璃钢雕塑厂家烟台树脂玻璃钢雕塑定制邢台玻璃钢雕塑选哪家江西玻璃钢雕塑厂家哪家好拱墅区玻璃钢雕塑介绍玻璃钢雕塑公园人物荥阳景观玻璃钢雕塑哪家靠谱玻璃钢雕塑用什么材料6淮安玻璃钢雕塑设计价位雕塑玻璃钢视频玻璃钢人物雕塑生成厂家德阳玻璃钢雕塑摆件施工运城学校校园玻璃钢景观雕塑公司广州欧式贵妇人玻璃钢雕塑红色玻璃钢雕塑销售厂家镂空不锈钢玻璃钢雕塑定制厂家玻璃钢造型雕塑哪个比较好香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化