发布网友 发布时间:2024-09-27 16:00
共1个回答
热心网友 时间:2024-09-28 06:51
Apache Yarn的设计理念是将Hadoop从单一的分布式计算框架转变为一个全面的分布式资源管理和调度平台。这一转变使得它能够支持多种计算框架,如Spark、Flink、Storm、Giraph、Drill和Solr,从而构建更为丰富的生态系统。
自定义Yarn application的编写涉及核心组件和接口,Hadoop2.x的Yarn将资源抽象为Container,相比之前的map slots和reduce slots,Container提供了更大的灵活性。资源管理通过Client与ResourceManager交互,ApplicationMaster通过AMRMClientAsync与RM通信,同时与NodeManager通信获取和管理containers,以启动子任务进程。
具体实现可以通过查看示例代码来深入理解,例如Spark与Yarn的整合示例以及Drill在Yarn上的应用。通过分析Yarn application在Client、ResourceManager和NodeManager的日志,可以更直观地掌握整个流程。
热心网友 时间:2024-09-28 06:47
Apache Yarn的设计理念是将Hadoop从单一的分布式计算框架转变为一个全面的分布式资源管理和调度平台。这一转变使得它能够支持多种计算框架,如Spark、Flink、Storm、Giraph、Drill和Solr,从而构建更为丰富的生态系统。
自定义Yarn application的编写涉及核心组件和接口,Hadoop2.x的Yarn将资源抽象为Container,相比之前的map slots和reduce slots,Container提供了更大的灵活性。资源管理通过Client与ResourceManager交互,ApplicationMaster通过AMRMClientAsync与RM通信,同时与NodeManager通信获取和管理containers,以启动子任务进程。
具体实现可以通过查看示例代码来深入理解,例如Spark与Yarn的整合示例以及Drill在Yarn上的应用。通过分析Yarn application在Client、ResourceManager和NodeManager的日志,可以更直观地掌握整个流程。