标签:MAP 文件 APP reduce mapreduce 程序执行 MASTER 分片 过程
1、客户端程序,设置作业相关的配置和计算输入分片信息,向RM获取一个JOBID,提交作业信息(分片)到以作业ID为目录下,通知APP——MASTER
2、APP——MASTER,读取指定目录下的作业信息,根据分片信息,建立MAP 任务
MAP在输出时,会根据reducer的数量,在内存中分区,并使用多个线程对每个分区内的记录进行排序
当缓冲到达额度时,会写入一个溢出文件。最终每个MAP的溢出文件会合并为一个输出文件(分区并排好序的文件),MAP任务执行完毕,通过HTTP通知
APP_MASTER,框架会到指定的分区下获取数据并复制到reduce的输入缓存排序合并,溢出生成文件,最终合并到输入缓存,作为reduce的输入。
3、reduce输出
标签:MAP,文件,APP,reduce,mapreduce,程序执行,MASTER,分片,过程 来源: https://www.cnblogs.com/justart/p/11631437.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。