标签:Shuffle -- examples 源码 内核 磁盘 spark 内存
spark内核与源码
一、环境准备(Yarn集群)
bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master yarn \
--deploy-mode cluster \
./examples/jars/spark-examples_2.12-3.0.0.jar \
10
spark-submit
--class org.apache.spark.examples.SparkPi
--master local[2]
../examples/jars/spark-examples_2.12-3.0.0.jar
10
二、组件通信
Driver => Executor
三、应用程序的执行
1、RDD依赖
2、阶段划分
3、任务切分
4、任务的调度
5、任务执行
四、Shuffle
1、Shuffle 的原理和执行过程
- shuffleWriterProcessor(写处理器)
- ShuffleManager: Hash(早期) & Sort(当前)
2、Shuffle 写磁盘
3、Shuffle 读取磁盘
五、内存的管理
1、内存的分类
2、内存的配置
标签:Shuffle,--,examples,源码,内核,磁盘,spark,内存 来源: https://blog.csdn.net/Smiling_lzy/article/details/122025584
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。