标签:解释 外部 jar 基础 cluster 集群 spark 运行
http://spark.apache.org/docs/latest/cluster-overview.html
Application
Driver program+ Executors 组成
Driver program
process 一个进程 执行main() 方法 并创建sparkContext
Executor
是一个进程 process
run tasks
cache data
Cluster manager
外部资源管理器,根据运行的模式 yarn standalone 等管理运行需要的 外部资源
Deploy mode
区分 driver 运行的位置
cluster 运行在集群内
client 运行在集群外部
Worker node
工作节点
ask
excutor 中的工作单元 是线程级别
JOB
碰到action 算子 触发一个job
Stage
一个job 可能会被拆分成多个stage
按宽依赖进行拆分多个stage
lication jar
用户编写的jar
标签:解释,外部,jar,基础,cluster,集群,spark,运行 来源: https://blog.51cto.com/u_15084467/2726017
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。