温馨提示:本站源码资源提供给大家学习研究借鉴美工之用,请勿用于商业和违法用途,无任何技术支持!
第一周 Spark生态系统概述与编程模型
• Spark生态系统概述
• 回顾Hadoop MapReduce
• Spark运行模式
• RDD
• Spark运行时模型简介
• 缓存策略介绍
• transformation
• action
• lineage
• 容错处理
• 宽依赖与窄依赖
• 集群配置
第二周 深入Spark内核
• Spark术语解释
• 集群概览
• 核心组件
• 数据本地性
• 常用RDD
• 任务调度
• DAGScheduler
• TaskScheduler
• Task细节
• 广播变量
• 累加器
• 性能调优
第三周 Spark on Yarn & Spark as a service
• Spark on Yarn原理
• Spark on Yarn实践
• JobServer架构
• JobServer API介绍
• JobServer配置与部署
第四周 Spark Streaming原理与实践
• DStream
• 数据源
• 无状态transformation与有状态transformation
• checkpoint
• 容错
• 性能优化
第五周 Shark与Spark SQL
• Shark数据模型
• Shark数据类型
• Shark架构
• Shark部署
• 缓存(分区)表
• SharkServer
• Shark与Spark结合
• Spark SQL架构
• Parquet支持
• DSL
• SQL on RDD
• Hive支持
• UDF
• JDBC Server
第六周 Machine Learning on Spark
• LinearRegression
• K-Means
• Collaborative Filtering
第七周 Spark多语言编程
• Python简介
• PySpark API
• 使用Python编写Spark程序
• Spark with Java
第八周 图计算GraphX
• 现存的图计算框架
• Table Operators
• Graph Operators
• GraphX设计
第九周 Tachyon原理与实践
• Tachyon原理与架构
• Tachyon实践
第十周 SparkR
• SparkR原理介绍
• 安装配置与运行
上一篇:没有了
下一篇: Hadoop 2.X大数据平台V3(价值499元)
郑重声明:
本站所有内容均由互联网收集整理、网友上传,并且以计算机技术研究交流为目的,仅供大家参考、学习,不存在任何商业目的与商业用途。
若您需要商业运营或用于其他商业活动,请您购买正版授权并合法使用。
我们不承担任何技术及版权问题,且不对任何资源负法律责任。
如遇到资源无法下载,请点击这里失效报错。失效报错提交后记得查看你的留言信息,24小时之内反馈信息。
如有侵犯您的版权,请给我们来信:cainiaovip8@qq.com,我们会尽快处理,并诚恳的向你道歉!
[PHP源码] 多平台短视频解析水印 v3.0 程序源码+视频解析工具
[PHP源码] 2026年最新梦幻付费进群防红端口增加过白功能
[PHP源码] 演示Web H5跳转小程序观看激励广告后下载,实现流量变现赚取广告收益
[手游源码] MT3换皮MH【萌途西游挂机尊享版】最新整理单机一键即玩镜像端+Linux手工服务端+安卓苹果双端+GM后台+详细搭建教
[手游源码] 经典怀旧2.5D奇迹端游【群服奇迹S6特色版】最新整理Win系服务端+网页注册+GM工具+PC客户端+详细搭建教程
[手游源码] 三网H5游戏【剑与盾/神机三国H5】最新整理Linux手工服务端+全套源码+GM授权后台+简易安卓客户端+详细搭建教程
[手游源码] MT3换皮MH【梦晓月影全靠爆挂机尊享版】最新整理单机一键即玩镜像端+Linux手工服务端+安卓苹果双端+GM后台+详细
[综合教程] 大厂裁员互助手册,各家大厂最新裁员套路,劳动仲裁全过程记录【文档】
[电子商务] 抖音小店运营课程,不动销起店、图文带货技术、截流等,三频共振轻松玩转抖店(更新26年)
[项目营销] 付费文章:国家看好的机会(三):四大重点消 费人群的新生意