喜欢就分享给更多人!

《Spark 1.X 大数据平台V2》11月开班[完整版附课件]

人工智能 11-30 15:33
《Spark 1.X 大数据平台V2》11月开班[完整版附课件]

一周 Spark生态系统概述与编程模型
•    Spark生态系统概述
•    回顾Hadoop MapReduce
•    Spark运行模式
•    RDD
•    Spark运行时模型简介
•    缓存策略介绍
•    transformation
•    action
•    lineage
•    容错处理
•    宽依赖与窄依赖
•    集群配置

第二周 深入Spark内核
•    Spark术语解释
•    集群概览
•    核心组件
•    数据本地性
•    常用RDD
•    任务调度
•    DAGScheduler
•    TaskScheduler
•    Task细节
•    广播变量
•    累加器
•    性能调优

第三周 Spark on Yarn & Spark as a service
•    Spark on Yarn原理
•    Spark on Yarn实践
•    JobServer架构
•    JobServer API介绍
•    JobServer配置与部署

第四周 Spark Streaming原理与实践
•    DStream
•    数据源
•    无状态transformation与有状态transformation
•    checkpoint
•    容错
•    性能优化

第五周 Shark与Spark SQL
•    Shark数据模型
•    Shark数据类型
•    Shark架构
•    Shark部署
•    缓存(分区)表
•    SharkServer
•    Shark与Spark结合
•    Spark SQL架构
•    Parquet支持
•    DSL
•    SQL on RDD
•    Hive支持
•    UDF
•    JDBC Server

第六周 Machine Learning on Spark
•    LinearRegression
•    K-Means
•    Collaborative Filtering

第七周 Spark多语言编程
•    Python简介
•    PySpark API
•    使用Python编写Spark程序
•    Spark with Java

第八周 图计算GraphX
•    现存的图计算框架
•    Table Operators
•    Graph Operators
•    GraphX设计

第九周 Tachyon原理与实践
•    Tachyon原理与架构
•    Tachyon实践

第十周 SparkR
•    SparkR原理介绍
•    安装配置与运行

下载地址

友情链接: 菜鸟吧源码 菜鸟聚会登录 网站目录大全 菜鸟吧导航网 冒泡网赚 中创网 福缘创业网 臭虾米项目网 小淘学社 吾图资源网 懒人之家源码 ASP300源码 折翼天使 锦尚中国 莎莎源码论坛 吾爱源码论坛 织梦58 搜虎源码论坛 游戏咖啡屋 码农网 虎格网 织梦猫 魔克吧 忽悠兄基地

网站快速入口:| 网站首页 | 用户登录 | 快捷登录 | 注册账号 | 会员中心 |