菜鸟吧论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

QQ登录

只需一步,快速开始

微信登录

只需一步,快速开始

查看: 163703|回复: 331

2014《Hadoop/Spark企业应用实战》11月份班[完整版附课件]

  [复制链接]
admin 发表于 2016-5-14 14:01:50 | 显示全部楼层 |阅读模式
本课程会介绍 Hadoop / Spark 各组件的架构,但不会涉及任何安装的内容,安装的教程、录像视频什么的网上到处都是,讲安装太浪费时间~ Hadoop/Spark环境的安装请大家自行解决,建议用Cloudera CDH或者Hortonworks HDP
本课程目标是:给大家分享一些在网上不能随便就搜到的内容和窍门,展示企业线上生产系统中应用 Hadoop、Spark 的成功案例,以及与现有企业BI平台整合的方案
第一周:企业级Hadoop/Spark应用概述,Hadoop/Spark生态系统与现有企业级应用的整合
企业级集群部署、数据管理、任务调度、集群监控
Hadoop架构介绍、Spark / Shark 介绍
Spark与Hadoop的关系
现有Hadoop架构的种种问题和限制,HA
企业数据仓库的选型,Hadoop世界与EDW世界中的TPC(TPC DS与TPC H)
Hadoop世界中的DBA
成本考量 —— 人?物?物是人非……
第二周:Hadoop Eco System 进阶应用基础知识
HDFS / MapReduce / Yarn / Hive / Impala / Oozie 进阶应用、资源分配及调优
玩转Hive ETL高级应用:权限管理、external table、partition、中文支持、HiveServer2 JDBC接口
Hive的Windowing and Analytics Functions
Hive 0.13的新功能
Impala与Hive对比,各种Hints:Hive的Map Join,Impala的SHUFFLE Join(partitioned join)
第三周:进阶应用实例 — 物流/广告/电商/零售/互联网行业Hadoop大数据应用
企业级应用实例1:物流行业 — 订单跟踪
—〉 Hive通过external table、partition、动态partition与NFS结合使用创建数据表,避免LOAD DATA
—〉 Hive和Impala的Join优化Hints,MapJoin、Shuffle Join 实例
企业级应用实例2:广告行业 — 基于用户行为分析的用户归类标签 (客户画像)
—〉 Hive复合数据类型array
—〉 array与collect_set、collect_list、array_contains、sort_array
—〉 impala的group_concat
—〉 array与lateral view、LATERAL VIEW OUTER
企业级应用实例3:电商/零售行业 — 简单的推荐系统 Recommender System 实现 (基于用户标签/客户画像)
—〉 Hive复合数据类型map、str_to_map、map_keys、map_values,map与lateral view
—〉 通过Hive、Impala转换函数进行数据保护,确保企业应用信息安全(通过translate进行简单数据脱敏Data Masking)
—〉 HiveServer2 JDBC接口实例应用、中文支持Bug纠错
—〉 Hive的窗口和分析函数入门(row_number、rank、dense_rank等)
企业级应用实例4:互联网行业 — 访问量业绩报表
—〉 Hive的窗口和分析函数进阶(NTILE、CUME_DIST、PERCENT_RANK、LEAD、LAG、FIRST_VALUE、LAST_VALUE等)
—〉 ROWS BETWEEN ... AND ... (CURRENT ROW,rows PRECEDING,rows FOLLOWING)
本周总结 —— 物流/广告/电商/零售/互联网行业Hadoop企业级大数据应用方案经验教训总结
第四周:Hadoop & Spark / Shark 进阶应用基础知识
HBase / ZooKeeper / Sqoop / Graphite / Ganglia 进阶应用及调优,Spark / Spark SQL / Shark 简介
HBase Shell 与 HBase REST API 应用
HBase的Region进阶应用Compact、Split与Merge
HBase进阶脚本应用:jruby script
HBase与Hive的整合高级应用:binary(byte) value,lateral view explode
Hive 0.13:posexplode
Spark / Spark SQL / Shark 架构介绍、Spark Scala / Python 开发介绍
第五周:进阶应用实例 — Hadoop/Spark平台企业级开发框架
Hadoop生态系统中为企业级开发提供的测试框架应用实例
Spark实现“物流行业 — 订单跟踪 SLA”的实例,Scala语言及Python语言实现,Spark SQL + Parquet文件实现,Spark Scala Maven项目实例
HBase开发实例:REST API使用、JRuby脚本编写、Region进阶应用
与Continuous Integration系统整合的可能
—— 软件/互联网行业Hadoop企业级开发框架
第六周:Hadoop & Spark / Shark 企业级应用整合
HBase与Hive整合的大坑
HBase Python 客户端 happybase 使用介绍、编程实例
HBase Coprocessor与HBase + Hive 特征特点比较、分别适用的场景
企业中应用 HBase,Hive,Impala,Spark / Shark 的注意事项,资源分配方案
Hadoop与现有企业级BI平台的整合
Pentaho PDI / Kettle
Oracle or In-Memory Database
MicroStrategy / Tableau
第七周:进阶应用实例 — Hadoop / Spark 企业级大数据BI应用整合
互联网行业时间序列(time series data)数据处理实例 —— 整合 HBase 与 Hive:增量数据与全量数据,冷数据与热数据分治
互联网行业时间序列(time series data)数据处理实例 —— 整合 Spark 与 HBase
Spark 访问 HBase 数据实例:通过 Spark 对 HBase 表进行 scan,Scala语言处理 HBase 返回值 Result 类中 KeyValue 对象的 ByteBuffer / ByteArray
通过 Kettle / Spoon 工具整合Hadoop与现有RDBMS的企业级BI解决方案
其它整合Hadoop与RDBMS构建企业级BI应用平台的可能(如使用PostgreSQL FDW,使用Presto的JDBC connector等)
—— 互联网行业Hadoop企业级大数据BI应用整合方案
第八周:总结与展望
企业级大数据应用总结
构建企业大数据团队探讨
Hadoop方面工作面试秘籍:应用开发方向、数据分析方向、技术架构方向、团队带头人
现有几大Hadoop平台比较:Cloudera CDH,Hortonworks HDP,MapR
Hadoop大数据还能干什么?通过Spark整合Streaming与Batch processing?
金融 / 工业 / 能源 / 智慧城市 / 医疗行业 / Smart Data
德国汽车、新能源行业的大数据创新项目分享
德国医疗行业大数据应用现状
Hadoop大数据企业应用面临的问题


085957h2h43h3gzr0yxgrx.jpg
游客,如果您要查看本帖隐藏内容请回复

sxh 发表于 2016-5-14 14:02:23 | 显示全部楼层
非常好,顶一下
xiuxuan 发表于 2016-5-19 14:45:33 | 显示全部楼层
好帖必须得顶起
世纪之星 发表于 2016-5-20 07:02:39 | 显示全部楼层
LZ是天才,坚定完毕
obeckham 发表于 2016-5-22 22:32:41 来自手机 | 显示全部楼层
LZ帖子不给力,勉强给回复下吧
qazxsw1 发表于 2016-5-23 11:24:43 来自手机 | 显示全部楼层
为保住菊花,这个一定得回复!
yzc164 发表于 2016-5-23 15:23:37 | 显示全部楼层
报告!别开枪,我就是路过来看看的。。。
lingbo2009 发表于 2016-5-24 12:36:39 | 显示全部楼层
佩服佩服!
qqwameng 发表于 2016-5-25 15:22:36 来自手机 | 显示全部楼层
支持,楼下的跟上哈~
abcde7968 发表于 2016-5-28 15:21:34 来自手机 | 显示全部楼层
路过
bygzs 发表于 2016-6-10 07:48:27 来自手机 | 显示全部楼层
鬼泣 发表于 2016-6-12 21:12:44 | 显示全部楼层
LZ是天才,坚定完毕
dengwen3 发表于 2016-6-14 17:02:14 | 显示全部楼层
锄禾日当午,发帖真辛苦。谁知坛中餐,帖帖皆辛苦!
cyrus 发表于 2016-6-14 18:57:11 | 显示全部楼层
为毛老子总也抢不到沙发?!!
menghui 发表于 2016-6-16 07:00:05 来自手机 | 显示全部楼层
路过 帮顶 嘿嘿

Archiver|小黑屋|菜鸟吧论坛 ( 粤ICP备13003268-2号 )

菜鸟吧论坛网站内容全部来自互联网及网友投稿站长整理发布,如果侵犯了您的合法权益,请联系【 admin@cmzy168.com 】我们会尽快处理。

声明:本站严禁任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论!

版本支持:Discuz! X3.4 技术支持:Copyright© 2014-2019 BBS.CMZY168.COM Inc.

GMT+8, 2025-12-18 06:03 , Processed in 0.077106 second(s), 21 queries .

快速回复 返回顶部 返回列表