課(ke)程(cheng)描述INTRODUCTION
Hadoop大數據平臺課程培訓
日程安排SCHEDULE
課(ke)程大綱Syllabus
Hadoop大數據平臺課程培訓
【課程背景】
數(shu)(shu)(shu)字(zi)化浪潮是(shi)(shi)人(ren)類正在(zai)經歷的第五次(ci)信息革命。數(shu)(shu)(shu)字(zi)化一方面使(shi)得信息的搜集、存(cun)儲、處理(li)(li)、分(fen)發具有(you)了前所未有(you)的效率(lv);另(ling)一方面,使(shi)得信息從其附著物上(shang)分(fen)離出來(lai),得以獨立于實(shi)物、空間(jian)和(he)時間(jian)而存(cun)在(zai)。數(shu)(shu)(shu)字(zi)化是(shi)(shi)大(da)(da)數(shu)(shu)(shu)據的根本(ben)(ben)(ben)(ben)。大(da)(da)數(shu)(shu)(shu)據的本(ben)(ben)(ben)(ben)質是(shi)(shi)對事物規律的深(shen)刻(ke)洞(dong)察。學習(xi)大(da)(da)數(shu)(shu)(shu)據需(xu)要(yao)掌握其特征描述,包(bao)括(kuo)大(da)(da)數(shu)(shu)(shu)據的技(ji)術特征和(he)大(da)(da)數(shu)(shu)(shu)據的價(jia)值邏輯。本(ben)(ben)(ben)(ben)次(ci)課(ke)程(cheng)授(shou)課(ke)范圍為大(da)(da)數(shu)(shu)(shu)據的技(ji)術特征。本(ben)(ben)(ben)(ben)課(ke)程(cheng)分(fen)為理(li)(li)論和(he)實(shi)踐兩部分(fen)。理(li)(li)論部分(fen)主(zhu)要(yao)帶學員了解大(da)(da)數(shu)(shu)(shu)據的基本(ben)(ben)(ben)(ben)概念和(he)關鍵技(ji)術,介紹(shao)(shao)當前大(da)(da)數(shu)(shu)(shu)據平臺的基本(ben)(ben)(ben)(ben)架構,重點介紹(shao)(shao)Hadoop生態系統框架及(ji)其HDFS、YARN、MapReduce2.0、Hbase、Zookeeper等組件的原理(li)(li)及(ji)應用(yong)。帶學員了解Hadoop大(da)(da)數(shu)(shu)(shu)據平臺的運維,幫助學員建(jian)(jian)立完整的大(da)(da)數(shu)(shu)(shu)據認知體系。實(shi)踐課(ke)程(cheng)為Hadoop實(shi)驗課(ke)程(cheng)。帶領學員動手搭(da)建(jian)(jian)Hadoop環境(jing),完成Spark計算框架的搭(da)建(jian)(jian),完成XXX和(he)XXX兩個操作實(shi)驗。
【課程特點】
授課形式:理論講解+動手實驗
時間安排:系統學習1天(6小時)
理(li)論(lun)講(jiang)解(jie)(jie)與動手(shou)實驗相結合(he)。其中理(li)論(lun)講(jiang)解(jie)(jie)占(zhan)50%,動手(shou)實驗占(zhan)50%。
【課程收益】
1.了解大數據的基本概念、發展歷程、主流技術和應用場景等。通過分析大數據平臺在建設、生產和運維過程中出現的問題,幫助學員逐步形成解決問題的思路。
2.通過實驗課程掌握(wo)Hadoop生態(tai)系統基(ji)本組件(jian)的運(yun)用(yong)。學(xue)會使用(yong)MapReduce和Spark計算框架解決實際(ji)問題。
【受眾對象】
1.云計算和電信行業領域的技術人員、管理人員、政企客戶經理、產品經理、項目經理
2.管理支持組織中數據中心運行、規劃、設計負責人
3.希望提升自身職業能力的人員、其他對大(da)數據(ju)技術(shu)感興趣的人員
【課程內容】
一.大數據基本概念及關鍵技術
1.大數據的基本概念
●信息革命與數字化浪潮
●大數據的產生背景定義和特征
●大數據與云計算的關系
●大數據的影響
●大數據在行業的價值體現
2.大數據的關鍵技術
●傳統架構的局限性
●大數據理論基礎
●大數據總體架構和關鍵技術
●大數據匯聚
●大數據處理
●大數據分析
●大數據展現
●大數據開放
二.大數據平臺架構
1.大數據平臺詳細架構
●大數據平臺功能邏輯架構
●Hadoop集群架構
●MPP集群架構
●流處理+內存數據庫架構
●大數據平臺數據流程
●大數據平臺的管理
●大數據平臺能力開放
2.行業大數據平臺
●某運營商大數據平臺
●某銀行大數據平臺
●某(mou)互聯網(wang)公司大數據平臺
三.Hadoop生態系統
1.初識Hadoop
●Hadoop生態系統
●Hadoop歷史版本變遷介紹
●Hadoop基本組件
2.Hadoop三大組件的原理
●分布式文件系統原理
●HDFS原理
●HDFS讀寫過程
●MapReduce基本原理
●MapReduce框架
●Wordcount案例
●MapReduce內部邏輯
●資源管理系統YARN
●YARN的作用
●YARN的基本原理
3.Hadoop生態系統
●Hadoop1.0~Hadoop3.0演進歷史
●Hive和Pig優劣勢
●Mahout工具
●Hbase原理
●Hbase數據模型
●Hbase物理模型
●ZooKeeper
●Sqoop
●Flume
四.Hadoop平臺運維
1.Hadoop平臺運維
●自動擴縮容
●資源監控
●資源分配管理
●權限管理
●平臺容災
2.Hadoop平臺運維案例
●Hadoop集群訪問安全控制
●Hadoop存儲共享計算隔離設計
●實時查詢庫Hbase多實例
●Flume集群高可用
●HDFS磁盤檢查機制(zhi)優化
五.動手實驗
1)Hadoop安裝
●Hadoop安裝-獲取linux操作系統
●Hadoop安裝-安裝JDK
●Hadoop安裝-配置hadoop
2)Hadoop的核心-HDFS簡介
●數據管理策略
●HDFS特點
●HDFS文件讀寫操作
3)Hadoop的核心-MapReduce原理與實現
●MapReduce的原理
●MapReduce的運行流程
●實驗一:WordCount單詞計數實例
●分片輸入—Map—Shuffle—Reduce過程總結
4)開發Hadoop應用程序
●相似度算法
●基于物品的推薦算法原理
●基于物品的推薦算法實戰
●實驗總結
補充章節 人工智能
1)未來已來
2)人工智能概念和應用
3)機器學習原理
4)云計算和大數據驅動深度學習
5)機器學習平臺架構
Hadoop大數據平臺課程培訓
轉載://citymember.cn/gkk_detail/36883.html
已開課時間Have start time
- 唐杰
大數據課程內訓
- 《流量神器,銷量升級:如何 武建偉
- 企業區塊鏈技術的應用場景與 李璐
- 《銀行--網絡消費行為與網 武建偉
- 《精細運營——京東/天貓平 武建(jian)偉
- 建材門店--微信獲客與運營 武建偉
- 能源電力企業數字化轉型探索 李開東(dong)
- 數據創造價值——大數據分析 張曉(xiao)如
- 《大數據精益化營銷思維與運 喻國慶
- 大數據項目解決方案及應用 胡(hu)國慶(qing)
- 大數據提升:用戶體驗提升與 武建(jian)偉
- 數據驅動價值 ——基于Ex 張曉(xiao)如
- 《大數據分析與客戶開發》 喻國慶(qing)