課(ke)程描(miao)述INTRODUCTION
大數據培訓:Hadoop應用與開發高級工程師
日程安排SCHEDULE
課程(cheng)大綱Syllabus
模塊一大數據介紹帶來的機遇和挑戰
1)大數據概念的發展與解析
2)大數據在國內外發展現狀
3)大數據在互聯網發展現狀
4)大數據四個特點分析
大數據帶來的機遇和挑戰
1)大數據能帶來什么、引領社會進入“大數據時代”
2)大數據對國家、社會的作用、大數據將推動經濟發展
3)大數據將推動科技發展進程、開啟商業智能新階段
4)數據分析的發展——從數據到知識大數據如何讓商業更智能、大數據應用案例
5)帶來數據處理新變革、大數據的關鍵技術
6)大數據與云計算、大數據技術的發展趨勢精彩案例
電信手機上網日志分析
移動GPRS上網日志查詢系統
某省份聯通網絡不良信息檢測系統
國土資源部門下屬單位非結構離線網格分析平臺
某銀行海量數據統一分析平臺
某電信用戶屬性精分系統
某銀行實時計算平臺
某電力(li)電臺(tai)電視節目推薦系統(tong)
模塊二Hadoop在云計算技術的作用和地位傳統大規模系統存在的問題
Hadoop概述
Hadoop分布式文件系統
MapRedce工作原理
Hadoop集群剖析
Hadoop生態系統對一種新的解決方案的需求
Hadoop的行業應用案例分析
Hadoop在云計算和大數據的位置和關系數據開放,數據云服務平臺(DAAS)時代
Hadoop平臺在數據云平臺(DAAS)上的天然優勢。
數據云平臺(DAAS平臺)組成部分
互聯網公共數據大云(DAAS)案例
Hadoop構(gou)(gou)建構(gou)(gou)建游戲云(WebGameDaas)平(ping)臺
模塊三Hadoop生態系統介紹和演示HadoopHDFS和MapRedce
Hadoop數據庫之Hbase
Hadoop數據倉庫之Hive
Hadoop數據處理腳本Pig
Hadoop數據接口Sqoop和Flme,ScribeDataX
Hadoop工作流引擎Oozie運用Hadoop自下而上構建大規模企業數據倉庫
暴風影音數據倉庫(ku)實戰解析
模塊四Hadoop組件詳解HadoopHDFS基本結構
HadoopHDFS副本存放策略
HadoopNameNode詳解
HadoopSecondaryNameNode詳解
HadoopDataNode詳解
HadoopJobTracker詳解
HadoopTaskTracker詳解HadoopMapper類核心代碼
HadoopRedce類核心代碼
Hadoop核心代(dai)碼
模塊五Hadoop安裝和部署Hadoop系統模塊組件概述
Hadoop試驗集群的部署結構
Hadoop安裝依賴關系
Hadoop生產環境的部署結構
Hadoop集群部署
Hadoop高可用配置方法
Hadoop集群簡單測試方法
Hadoop集群異常Debg方法Hadoop安裝部署實驗
RedhatLinx基礎環境搭建
Hadoop單機系統版本安裝配置
Hadoop集群系統版本安裝和啟動配置
使用HadoopMapRedceStreaming快速測試系統
Hadoopcore-site,hdfs-site,mapred-site配置詳(xiang)解
模塊六Hadoop集群規劃Hadoop集群內存要求
Hadoop集群磁盤分區
集群和網絡拓撲要求
集(ji)群軟件的端口配置針對NameNodeJobtrackerDataNodeTaskTrackerHiveserver等不(bu)同組件需(xu)求(qiu)推(tui)薦服(fu)務器配置
模塊七MapRedce算法原理HadoopMapRedce算法的原理和優化思想
靈活運用MapRedce實現算法運用MapRedce構建數據庫算法
SelectSortGrogBySmCont
Join新進流失算法
使用Y-Smart快速轉換SQL為(wei)MapRedce代碼
模塊八編寫MapRedce高級程序使用HadoopMapRedceStreaming編程
MapRedce流程
剖析一個MapRedce程序
基本MapRedceAPI概念
驅動代碼Mapper、Redcer
Hadoop流
API使用Eclipse進行快速開發
新MapRedceAPI
MapRedce的優化
MapRedce的任務調度
MapRedce編程實戰
如何利用其他Hadoop相關技術,包括ApacheHive,ApachePig,Sqoop和Oozie等
滿足解決實際數據分析問題的高級HadoopAPIHadoopStreaming和JavaMapRedceApi差異。
MapRedce實現數據庫功能
利用Combiners來減少中間數據
編寫Partitioner來優化負載平衡
直接訪問Hadoop分布式文件系統(HDFS)
Hadoop的join操作
輔助排序在Redcer方的合并
定制Writables和WritableComparables
使用SeqenceFiles和Avro文件保存二進制數據
創建InptFormatsOtptFormats
Hadoop的二次排序
Hadoop的海量日志分析
在Map方的合并
模塊九集成Hadoop到現有工作流
及HadoopAPI深入探討存儲系統
利用Sqoop從關系型數據庫系統中導入數據到Hadoop
利用Flme導入實時數據到Hadoop
ToolRnner介紹、使用MRnit進行測試
使用Configre和Close方法來進行Map/Redce設置和關閉使用FseDFS和Hadoop訪問HDFS
使用分布式緩存(DistribtedCache)
直接訪問Hadoop分布式文件系統(HDFS)
利用Combiners來減少中間數據
編(bian)寫Partitioner來(lai)優化(hua)負(fu)載平衡
模塊十使用Hive和Pig開發及技巧Hive和Pig基礎
Hive的作用和原理說明
Hadoop倉庫和傳統數據倉庫的協作關系
Hadoop/Hive倉庫數據數據流
Hive部署和安裝
HiveCli的基本用法
HQL基本語法
運用Pig過濾用戶數據使用JDBC連接Hive進行查詢和分析
使用正則表達式加載數據
HQL高級語法
編寫DF函數
編寫DAF自定義函數
基于Hive腳本內嵌Streaming編程
模塊十一Hbase安裝和使用Hbase安裝部署
Hbase原理和結構
Hbase運維和管理使用Hbase+Hive提供OLAPSQL查詢能力
使用Hbase+Phoenix提供OLTPSQL能力
基(ji)于Hbase的時間序列數據庫OpenTsDb結構解析
模塊十二Hadoop2.0集群探索Hadoop2.0HDFS原理
Hadoop2.0Yarn原理
Hadoop2.0生態(tai)系(xi)統(tong)基于Hadoop2.0構建(jian)分布(bu)式(shi)系(xi)統(tong)
模塊十三Hadoop企業級別案例解析Hadoop結構化數據案例
Hadoop非結構化案例
Hbase數據庫案例
Hadoop視頻分析案例利用大數據分析改進交通管理
區域醫療大數據應用案例
銀聯大數據數據票據詳單平臺
某銀行大數據Spark應用案例詳解
某證券公司大數據案例介紹
廣東移動省公司請賬單系統
上海電信網絡優化
某通信運營商全國用戶上網記錄
浙江臺州市智能交通系統
移動廣州詳單實時查詢系統
跨區域實時視頻監控系統
電信大數據案例介紹:
基于社交網絡的*營銷和客戶維系
基于信令分析用戶的移動軌跡
基站規劃和動態優化
智慧城市交通
流量分析
上(shang)海(hai)聯(lian)通大數據(ju)開放變現(xian)的實(shi)現(xian)案例(li)介紹
模塊十四RedHadoop企業版本運用RedHadoop快速構建服務集群
運用RedHadoopDW構建數據倉庫基于RedHadoopHive構建數據倉庫平臺
靈活運用Hive加速游戲數據倉庫
基于Pig+OpenCV大規模(mo)圖像人臉識(shi)別(bie)
模塊十五Spark原理和入門Spark原理;Spark的架構圖;Spark運行模式介紹
—local;—standalone;—messos;—yarn;Spark的RDD
什么是RDD;RDD的種類;—Tranformation;—Action
Spark的存儲級別;Cache介紹;Spark的容錯原理
Lineage容錯;Checkpoint容錯;RDD的創建
案(an)例—統計單詞的個數
模塊十六互聯網大數據應用案例根阿里的ODPS大數據平臺架構介紹
阿里的實時推薦架構
阿里的交叉營銷系統
阿里支付寶交易監控系統
支付寶微貸案例分析(互聯網征信系統)
京東打白條系統分析
百度預測大數據(ju)平臺案例分(fen)析
大數據培訓:Hadoop應用與開發高級工程師
轉載://citymember.cn/gkk_detail/23553.html
已開(kai)課時間Have start time
大數據課程內訓
- 《銀行--網絡消費行為與網 武建偉
- 《大數據分析與客戶開發》 喻國慶
- 數據創造價值——大數據分析 張(zhang)曉如
- 《精細運營——京東/天貓平 武建偉(wei)
- 大數據提升:用戶體驗提升與 武(wu)建偉
- 數據驅動價值 ——基于Ex 張曉如
- 大數據項目解決方案及應用 胡國(guo)慶
- 建材門店--微信獲客與運營 武建偉
- 互聯網大數據分析管理 孫平(ping)
- 《大數據精益化營銷思維與運 喻國慶
- 能源電力企業數字化轉型探索 李開東
- 《流量神器,銷量升級:如何 武建偉