課程描述INTRODUCTION
數據挖掘與大數據技術
日程安排(pai)SCHEDULE
課程大綱Syllabus
數據挖掘與大數據技術
課程簡介:
本(ben)次課程將(jiang)介紹數(shu)(shu)據(ju)(ju)挖(wa)掘(jue)(jue)與(yu)大數(shu)(shu)據(ju)(ju)技(ji)術的(de)基本(ben)理論和體(ti)系(xi)架構(gou),通過大型數(shu)(shu)據(ju)(ju)挖(wa)掘(jue)(jue)和大數(shu)(shu)據(ju)(ju)處(chu)理項目(mu)案例(li)闡述(shu)數(shu)(shu)據(ju)(ju)挖(wa)掘(jue)(jue)和大數(shu)(shu)據(ju)(ju)項目(mu)的(de)實(shi)施過程和方法。通過實(shi)際應用案例(li)講解(jie)數(shu)(shu)據(ju)(ju)清洗、數(shu)(shu)據(ju)(ju)預處(chu)理、數(shu)(shu)據(ju)(ju)挖(wa)掘(jue)(jue)算法等(deng)重要概念。詳細講解(jie)構(gou)建(jian)數(shu)(shu)據(ju)(ju)挖(wa)掘(jue)(jue)體(ti)系(xi)的(de)核心方法和技(ji)術,并結合(he)實(shi)際項目(mu)搭建(jian)數(shu)(shu)據(ju)(ju)挖(wa)掘(jue)(jue)環(huan)境(jing)。熟(shu)悉主(zhu)流數(shu)(shu)據(ju)(ju)挖(wa)掘(jue)(jue)廠商(shang)及相關軟件產品(pin)的(de)操作和使用。
課程特點:
1、 培訓過程中將以大型項目案例為背景,逐步講解整個數據挖掘的設計過程和實施方法
2、 課程將以深入淺出的案例讓學員輕松掌握數據挖掘相關概念和技術
3、 課程的重點是項目實施,將深入探討數據挖掘項目的實施問題,逐一解決項目實施過程中所遇到的問題和處理技巧
4、 結合動手實(shi)(shi)驗和(he)小而(er)精(jing)的例子,使(shi)學員充分理(li)解數據(ju)挖掘架(jia)構設計(ji)和(he)相關(guan)實(shi)(shi)施工具的使(shi)用
課程大綱:
專題一:數據挖掘基礎知識
內容一:數據挖掘基本概念
1、 數據挖掘的來源
2、 數據挖掘的定義
3、 數據挖掘的應用領域
4、 數據挖掘的行業背景
內容二:BI的架構
1、BI體系介紹
2、數據倉庫介紹
3、ETL介紹
4、多維數據庫介紹
5、前端展現介紹
6、數據挖掘模型介紹
內容三、數據挖掘在行業中的應用
1、現代企業數據挖掘需求概述
2、電信行業案例分析
3、金融行業案例研究
4、銷售行業案例分析
5、BI系統數據更新與維護
介(jie)紹數據挖(wa)掘(jue)基本(ben)概(gai)念,BI體系架構, 數據挖(wa)掘(jue)工具介(jie)紹及其應用,針對(dui)電(dian)信(xin)等行業(ye)提供行業(ye)解決方案和案例分析(xi)。
專題二:數據挖掘架構設計與完整流程詳解
內容一:九種數據挖掘算法
1、 九種挖掘算法應用的背景
2、 決策樹算法與模型設計
3、 聚類算法與模型設計
4、 關聯規則算法與模型設計
5、 貝葉斯算法與模型設計
6、 時間序列算法與模型設計
7、 其他挖掘算法與模型設計
內容二:常用挖掘模型詳解
1、決策樹算法詳解及工具實現
2、聚類算法詳解及工具實現
3、關聯規則算法詳解及工具實現
4、貝葉斯算法詳解及工具實現
5、時間序列算法詳解及工具實現
6、數據挖掘模型評估
內容三:數據挖掘的流程
1、數據清洗準備
2、數據預處理
3、選擇數據挖掘模型
4、數據挖掘模型訓練
5、更新算法模型
6、模型評估
7、部署與應用
內容四:DMX語言
1、DMX語法結構
2、使用DMX創建挖掘模型
3、使用DMX將挖掘結果導出
4、使用DMX進行挖掘模型參數設置
九種數(shu)據挖掘(jue)算(suan)法與模型詳(xiang)解,數(shu)據挖掘(jue)的(de)設計與實施流程,數(shu)據挖掘(jue)查詢語(yu)言的(de)使用等,重點(dian)對決策樹算(suan)法、關聯規(gui)則算(suan)法、聚(ju)類算(suan)法等給(gei)出詳(xiang)細設計和(he)處理(li)流程。
專題三:大數據處理優化部分
內容一:大數據的特點
1、什么是大數據
2、大數據的特點
3、大數據在行業中的應用
內容二:大數據優化方法詳解
1、大數據分區處理
2、使用中間表和臨時表
3、分批次處理與并行計算
4、建立廣泛的索引
5、建立緩存機制
6、使用文本和二進制格式進行處理
7、定制強大的清洗規則和出錯處理機制
8、建立視圖或者物化視圖
9、其他優化方法總結
內容三:數據倉庫中大數據的處理方式
1、數據倉庫中的大數據特點
2、數據倉庫中的大數據的處理方式
3、分布式數據倉庫的特點及應用
內容四:大數據高級應用
1、大型項目中大數據的優化案例分析
2、使用大數據優化工具
3、數據倉庫中的大數據性能調優技巧
4、未來大數據的發展方向
大(da)(da)數(shu)據(ju)的(de)(de)概念、特點以及(ji)(ji)大(da)(da)數(shu)據(ju)的(de)(de)優(you)化方法,數(shu)據(ju)倉庫項目(mu)中大(da)(da)數(shu)據(ju)的(de)(de)處理方式以及(ji)(ji)大(da)(da)數(shu)據(ju)的(de)(de)高級(ji)應(ying)用等,針對大(da)(da)型數(shu)據(ju)倉庫項目(mu)提供(gong)了完備的(de)(de)大(da)(da)數(shu)據(ju)優(you)化解決方案。
專題四:數據挖掘與大數據項目案例分析
內容一:中國電信數據挖掘項目
1、項目介紹
2、復雜多系統多數據源的特點
3、ODS的使用
4、整體項目架構設計
5、數據挖掘算法選取
6、數據挖掘模型設計
7、數據挖掘處理流程
8、數據抽取策略的制定
8、挖掘模型的更新技巧
內容二:Search Funnel數據挖掘項目
1、項目介紹
2、項目中的海量數據
3、數據挖掘算法
4、數據挖掘模型構建
5、數據的預處理技術
6、對挖掘模型進行訓練
7、展示數據挖掘模型結果
8、數據挖掘模型評估
內容三:MSN大數據處理項目
1、項目介紹
2、項目中的超海量數據
3、大數據處理所遇到的問題
4、使用并行處理和計算
5、大數據項目中的數據挖掘模型處理
6、項目中的報表展現
7、大數據處理思路總結
內容四:AdventureWorks整體項目案例
1、案例介紹
2、ETL流程詳解
3、OLAP流程詳解
4、前端報表流程詳解
5、數(shu)據挖掘(jue)流(liu)程詳解(jie)
總結
大型(xing)數(shu)(shu)據(ju)倉(cang)庫(ku)與數(shu)(shu)據(ju)挖掘(jue)項(xiang)目設(she)計(ji)和(he)(he)實施,重點對項(xiang)目架(jia)構設(she)計(ji)和(he)(he)數(shu)(shu)據(ju)完整(zheng)處(chu)理(li)(li)流程(cheng)做(zuo)重點分析(xi)和(he)(he)詳細介(jie)紹,針對大型(xing)數(shu)(shu)據(ju)挖掘(jue)項(xiang)目,提供了完備(bei)的解(jie)決方案,給(gei)出完整(zheng)設(she)計(ji)思(si)路和(he)(he)數(shu)(shu)據(ju)處(chu)理(li)(li)技(ji)術應用。
數據挖掘與大數據技術
轉載://citymember.cn/gkk_detail/257420.html
已開課(ke)時(shi)間(jian)Have start time
- 張曉誠
大數據營銷內訓
- 建材門店--微信獲客與運營 武建(jian)偉
- 《大數據精益化營銷思維與運 喻國慶
- 《精細運營——京東/天貓平 武建(jian)偉
- 《流量神器,銷量升級:如何 武(wu)建(jian)偉
- 企業區塊鏈技術的應用場景與 李璐
- 數據驅動價值 ——基于Ex 張曉如
- 《銀行--網絡消費行為與網 武建偉
- 大數據提升:用戶體驗提升與 武建偉
- 能源電力企業數字化轉型探索 李開東
- 《大數據分析與客戶開發》 喻國慶
- 數據創造價值——大數據分析 張曉如
- 大數據項目解決方案及應用 胡(hu)國(guo)慶