課程描述INTRODUCTION
數據分析精品課
日程安排SCHEDULE
課程大綱Syllabus
數據分析精品課
培訓重點
1、數據分析實戰
2、數據挖掘理論及核心技術
3、大數據算法原理及案例實現
4、Python應用實戰
日程安排
第一天上午、數據分析實戰
第一講零基礎學Python
講解(jie)Python背景、國內發展狀況、基礎(chu)語法、數據結構(gou)及繪圖操(cao)作等內容。特別針對(dui)向(xiang)量計算這(zhe)塊,著重(zhong)介紹(shao)Python在這(zhe)方(fang)面的優勢及用法。
第二講數據分析方法論
講(jiang)解統計分(fen)(fen)析(xi)基(ji)礎,包括統計學基(ji)本概(gai)念,假設檢驗,置(zhi)信區(qu)間等基(ji)礎,并結合數(shu)據案例說明其使用場景和(he)運用方法。介紹數(shu)據分(fen)(fen)析(xi)流程和(he)常見分(fen)(fen)析(xi)思路,并結合案例進行講(jiang)解。
第三講數據處理技法
從(cong)數(shu)據(ju)(ju)(ju)接入、數(shu)據(ju)(ju)(ju)統(tong)計、數(shu)據(ju)(ju)(ju)轉換等幾(ji)個方面進行講(jiang)(jiang)解(jie)(jie)。數(shu)據(ju)(ju)(ju)接入包(bao)含接入MySQL、Oracle、Hadoop等常(chang)見數(shu)據(ju)(ju)(ju)庫(ku)操作;數(shu)據(ju)(ju)(ju)統(tong)計包(bao)含Pandas包(bao)的(de)具體(ti)用法(fa)和講(jiang)(jiang)解(jie)(jie);數(shu)據(ju)(ju)(ju)轉換包(bao)含對(dui)數(shu)據(ju)(ju)(ju)集的(de)關聯、合并、重塑(su)等操作。此外(wai),針對(dui)海量(liang)數(shu)據(ju)(ju)(ju)的(de)情況(kuang)下(xia),介紹(shao)在Spark平臺上(shang)的(de)數(shu)據(ju)(ju)(ju)處理技術(shu),并結合真實環(huan)境進行操作講(jiang)(jiang)解(jie)(jie)。
第一天下午、數據挖掘理論及核心技術
第四講認識數據挖掘
講(jiang)解數(shu)據(ju)挖掘基(ji)本概(gai)念,細致講(jiang)解業務(wu)理解、數(shu)據(ju)理解、數(shu)據(ju)準備(bei)、建立模型(xing)、模型(xing)評(ping)估、模型(xing)部(bu)署各環節(jie)的(de)工作內(nei)容及相關技術;結合業界經典場景,講(jiang)解數(shu)據(ju)挖掘的(de)實(shi)施流程和方法體系(xi)。
第五講數據挖掘核心技術
細致講解抽樣(yang)、分(fen)區(qu)、樣(yang)本平衡(heng)、特征選擇、訓(xun)練(lian)模型、評估模型等數(shu)據(ju)挖掘核心技(ji)術原理(li),并(bing)結合(he)案例(li)講解其具體實(shi)現和(he)用法(fa)。尤(you)其針對樣(yang)本平衡(heng),重點講解人工合(he)成、代價敏感等算法(fa);針對特征選擇,重點講解特征選擇的核心思路(lu),并(bing)結合(he)Python進(jin)行案例(li)演示。
第二天上午、大數據算法原理及案例實現(1)
第六講特征降維算法及Python實現
降維是大(da)數(shu)據分(fen)析非常重(zhong)要的算(suan)法(fa),它可以(yi)在(zai)降低極少信息量的情況(kuang)(kuang)下,極大(da)地(di)縮小(xiao)數(shu)據規(gui)模。主要講解主成分(fen)、LDA以(yi)及t-SNE原理,并結合案例(li)進(jin)行(xing)Python實(shi)現。特別地(di),針對海量數(shu)據情況(kuang)(kuang)下的應用場景,講解實(shi)現思路和(he)Python案例(li)。
第七講決策樹算法及Python實現
決策樹(shu)是(shi)非常(chang)經(jing)典的算(suan)法,一般常(chang)見于小數(shu)(shu)據的挖掘。由于決策樹(shu)具有極強的可解(jie)釋性,針對海量數(shu)(shu)據仍然(ran)是(shi)非常(chang)重要的實用(yong)價值。主要講解(jie)ID3、C4.5、C5.0以及CART決策樹(shu)算(suan)法的實現(xian)原理,并結合案例進行Python實現(xian)。
第八講好萊塢百萬級影評數據分析與電影推薦實現
實(shi)戰部分:基于好(hao)萊塢百萬級(ji)的(de)(de)(de)影(ying)評數(shu)據,對數(shu)據進行建模(mo)、清(qing)洗、透視表操(cao)作。然后根據用(yong)(yong)戶畫(hua)像分析(xi)不同的(de)(de)(de)用(yong)(yong)戶喜好(hao)通過機器(qi)學習算法(fa)對不同性別、年齡階段的(de)(de)(de)用(yong)(yong)戶進行定制(zhi)化(hua)的(de)(de)(de)電(dian)影(ying)推薦(jian),最(zui)后把(ba)推薦(jian)的(de)(de)(de)電(dian)影(ying)進行可視化(hua)的(de)(de)(de)展示操(cao)作
第二天下午、大數據算法原理及案例實現(2)
第九講因果推理算法及Python實現
大(da)數據分(fen)析技術可以(yi)幫助我(wo)(wo)們去發現(xian)、解(jie)決一些業務(wu)問(wen)題,然(ran)而如何(he)去判斷我(wo)(wo)們的改進是(shi)否生效(xiao),是(shi)否在業務(wu)指(zhi)標上呈現(xian)過一定的因果邏(luo)輯,則是(shi)一個(ge)重(zhong)要問(wen)題和分(fen)析方向。本(ben)節主要介紹因果推理算法,包括(kuo)貝葉斯(si)推理、狀態(tai)空間(jian)模型(xing)以(yi)及CausalImpact工(gong)具等內容,并結合(he)案(an)例進行Python實(shi)現(xian)。
第十講深度學習算法及Python實現
對(dui)(dui)于(yu)大數(shu)據的(de)建模任務(wu),我們可以(yi)基于(yu)深(shen)(shen)度(du)(du)學(xue)(xue)習來實(shi)現,不(bu)僅(jin)能夠針對(dui)(dui)海量(liang)數(shu)據進行建模,其效果(guo)也非常不(bu)錯(cuo)。本節主要講解深(shen)(shen)度(du)(du)學(xue)(xue)習的(de)發(fa)展歷(li)程,DBN、DNN等經典深(shen)(shen)度(du)(du)學(xue)(xue)習算法(fa),深(shen)(shen)度(du)(du)學(xue)(xue)習優化(hua)算法(fa)以(yi)及(ji)一些技巧。同時,介紹(shao)Keras、OpenCV庫的(de)使用方法(fa),并(bing)結合案例進行Python實(shi)現。
第十一講采用OpenCV實現計算機視覺技術
實戰部分:基于OpenCV面部模型,完(wan)成對圖片和(he)視頻的(de)人臉(lian)識別,實戰中會講解OpenCV的(de)重(zhong)要(yao)類和(he)函數。主要(yao)內(nei)容包(bao)括OpenCV庫的(de)安裝和(he)部署、圖像增(zeng)強(qiang)、像素操作(zuo)、圖形分析等各種技術(shu),并(bing)且詳細(xi)介紹了如何(he)處理來(lai)自文件或攝像機(ji)的(de)視頻,以及如何(he)檢測和(he)跟(gen)蹤移(yi)動對象。
第三天上午、Python應用實戰(一)
第十二講 Python自然語言處理原理及案例
目前文檔數據已經(jing)成為(wei)很(hen)多企業重要的(de)資產,通過對文檔數據進(jin)行(xing)解(jie)析(xi)(xi)、建模(mo)(mo)、分(fen)(fen)(fen)析(xi)(xi)、挖(wa)掘、可視化,我們能夠(gou)發現不(bu)一樣(yang)的(de)洞察。本節主要講(jiang)解(jie)自然語言處理基本概念和技法(fa)(fa),包含分(fen)(fen)(fen)詞(ci)、關(guan)鍵字提(ti)取、文摘提(ti)取、文本分(fen)(fen)(fen)類、主題模(mo)(mo)型、word2vec等內容(rong)。介紹在(zai)深度學習的(de)加(jia)持(chi)下,與傳(chuan)統做法(fa)(fa)的(de)區別,并(bing)使用Python進(jin)行(xing)案(an)例講(jiang)解(jie)。
第十三講數據分析圖表及Python案例
數(shu)據(ju)(ju)可(ke)(ke)視化是大(da)數(shu)據(ju)(ju)分析(xi)的(de)(de)(de)重要手段,通(tong)過合理(li)地(di)使(shi)用圖(tu)表(biao),不(bu)僅可(ke)(ke)以簡潔(jie)地(di)表(biao)達(da)數(shu)據(ju)(ju)的(de)(de)(de)含義,高效地(di)發(fa)現(xian)問(wen)題,還可(ke)(ke)以為報告的(de)(de)(de)編寫以及(ji)數(shu)據(ju)(ju)分析(xi)web應用增色不(bu)少。本節主要講解(jie)常(chang)用的(de)(de)(de)數(shu)據(ju)(ju)分析(xi)圖(tu)表(biao)及(ji)其使(shi)用場景,介(jie)紹數(shu)據(ju)(ju)可(ke)(ke)視化的(de)(de)(de)方法論,避免生(sheng)搬硬套的(de)(de)(de)使(shi)用圖(tu)表(biao),針對不(bu)同的(de)(de)(de)業務場景和需求,合理(li)選擇可(ke)(ke)視化方法。介(jie)紹的(de)(de)(de)工具不(bu)限于matplotlib、pycha、pyecharts、ggplot、Bokeh、HoloViews、mpld3、plotly、pygal等常(chang)用可(ke)(ke)視化庫。
第三天下午、Python應用實戰(二)
第十四講使用Notebook編寫數據分析報告
數(shu)(shu)(shu)據分(fen)(fen)(fen)析報告在大(da)數(shu)(shu)(shu)據分(fen)(fen)(fen)析過程(cheng)中具(ju)有重要(yao)(yao)價值,它體(ti)現了大(da)數(shu)(shu)(shu)據分(fen)(fen)(fen)析的(de)(de)目的(de)(de)、過程(cheng)和(he)結果,以及(ji)(ji)對發現問題的(de)(de)解(jie)(jie)讀、改進方(fang)案等(deng)等(deng),本節主(zhu)要(yao)(yao)講解(jie)(jie)使用Notebook編寫數(shu)(shu)(shu)據分(fen)(fen)(fen)析報告的(de)(de)具(ju)體(ti)方(fang)法,以及(ji)(ji)編寫數(shu)(shu)(shu)據分(fen)(fen)(fen)析報告的(de)(de)方(fang)法論,并結合案例(li)講解(jie)(jie)其用法。
第十五講Seaborn可視化開發實戰
Seaborn是一款不錯的可視化框架(jia),它和(he) Pandas一樣是建(jian)立在 Matplotlib 之上的。可以(yi)(yi)基于(yu)Seaborn快速開發(fa)一個輕(qing)(qing)量級的數據(ju)(ju)分析web應用。在網頁中(zhong)嵌(qian)入圖(tu)表、數據(ju)(ju)以(yi)(yi)及分析的算法(fa),非常適(shi)合打造企業內(nei)部(bu)的敏(min)捷數據(ju)(ju)分析工具(ju)集。本(ben)節主要(yao)介紹Pie、Scatter、Radar等等各種可視化解(jie)決方案,同時講解(jie)一個用Seaborn實(shi)(shi)現(xian)數據(ju)(ju)分析功能(neng)(兼圖(tu)表)的實(shi)(shi)際案例,搭建(jian)服務器,在企業內(nei)部(bu)實(shi)(shi)現(xian)輕(qing)(qing)量級數據(ju)(ju)分析應用。
授課專家
劉老師 10多(duo)年的(de)IT領(ling)(ling)域相(xiang)關技術研(yan)究和(he)(he)(he)(he)項(xiang)(xiang)(xiang)目(mu)開發工(gong)作(zuo),在長期(qi)軟件(jian)領(ling)(ling)域工(gong)作(zuo)過程(cheng)(cheng)中,對(dui)軟件(jian)企業(ye)運作(zuo)模式(shi)有深入研(yan)究,熟悉軟件(jian)質量保障標準(zhun)ISO9003和(he)(he)(he)(he)軟件(jian)過程(cheng)(cheng)改進(jin)模型CMM/CMMI,在具(ju)體(ti)項(xiang)(xiang)(xiang)目(mu)實(shi)施過程(cheng)(cheng)中總結經驗,有深刻認識。通曉多(duo)種軟件(jian)設計(ji)和(he)(he)(he)(he)開發工(gong)具(ju)。對(dui)軟件(jian)開發整(zheng)個流(liu)程(cheng)(cheng)非(fei)常熟悉,能(neng)(neng)(neng)根據項(xiang)(xiang)(xiang)目(mu)特點定制具(ju)體(ti)軟件(jian)過程(cheng)(cheng),并(bing)進(jin)行(xing)項(xiang)(xiang)(xiang)目(mu)管理和(he)(he)(he)(he)監(jian)控,有很強的(de)軟件(jian)項(xiang)(xiang)(xiang)目(mu)組織管理能(neng)(neng)(neng)力。對(dui)C/C++ 、HTML 5、python、Hadoop、java、java EE、android、IOS、大數據、云計(ji)算(suan)有比較(jiao)深入的(de)理解(jie)和(he)(he)(he)(he)應(ying)用,具(ju)有較(jiao)強的(de)移動互聯網應(ying)用需(xu)求分析和(he)(he)(he)(he)系統設計(ji)能(neng)(neng)(neng)力,熟悉Android框架(jia)、IOS框架(jia)等技術,了解(jie)各種設計(ji)模式(shi),能(neng)(neng)(neng)在具(ju)體(ti)項(xiang)(xiang)(xiang)目(mu)中靈活運用。
數據分析精品課
轉載://citymember.cn/gkk_detail/246386.html
已開課時間(jian)Have start time
IT相關內訓
- IT崗位數智化能力提升路徑 甄文智
- 大模型技術與應用培訓 葉梓
- Fine BI 數據分析與 張曉如
- 云計算的應用領域和實踐 武(wu)威
- Python高效辦公自動化 張曉如
- 網安管理崗培訓 張勝生
- 互聯網新技術在銀行的應用 武威
- 信息安全風險評估與加固技能 張(zhang)勝生
- 軟件安全意識加強與技能提高 張勝生
- 滲透測試與攻防實戰高級課程 張勝生
- CISSP認證培訓課程 張勝生
- 電力信息化:價值和建設分析 劉宇佳