課程描(miao)述INTRODUCTION
日(ri)程(cheng)安排SCHEDULE
課程大(da)綱Syllabus
數據分析實戰公開課
一、培訓重點
1.數據分析實戰
2.數據挖掘理論及核心技術
3.大數據算法原理及案例實現
4.Python應用實戰
5.ChatGPT職場賦能
二、培訓特色
1.理論與實踐相結合、案例分析與行業應用穿插進行;
2.專家精彩內容解析、學員專題討論、分組研究;
3.通過全面(mian)知識理解、專題(ti)技(ji)能和實踐(jian)結(jie)合的授課方式(shi)。
三、日程安排
第一天
上午數據分析實戰第一講 零基礎學Python
講解Python背景、國內發展狀況、基礎語法、數據結構及繪圖操作等內容。特別針對向量計算這塊,著重介紹Python在這方面的優勢及用法。
第二講 數據分析方法論
講解統計分析基礎,包括統計學基本概念,假設檢驗,置信區間等基礎,并結合數據案例說明其使用場景和運用方法。介紹數據分析流程和常見分析思路,并結合案例進行講解。
第三講 數據處理技法
從數(shu)(shu)(shu)據(ju)接(jie)(jie)入(ru)、數(shu)(shu)(shu)據(ju)統計、數(shu)(shu)(shu)據(ju)轉(zhuan)換等幾個方面進(jin)行講(jiang)(jiang)解(jie)。數(shu)(shu)(shu)據(ju)接(jie)(jie)入(ru)包(bao)含(han)接(jie)(jie)入(ru)MySQL、Oracle、Hadoop等常見數(shu)(shu)(shu)據(ju)庫操作(zuo);數(shu)(shu)(shu)據(ju)統計包(bao)含(han)Pandas包(bao)的(de)具體用法(fa)和講(jiang)(jiang)解(jie);數(shu)(shu)(shu)據(ju)轉(zhuan)換包(bao)含(han)對數(shu)(shu)(shu)據(ju)集的(de)關聯(lian)、合并(bing)(bing)、重(zhong)塑等操作(zuo)。此(ci)外,針對海(hai)量數(shu)(shu)(shu)據(ju)的(de)情況下,介紹在(zai)Spark平臺上的(de)數(shu)(shu)(shu)據(ju)處理技術,并(bing)(bing)結合真實環(huan)境進(jin)行操作(zuo)講(jiang)(jiang)解(jie)。
第一天
下午數據挖掘理論及核心技術第四講 認識數據挖掘
講解數據挖掘基本概念,細致講解業務理解、數據理解、數據準備、建立模型、模型評估、模型部署各環節的工作內容及相關技術;結合業界經典場景,講解數據挖掘的實施流程和方法體系。
第五講 數據挖掘核心技術
細致講(jiang)解(jie)抽樣(yang)、分(fen)區、樣(yang)本平衡、特征選(xuan)擇(ze)、訓練模型、評估模型等數據挖掘(jue)核心技術原理,并結合案(an)例講(jiang)解(jie)其具(ju)體實(shi)現和用(yong)法。尤其針(zhen)對樣(yang)本平衡,重點講(jiang)解(jie)人工合成、代價敏感等算法;針(zhen)對特征選(xuan)擇(ze),重點講(jiang)解(jie)特征選(xuan)擇(ze)的(de)核心思路(lu),并結合Python進行(xing)案(an)例演示。
第二天
上午大數據算法原理及案例實現(1)
第六講 特征降維算法及Python實現
降維是大數據分析非常重要的算法,它可以在降低極少信息量的情況下,極大地縮小數據規模。主要講解主成分、LDA以及t-SNE原理,并結合案例進行Python實現。特別地,針對海量數據情況下的應用場景,講解實現思路和Python案例。
第七講 決策樹算法及Python實現
決策樹是非常經典的算法,一般常見于小數據的挖掘。由于決策樹具有極強的可解釋性,針對海量數據仍然是非常重要的實用價值。主要講解ID3、C4.5、C5.0以及CART決策樹算法的實現原理,并結合案例進行Python實現。
第八講 好萊塢百萬級影評數據分析與電影推薦實現
實戰部分(fen):基于好(hao)萊(lai)塢(wu)百萬級的影(ying)評數據(ju),對數據(ju)進行建(jian)模(mo)、清洗、透視(shi)表操(cao)作。然后根據(ju)用(yong)戶(hu)(hu)畫像(xiang)分(fen)析不(bu)同(tong)(tong)的用(yong)戶(hu)(hu)喜好(hao)通過機器學(xue)習(xi)算(suan)法對不(bu)同(tong)(tong)性別、年(nian)齡階(jie)段(duan)的用(yong)戶(hu)(hu)進行定(ding)制化的電(dian)(dian)影(ying)推薦(jian),最(zui)后把(ba)推薦(jian)的電(dian)(dian)影(ying)進行可視(shi)化的展(zhan)示操(cao)作
第二天
下午大數據算法原理及案例實現(2)
第九講 因果推理算法及Python實現
大數據分析技術可以幫助我們去發現、解決一些業務問題,然而如何去判斷我們的改進是否生效,是否在業務指標上呈現過一定的因果邏輯,則是一個重要問題和分析方向。本節主要介紹因果推理算法,包括貝葉斯推理、狀態空間模型以及CausalImpact工具等內容,并結合案例進行Python實現。
第十講 深度學習算法及Python實現
對于大數據的建模任務,我們可以基于深度學習來實現,不僅能夠針對海量數據進行建模,其效果也非常不錯。本節主要講解深度學習的發展歷程,DBN、DNN等經典深度學習算法,深度學習優化算法以及一些技巧。同時,介紹Keras、OpenCV庫的使用方法,并結合案例進行Python實現。
第十一講 采用YOLO實現計算機視覺技術
實戰部分:基(ji)于YOLO面部模型,完成對圖(tu)(tu)片和視頻(pin)的人臉識別,實戰中會講解YOLO的重要類(lei)和函數。主(zhu)要內(nei)容包括YOLO庫的安裝(zhuang)和部署、圖(tu)(tu)像增強、像素(su)操(cao)作、圖(tu)(tu)形分析等各種技術,并且(qie)詳細介紹了如(ru)(ru)何處理來自(zi)文件或攝像機的視頻(pin),以及(ji)如(ru)(ru)何檢(jian)測和跟蹤(zong)移動對象(xiang)。
第三天
上午Python可視化應用實戰第十二講 數據分析圖表及Python案例
數據可視化是大數據分析的重要手段,通過合理地使用圖表,不僅可以簡潔地表達數據的含義,高效地發現問題,還可以為報告的編寫以及數據分析web應用增色不少。本節主要講解常用的數據分析圖表及其使用場景,介紹數據可視化的方法論,避免生搬硬套的使用圖表,針對不同的業務場景和需求,合理選擇可視化方法。介紹的工具不限于matplotlib、pycha、pyecharts、ggplot、Bokeh、HoloViews、mpld3、plotly、pygal等常用可視化庫。
第十四講 使用Notebook編寫數據分析報告
數據分析報告在大數據分析過程中具有重要價值,它體現了大數據分析的目的、過程和結果,以及對發現問題的解讀、改進方案等等,本節主要講解使用Notebook編寫數據分析報告的具體方法,以及編寫數據分析報告的方法論,并結合案例講解其用法。
第十五講 Seaborn可視化開發實戰
Seaborn是一款不錯的(de)(de)可視(shi)化框架,它和 Pandas一樣是建立在 Matplotlib 之上(shang)的(de)(de)。可以(yi)基于Seaborn快(kuai)速開發一個輕量(liang)(liang)級(ji)的(de)(de)數據(ju)分(fen)析(xi)(xi)web應用(yong)。在網(wang)頁(ye)中嵌入圖(tu)表(biao)、數據(ju)以(yi)及(ji)分(fen)析(xi)(xi)的(de)(de)算法,非常適合打造企業內(nei)部的(de)(de)敏捷(jie)數據(ju)分(fen)析(xi)(xi)工具(ju)集。本節主(zhu)要介紹Pie、Scatter、Radar等等各種可視(shi)化解決方案,同(tong)時講解一個用(yong)Seaborn實現數據(ju)分(fen)析(xi)(xi)功能(兼圖(tu)表(biao))的(de)(de)實際案例,搭建服務器(qi),在企業內(nei)部實現輕量(liang)(liang)級(ji)數據(ju)分(fen)析(xi)(xi)應用(yong)。
第三天
下午ChatGPT職場賦能第十六講 GPT4 Plus 快速入門
首先了解以ChatGPT為代表的大語言模型的原理,并且對比介紹GPT3與GPT4的區別。接下來介紹如何在國內的環境下方便穩定的使用ChatGPT4。最后演示在GPT使用過程中如何高效的使用提示詞,以及GPT4新特性:Custom Instructions 與角色設置
第十七講 GPT4 Plus 提高辦公效率
介紹Excel如何安裝GPT插件,自動編寫函數提升表格的處理效果。接下來介紹Python如何調用GPT API并介紹Token計算、字數限制、內容亂碼解決方案。最后講解ChatGPT4 Plus如何自動實現數據挖掘流程并生成分析報告。以及Plugin Store 第三方插件安裝與使用
第十八講 文案、短視頻、AI主播的定制化生成
首先介紹如(ru)果(guo)通(tong)(tong)過(guo)GPT生(sheng)(sheng)成高質量的(de)(de)文案,或者如(ru)果(guo)通(tong)(tong)過(guo)AI來優化(hua)已有(you)的(de)(de)文案。接下(xia)(xia)通(tong)(tong)過(guo)百度旗下(xia)(xia)的(de)(de)AI工具通(tong)(tong)過(guo)文案自動生(sheng)(sheng)成高質量的(de)(de)短視頻。最后通(tong)(tong)過(guo)阿里的(de)(de)語(yu)言訓(xun)練模(mo)型,打造屬(shu)于自己或者公司(si)的(de)(de)數字人
授課專家
劉老師 10多年(nian)的IT領域相關技(ji)術研究和項(xiang)目(mu)開(kai)發工作,在(zai)(zai)長期軟(ruan)(ruan)(ruan)(ruan)件領域工作過(guo)(guo)程(cheng)中,對(dui)軟(ruan)(ruan)(ruan)(ruan)件企業運作模式有深(shen)入研究,熟(shu)悉軟(ruan)(ruan)(ruan)(ruan)件質量保障(zhang)標準ISO9003和軟(ruan)(ruan)(ruan)(ruan)件過(guo)(guo)程(cheng)改進(jin)模型CMM/CMMI,在(zai)(zai)具(ju)體項(xiang)目(mu)實(shi)施(shi)過(guo)(guo)程(cheng)中總(zong)結經驗,有深(shen)刻認識(shi)。通曉多種軟(ruan)(ruan)(ruan)(ruan)件設計和開(kai)發工具(ju)。對(dui)軟(ruan)(ruan)(ruan)(ruan)件開(kai)發整個流程(cheng)非(fei)常熟(shu)悉,能(neng)根(gen)據項(xiang)目(mu)特點定制具(ju)體軟(ruan)(ruan)(ruan)(ruan)件過(guo)(guo)程(cheng),并進(jin)行項(xiang)目(mu)管理(li)和監(jian)控,有很強的軟(ruan)(ruan)(ruan)(ruan)件項(xiang)目(mu)組織(zhi)管理(li)能(neng)力。對(dui)C/C++、HTML 5、python、Hadoop、java、java EE、android、IOS、大數據、云計算有比(bi)較(jiao)深(shen)入的理(li)解和應用,具(ju)有較(jiao)強的移動互聯網應用需(xu)求分析和系統設計能(neng)力,熟(shu)悉Android框架、IOS框架等技(ji)術,了解各種設計模式,能(neng)在(zai)(zai)具(ju)體項(xiang)目(mu)中靈活運用。
數據分析實戰公開課
轉載://citymember.cn/gkk_detail/295653.html
已開課時間Have start time
大數據營銷內訓
- 《大數據精準營銷與具體落地 史杰(jie)松
- 零門檻助力企業數字化增長 寧延杰(jie)
- AI賦能:電信行業大數據應 甄文智
- 數字金融與智能金融下的智慧 盧(lu)森煌
- 《客戶沙龍會精準邀約技巧》 史(shi)慧
- 數字經濟基礎和企業數字化轉 盧(lu)森煌
- 數字化AI轉型以及AI在制 甄文智(zhi)
- 制造企業的數據架構與治理實 甄文智(zhi)
- 銀行數智化技術的落地和實操 甄文(wen)智
- 中國移動政企業務 盧森(sen)煌
- 數字化轉型與新質生產力 盧森煌
- 區塊鏈技術發展趨勢與企業變 劉暉