国产极品粉嫩福利姬萌白酱_伊人WWW22综合色_久久精品a一国产成人免费网站_法国啄木乌AV片在线播放

全國 [城市選擇] [會員登錄] [講師注冊] [機構注冊] [助教注冊]  
中國企業培訓講師
Python網絡爬蟲及數據采集技術
 
講師(shi):張曉誠 瀏(liu)覽次數(shu):2579

課程描述(shu)INTRODUCTION

Python網絡爬蟲課程

· IT人士· 高層管理者· 中層領導· 其他人員

培訓講師:張曉(xiao)誠    課程價格:¥元/人    培訓天數:3天   

日(ri)程(cheng)安(an)排SCHEDULE



課(ke)程大綱Syllabus

Python網絡爬蟲課程

    課程收益:
    1,全面了解Python爬蟲的相關知識。
    2,學習Python爬蟲的核心技術方法以及應用特征。
    3,深(shen)入使(shi)(shi)用Python在網絡數據采集中(zhong)的使(shi)(shi)用。

    課程大綱:
    Python是一種面向對象、解釋型計算機程序設計語言,Python是純粹的自由軟件,源代碼和解釋器CPython遵循 GPL協議。是一個用于統計計算和統計制圖的優秀工具,也是GNU的一個免費、源代碼開放的軟件。
    Python語法簡潔清晰,具有豐富和強大的庫,能夠把用其他語言制作的各種模塊(尤其是C/C++)很輕松地聯結在一起。 Python爬蟲包括一套完整的數據采集、處理、計算系統,簡便而強大的編程語言,可操縱數據的輸入和輸入,可實現分支、循環,用戶可自定義功能。
    本(ben)培訓將對基于(yu)Python爬蟲進行數(shu)據采集、處理、數(shu)據分(fen)析(xi)的方法深(shen)度(du)剖(pou)析(xi),并對Python爬蟲原理及(ji)實(shi)現進行講解。

    一、培訓對象
    1,系統架構師、系統分析師、高級程序員、資深開發人員。
    2,牽涉到網絡采集、處理和規劃的負責人、設計人員。
    3,政府機關,金融保險、移動等以互聯網信息為數據來源單位的負責人。
    4,高校(xiao)、科研院所(suo)牽涉到網(wang)絡數據(ju)(ju)采(cai)集與數據(ju)(ju)處理的項(xiang)目負責人。

    二、學員基礎
    1,對IT系統設計有一定的理論與實踐經驗。
    2,具備信息檢索IR和大數據處理的基礎知識。
    3,有一(yi)定的(de)python基(ji)礎知識和開發經驗。

    三、培訓內容
    第一講 網絡爬蟲基礎

    1.什么是網絡爬蟲
    2.瀏覽網頁的過程
    3.URL的含義
    4. 環境的配置

    第二講 Python爬蟲基礎知識
    1.Python爬蟲基礎學習
    2.Python urllib和urllib2 庫的用法
    3.Python 正則表達式
    4.BeautifulSoup簡介
    5.爬蟲框(kuang)架Scrapy

    第三講 Urllib庫的基本使用
    1.網頁爬取示例
    2.網頁爬取方法
    3.構造Requset
    4.POST和(he)GET數據(ju)傳送(song)

    第四講 Urllib庫的高級用法
    1.設置Headers
    2. Proxy(代理)的設置
    3.Timeout 設置
    4.HTTP的PUT和DELETE方法
    5.使用(yong)DebugLog

    第五講 正則表達式
    1.了解正則表達式
    2.正則表達式的語法規則
    3.正則表達式相關注解
    4.Python Re模(mo)塊(kuai)

    第六講 Beautiful Soup的用法
    1. Beautiful Soup的簡介
    2. Beautiful Soup 安裝
    3. 創建 BeautifulSoup 對象
    4. Beautiful Soup對象種類
    5. 遍歷文檔樹(shu)

    第七講 開始采集
    1.遍歷單個域名
    2.采集整個網站
    3.通過互聯網采集
    4.用Scrapy采集
    5.幾個示(shi)例

    第八講 存儲數據和讀取文檔
    1.媒體文件
    2.把數據存儲到CSV
    3.MySQL與Python整合
    4.讀取純文本和CSV文檔
    5.讀取(qu)Word和(he).docx

    第九講 自然語言處理基礎
    1.概括數據
    2.馬爾可夫模型
    3.自然語言工具包
    4.用NLTK做統計分析
    5.用NLTK做詞性分析(xi)

    第十講 用爬蟲測試網站
    1.測試簡介
    2.Python單元測試
    3.Selenium單元測試
    4.Python單(dan)元(yuan)(yuan)測(ce)試與Selenium單(dan)元(yuan)(yuan)測(ce)試的選擇

    四、培訓目標
    1,全面了解Python爬蟲的相關知識。
    2,學習Python爬蟲的核心技術方法以及應用特征。
    3,深入使用Python在網絡數(shu)據采(cai)集中的使用。

Python網絡爬蟲課程


轉載://citymember.cn/gkk_detail/257427.html

已(yi)開(kai)課時間(jian)Have start time

在線報名Online registration

    參加課程:Python網絡爬蟲及數據采集技術

    單位(wei)名(ming)稱:

  • 參(can)加(jia)日期:
  • 聯系人:
  • 手機號碼(ma):
  • 座(zuo)機(ji)電(dian)話:
  • QQ或微(wei)信:
  • 參加人數(shu):
  • 開票(piao)信息:
  • 輸入驗(yan)證:  看不清楚?點擊驗證碼刷新
付款信息:
開戶名:上海投智企業管理咨詢有限公司
開戶行:中國銀行股份有限公司上海市長壽支行
帳號:454 665 731 584
張曉誠
[僅限會員]