課程描述INTRODUCTION
快速了解大數據玩法
日程(cheng)安排SCHEDULE
課(ke)程大綱Syllabus
課時一:概念綜述
1.大數據的定義由來和原因
1.大數據的6V特征
1.從數據庫,數據倉庫到大數據
1.大數據相關技(ji)術和處理
課時二:Hadoop生態圈、spark生態圈、搜索引擎概述
1.hadoop:HDFS、Map-Reduce、Hbase、Hive等
1.spark:scala、spark-SQL、spark-Streaming等
1.搜索引擎:lucene(solr)、ES
1.并(bing)發的機器學習工具:R-hadoop、spark-MLLIB、 spark-R、pyspark
課時三:存儲在hbase中的數據
1.NoSQL(key-value)
1.Hbase:安裝
1.行鍵與列簇
1.如何利用Hbase的特點存儲數據
1.應用程序如何訪問Hbase中的數據
1.數據遷移:sqoop
1.Hbase的應用場景
課時四:Hive:為用SQL的開發者留的活路
1.Hive:安裝(單用戶與多用戶)
1.Hive:基本操作
1.Hive:與典型的關系型數據庫的區別
1.如果“想慢”,你可以這樣…(不恰當使用hive的案例介紹)
1.Hive的應用場景(jing)
課時五:Spark各組件在衛生領域的應用
1.Hadoop*的特點是什么?
1.Spark概述與安裝
1.Scala:你可以一直“點”下去
1.RDD:“映射”、“轉換”解決一切
1.spark-SQL
1.spark-streaming
1.spark的其他組件
1.應用場景
課時六:機器學習算法介紹—I
1.綜述(人工智能、數據挖掘、機器學習、機器智能、大數據:這些詞的確切含義)
1.監督學習、無監督學習與強化學習
1.工具:R、Python等
1.決策樹詳解(熵、貪心法、連續的和離散的)
1.神經(jing)(jing)網絡詳解(神經(jing)(jing)元、激勵函數、前(qian)饋神經(jing)(jing)網絡的BP算法,其他神經(jing)(jing)網絡)
課時七:機器學習算法介紹—II
1.關聯規則詳解(頻繁項集、Apriori、支持度、置信度)
1.聚類詳解(k-means、k-medoid)
1.常見(jian)算法的簡述(shu)(Na?ve-Bayes、k-NN、HMM、SVM等)
轉載://citymember.cn/gkk_detail/65026.html
已開課(ke)時間Have start time
- 葉梓
人工智能內訓
- 數智賦能—走在 AI 浪潮
- AI賦能企業增長的新紀元—
- AI商用訓練營——增加工作 武(wu)建偉
- 《AI領導力思維》 武建偉(wei)
- 《數字化轉型中的仿真》 王(wang)明哲
- 信用卡直播,結合人工智能 武建偉
- 《人工智能如何落地汽車行業 王明哲
- 《未來管理革新:ChatG 武建偉(wei)
- 《游戲規則改變--當制藥業 王明(ming)哲
- 數智賦能—走在 AI 浪潮
- 5G、物聯網、數字化轉型等 胡國慶
- 《鄉村振興金融新思維——A 武建偉