?
適用人群:
想了解和學習典型的數據分析流程和實踐方法的人
不會使用Python的數據分析師從業者
想轉行從事數據分析師行業的朋友
想使用Python實現機器學習的工程師
課程目標:
熟悉數據分析的流程,包括數據采集、處理、可視化等
掌握Python語言作為數據分析工具,從而有能力駕馭不同領域的數據分析實踐
快速積累多個業務領域的數據分析項目經驗
掌握使用Python實現基于機器學習的數據分析和預測
課程大綱:
一 工作環境準備及Python數據結構講解
課程介紹、工作環境準備、Python語言基礎回顧、Python數據結構講解
列表、字典、元組、集合、Python高級特性、切片、迭代、Python高階函數、map、filter、reduce
二 科學計算及數據可視化入門
使用NumPy和SciPy進行科學計算、Matplotlib繪圖入門、實戰案例:2016美國總統大選數據分析 (2016 Election Polls)
三 本地數據的采集與操作
常用格式的本地數據讀寫、SQL常用語法講解、Python的數據庫基本操作、數據庫多表連接用法詳解
left join、right join、inner join
實戰案例:歐洲職業足球數據庫分析 (European Soccer Database)
四 網絡數據的獲取與表示
BeautifulSoup解析網頁
爬蟲框架Scrapy基礎
實戰案例:獲取電商網站的商品信息
五 數據分析工具Pandas 基礎
Pandas的數據結構、Series、DataFrame、Pandas的數據操作、數據的導入、導出
數據的過濾篩選、索引及多重索引、Pandas統計計算和描述、Pandas的繪圖函數
實戰案例:星級爭霸II重放分析 (StarCraft II Replay Analysis)
六 數據分析工具Pandas進階
數據的分組與聚合
數據的分組運算
Pandas透視表和交叉表
實戰案例:互聯網電影資料庫分析 (IMDB 5000 Movie Dataset)
七 數據的規整與可視化
數據清洗、合并、轉化和重構
常用的Python數據可視化工具
Matplotlib回顧及擴充
Seaborn繪圖
交互式數據可視化—Bokeh繪圖
實戰案例:空難歷史數據分析 (Airplane Crashes Since 1908)
八 機器學習基礎及機器學習庫scikit-learn入門
機器學習基礎
scikit-learn入門
實戰案例:利用聲音數據進行性別識別 (Gender Recognition by Voice)
九 項目實戰:“閃電約會”配對預測
項目介紹 (Speed Dating Experiment)
數據分析與處理
課程總結
?