互聯(lián)網(wǎng)數(shù)據(jù)挖掘概覽 |
- 互聯(lián)網(wǎng)的數(shù)據(jù)挖掘典型需求
- 互聯(lián)網(wǎng)數(shù)據(jù)采集的典型渠道
- 互聯(lián)網(wǎng)數(shù)據(jù)存儲特征
- 數(shù)據(jù)挖掘技術與工具
- 數(shù)據(jù)分析的工作模式
- 示例:數(shù)據(jù)挖掘在互聯(lián)網(wǎng)行業(yè)中的應用
|
互聯(lián)網(wǎng)相關的數(shù)據(jù)挖掘典型應用場景 |
- 數(shù)據(jù)流挖掘分析
- 文本挖掘分析
- 示例:文本數(shù)據(jù)流分析
- 位置分析
- 社交關系分析
- 互聯(lián)網(wǎng)應用識別
- 個性化推薦介紹
|
數(shù)據(jù)分析與挖掘的流程 |
- 確定數(shù)據(jù)需求
- 設計數(shù)據(jù)挖掘模型
- 確定數(shù)據(jù)來源
- 收集并整理數(shù)據(jù)
- 選擇數(shù)據(jù)挖掘算法
- 執(zhí)行數(shù)據(jù)挖掘算法
- 數(shù)據(jù)分析結果評估與算法+數(shù)據(jù)優(yōu)化
- 報告數(shù)據(jù)分析結果
|
數(shù)據(jù)需求分析 |
- 確定數(shù)據(jù)分析目標
- 圍繞目標分解指標
- 把指標映射到已有的數(shù)據(jù)
- 確定對數(shù)據(jù)的要求
|
設計數(shù)據(jù)挖掘模型 |
- 確定數(shù)據(jù)源模型
- 確定數(shù)據(jù)挖掘結果模型
- 確定數(shù)據(jù)分析算法容器模型
- 建立從數(shù)據(jù)源到數(shù)據(jù)分析結果映射圖
|
確定數(shù)據(jù)源 |
- 數(shù)據(jù)源存儲空間標定
- 數(shù)據(jù)源邏輯模型分析
- 數(shù)據(jù)源抽取方法列表
- 數(shù)據(jù)源備份機制選擇
- 數(shù)據(jù)源質量分析
|
收集并整理數(shù)據(jù) |
- 數(shù)據(jù)整理需求明確
- 采用自動化方法整理數(shù)據(jù)
- 對不合規(guī)數(shù)據(jù)的特殊處理
- 間隙數(shù)據(jù)的補充
|
選擇數(shù)據(jù)挖掘算法 |
- 典型數(shù)據(jù)挖掘算法列表
- 關聯(lián)和相關分析
- 相關分析
- 關聯(lián)規(guī)則分析
- 實例:使用相關及關聯(lián)進行分析
- 聚類分析算法及應用
- 分類算法
- 用決策樹進行分類
- 神經網(wǎng)絡
- 實例:使用分類方法進行客戶流失分析
- 回歸分析與預測
- 示例:使用時間序列分析進行網(wǎng)絡流量預測
|
數(shù)據(jù)挖掘工具原理與實踐 |
- 典型數(shù)據(jù)挖掘工具列表
- 統(tǒng)計分析工具SPSS介紹(簡要)
- 數(shù)據(jù)挖掘專用工具SPSS Clementine介紹
- 建模及模型評價過程
- 應用SPSS Clementine工具進行數(shù)據(jù)挖掘與分析
|
數(shù)據(jù)挖掘效果評估與優(yōu)化 |
- 數(shù)據(jù)挖掘結果差異分析
- 差異原因定位
- 優(yōu)化數(shù)據(jù)與算法
- 重新處理數(shù)據(jù)、算法分析
- 結果比對與確認
- 數(shù)據(jù)分析結果報告?
|