課程大綱
一、數(shù)據(jù)挖掘概述與數(shù)據(jù)預(yù)處理
1、目標(biāo):對(duì)數(shù)據(jù)挖掘建立清晰、正確的認(rèn)識(shí);了解如何對(duì)數(shù)據(jù)進(jìn)行初步的統(tǒng)計(jì)分析,掌握利用報(bào)表、統(tǒng)計(jì)指標(biāo)、可視化圖形對(duì)數(shù)據(jù)進(jìn)行概括性描述;掌握數(shù)據(jù)預(yù)處理的基本技巧,例如數(shù)據(jù)清洗、規(guī)范化轉(zhuǎn)換、連續(xù)值離散化、缺失值的處理;了解數(shù)據(jù)倉(cāng)庫(kù)的基本概念和建設(shè)。
—— 了解數(shù)據(jù)挖掘基本概念、模型和能解決的問(wèn)題;
—— 數(shù)據(jù)挖掘面臨的問(wèn)題
—— 統(tǒng)計(jì)分析的基本方法和度量
—— 數(shù)據(jù)準(zhǔn)備與數(shù)據(jù)倉(cāng)庫(kù)
—— 數(shù)據(jù)預(yù)處理的方式方法
二、挖掘方法1:
1、目標(biāo):掌握頻繁項(xiàng)集、閉合頻繁項(xiàng)集、關(guān)聯(lián)規(guī)則概念,典型關(guān)聯(lián)規(guī)則挖掘算法,關(guān)聯(lián)規(guī)則挖掘的建模與分析;掌握決策樹分類法,理解預(yù)測(cè)準(zhǔn)確率與過(guò)擬合的關(guān)系,能夠構(gòu)建訓(xùn)練集、測(cè)試集,并用學(xué)習(xí)到的分類模型進(jìn)行分類預(yù)測(cè)。
—— 關(guān)聯(lián)分析算法與模型設(shè)計(jì)
—— 決策樹算法與模型設(shè)計(jì)
—— 結(jié)合工具軟件操作
三、挖掘方法2:
1、目標(biāo):理解貝葉斯方法,能夠用工具建立貝葉斯網(wǎng)絡(luò)模型;掌握聚類典型算法k-均值聚、層次聚類 和基于密度的聚類,能夠構(gòu)建聚類模型,對(duì)數(shù)據(jù)進(jìn)行有效聚類。
—— 貝葉斯與貝葉斯網(wǎng)絡(luò)算法與模型設(shè)計(jì)
—— 典型聚類算法與模型設(shè)計(jì)
—— 結(jié)合工具軟件操作
四、其他挖掘方法與挖掘前沿技術(shù)
1、目標(biāo):了解多種挖掘算法與技術(shù),了解數(shù)據(jù)挖掘的前沿技術(shù),以利于日后可能的應(yīng)用。
—— 時(shí)序和序列數(shù)據(jù)的挖掘
—— 神經(jīng)網(wǎng)絡(luò)分類
—— 圖挖掘、社會(huì)網(wǎng)絡(luò)挖掘分析與介紹
—— 其他挖掘技術(shù)
五、挖掘模型建模和實(shí)例分析
1、目標(biāo):了解多個(gè)工具軟件,對(duì)個(gè)工具軟件有總體認(rèn)識(shí),以便恰當(dāng)選擇商業(yè)化的挖掘工具;通過(guò)一個(gè)實(shí)例,應(yīng)用挖掘工具逐步、詳細(xì)實(shí)現(xiàn)挖掘工程。
—— 其他多種挖掘工具的介紹。
—— 結(jié)合一個(gè)實(shí)例,例如市場(chǎng)營(yíng)銷、證券、電信業(yè)務(wù)、銀行業(yè)務(wù)等,進(jìn)行實(shí)際建模
與挖掘分析。
1、目標(biāo):對(duì)數(shù)據(jù)挖掘建立清晰、正確的認(rèn)識(shí);了解如何對(duì)數(shù)據(jù)進(jìn)行初步的統(tǒng)計(jì)分析,掌握利用報(bào)表、統(tǒng)計(jì)指標(biāo)、可視化圖形對(duì)數(shù)據(jù)進(jìn)行概括性描述;掌握數(shù)據(jù)預(yù)處理的基本技巧,例如數(shù)據(jù)清洗、規(guī)范化轉(zhuǎn)換、連續(xù)值離散化、缺失值的處理;了解數(shù)據(jù)倉(cāng)庫(kù)的基本概念和建設(shè)。
—— 了解數(shù)據(jù)挖掘基本概念、模型和能解決的問(wèn)題;
—— 數(shù)據(jù)挖掘面臨的問(wèn)題
—— 統(tǒng)計(jì)分析的基本方法和度量
—— 數(shù)據(jù)準(zhǔn)備與數(shù)據(jù)倉(cāng)庫(kù)
—— 數(shù)據(jù)預(yù)處理的方式方法
二、挖掘方法1:
1、目標(biāo):掌握頻繁項(xiàng)集、閉合頻繁項(xiàng)集、關(guān)聯(lián)規(guī)則概念,典型關(guān)聯(lián)規(guī)則挖掘算法,關(guān)聯(lián)規(guī)則挖掘的建模與分析;掌握決策樹分類法,理解預(yù)測(cè)準(zhǔn)確率與過(guò)擬合的關(guān)系,能夠構(gòu)建訓(xùn)練集、測(cè)試集,并用學(xué)習(xí)到的分類模型進(jìn)行分類預(yù)測(cè)。
—— 關(guān)聯(lián)分析算法與模型設(shè)計(jì)
—— 決策樹算法與模型設(shè)計(jì)
—— 結(jié)合工具軟件操作
三、挖掘方法2:
1、目標(biāo):理解貝葉斯方法,能夠用工具建立貝葉斯網(wǎng)絡(luò)模型;掌握聚類典型算法k-均值聚、層次聚類 和基于密度的聚類,能夠構(gòu)建聚類模型,對(duì)數(shù)據(jù)進(jìn)行有效聚類。
—— 貝葉斯與貝葉斯網(wǎng)絡(luò)算法與模型設(shè)計(jì)
—— 典型聚類算法與模型設(shè)計(jì)
—— 結(jié)合工具軟件操作
四、其他挖掘方法與挖掘前沿技術(shù)
1、目標(biāo):了解多種挖掘算法與技術(shù),了解數(shù)據(jù)挖掘的前沿技術(shù),以利于日后可能的應(yīng)用。
—— 時(shí)序和序列數(shù)據(jù)的挖掘
—— 神經(jīng)網(wǎng)絡(luò)分類
—— 圖挖掘、社會(huì)網(wǎng)絡(luò)挖掘分析與介紹
—— 其他挖掘技術(shù)
五、挖掘模型建模和實(shí)例分析
1、目標(biāo):了解多個(gè)工具軟件,對(duì)個(gè)工具軟件有總體認(rèn)識(shí),以便恰當(dāng)選擇商業(yè)化的挖掘工具;通過(guò)一個(gè)實(shí)例,應(yīng)用挖掘工具逐步、詳細(xì)實(shí)現(xiàn)挖掘工程。
—— 其他多種挖掘工具的介紹。
—— 結(jié)合一個(gè)實(shí)例,例如市場(chǎng)營(yíng)銷、證券、電信業(yè)務(wù)、銀行業(yè)務(wù)等,進(jìn)行實(shí)際建模
與挖掘分析。

