91一级特黄大片|婷婷中文字幕在线|av成人无码国产|日韩无码一二三区|久久不射强奸视频|九九九久久久精品|国产免费浮力限制

課程簡介 Course Introduction

課程發(fā)展的主要歷史沿革

1)專業(yè)沿革:廣東工業(yè)大學(xué)計算機科學(xué)與技術(shù)專業(yè)(1998年以前為計算機及應(yīng)用專業(yè))創(chuàng)辦于 1984 年,是廣東省最早創(chuàng)辦該類專業(yè)的高校之一。在創(chuàng)辦后的20年來,學(xué)校一直給予了極大的政策支持和資金投入,通過20年的建設(shè),本專
業(yè)在學(xué)科和課程建設(shè)及辦學(xué)條件等方面有了長足的進(jìn)展,1993 年“計算機應(yīng)用技術(shù)”學(xué)科被評為省級重點扶持學(xué)科,1999 年“計算機科學(xué)與技術(shù)專業(yè)”再度
被評為省級重點學(xué)科,成為本校 5 個省級重點學(xué)科之一,2003 年該專業(yè)被評為廣東省名牌專業(yè),該專業(yè)學(xué)科總體水平在全國地方工科院校中處于前列。
2) 課程發(fā)展:隨著計算機科學(xué)與技術(shù)及互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,大數(shù)據(jù)時代的到來, 以數(shù)據(jù)分析和信息提取為基本特征的 《數(shù)據(jù)挖掘》 技術(shù)獲得了極大的發(fā)展。
本課程積聚了新方法、新技術(shù),以適應(yīng)數(shù)據(jù)挖掘技術(shù)的發(fā)展及快速增長的應(yīng)用需求?!稊?shù)據(jù)挖掘》課程的教學(xué)內(nèi)容、教學(xué)方法在不斷的改革與創(chuàng)新。我?!稊?shù)據(jù)挖掘》 課程起步于研究生的課程, 從 2003年起,我校在研究生教育階段引入 《數(shù)據(jù)挖掘》課程,2004年我校完成了本科《數(shù)據(jù)挖掘》的教學(xué)大綱,2006年在工程碩士課程中引入《數(shù)據(jù)挖掘》課程,經(jīng)過近 10 年的教學(xué)實踐,教學(xué)內(nèi)容上隨著《數(shù)據(jù)挖掘》技術(shù)的進(jìn)步及應(yīng)用開展而不斷增加(如,以 SVM、EM 為代表的統(tǒng)計學(xué)習(xí)方法、以PAGERANK為代表的鏈接挖掘技術(shù)、以ADABoost 為代表的袋裝與推進(jìn)算法、以 K-MEANS 為代表的聚類算法、以 Apriori為代表的管理分析算法、以及以C4.5、KNN、Naive Bayes、CART等為代表的分類算法等),我校的《數(shù)據(jù)挖掘》課程伴隨廣東經(jīng)濟建設(shè)需要,在教學(xué)內(nèi)容上不斷更新、教學(xué)手段上不斷完善,從課堂講授逐漸演變?yōu)榘咐浇虒W(xué),結(jié)合具體應(yīng)用進(jìn)行講解?!稊?shù)據(jù)挖掘》課程在加強素質(zhì)教育、培養(yǎng)創(chuàng)新人才等方面已形成特色。
3) 課程現(xiàn)狀:以案例形式組織教學(xué)內(nèi)容,以應(yīng)用及項目為背景,建立了集課程
體系、教學(xué)內(nèi)容、考試、實驗、教學(xué)方法、課程設(shè)計等較全面的教學(xué)體系,通過《數(shù)據(jù)挖掘》專題學(xué)習(xí)網(wǎng)站,為學(xué)生提供網(wǎng)上輔助多媒體教學(xué)系統(tǒng)、學(xué)生答疑系
統(tǒng)、自動測試、批改作業(yè)系統(tǒng)、論壇討論、師生交流等拓展知識,尤其是將數(shù)據(jù) 挖掘算法轉(zhuǎn)換為課程學(xué)習(xí)的練習(xí)任務(wù),要求學(xué)生設(shè)計、實現(xiàn)并在數(shù)據(jù)集上應(yīng)用。

由此營造一個主動學(xué)習(xí)、協(xié)同創(chuàng)新的良好育人氛圍,延伸視野、加強素質(zhì)教育、 培養(yǎng)創(chuàng)新人才的方法和手段。已取得了可喜的成績。

理論課教學(xué)內(nèi)容


一、課程的性質(zhì)和目的
本課程是計算機專業(yè)的專業(yè)選修課。本課程的學(xué)習(xí)目的在于使學(xué)生掌握數(shù)據(jù)倉庫的基本概念、基本原理;掌握OLAP技術(shù);掌握數(shù)據(jù)挖掘的基本概念、基本方法和基本技術(shù)。為從事數(shù)據(jù)分析工作及參加數(shù)據(jù)分析工程實踐打下必要的基礎(chǔ)。

二、課程教學(xué)內(nèi)容及學(xué)時分配
第一章 緒論(2學(xué)時)
掌握數(shù)據(jù)挖掘的概念、方法,了解數(shù)據(jù)挖掘任務(wù),了解數(shù)據(jù)挖掘的發(fā)展與展望。
本章知識點為:數(shù)據(jù)挖掘概念,數(shù)據(jù)挖掘任務(wù)。

第二章 數(shù)據(jù)處理基礎(chǔ) (4學(xué)時)
掌握數(shù)據(jù)、數(shù)據(jù)類型概念,了解和掌握數(shù)據(jù)預(yù)處理過程,掌握數(shù)據(jù)清理、數(shù)據(jù)集成和變換數(shù)據(jù)歸約和數(shù)據(jù)離散化。掌握數(shù)據(jù)的相似性及相異性及其計算。
本章知識點為:數(shù)據(jù)、數(shù)據(jù)類型概念數(shù)據(jù)預(yù)處理,數(shù)據(jù)相似性、相異性及其度量。

第三章 分類與回歸(7學(xué)時)
掌握數(shù)據(jù)分類的基本概念,掌握決策樹分類方法、掌握貝葉斯分類方法、掌握k-最近鄰分類方法、掌握回歸分析,了解機器學(xué)習(xí)的分類方法,了解模型的擬合和過度擬合問題。了解評估分類器性能的方法。
本章知識點為:數(shù)據(jù)分類概念,決策樹分類、貝葉斯分類、k-最近鄰分類、機器學(xué)習(xí)、回歸,模型擬合.

第四章 聚類分析(7學(xué)時)
要求理解和掌握常見的聚類分析方法,掌握基于劃分的聚類算法、k-means聚類算法、層次聚類算法、基于密度的聚類算法、一趟聚類算法,了解聚類的評估方法。了解聚類的應(yīng)用。
本章知識點為:聚類分析,K-means均值、層次聚類、基于密度的聚類、DBSCAN,聚類評估。

第五章 關(guān)聯(lián)技術(shù)(6學(xué)時)
掌握Apriori 算法,掌握支持度、置信度、頻繁項集及求頻繁項集的方法,掌握關(guān)聯(lián)規(guī)則及挖掘方法、FP樹及其算法,掌握關(guān)聯(lián)模式的評估。
本章知識點為:關(guān)聯(lián)規(guī)則、Apriori 算法、FP樹、支持度、置信度、頻繁項集。

第六章 離群點挖掘(6學(xué)時)
要求理解和掌握孤立點(離群點)的基本概念,掌握基于統(tǒng)計的方法、基于驅(qū)離的方法、基于相對密度的方法、基于聚類的方法,了解異常檢測基本概念,基本方法,了解異常檢測的應(yīng)用。
本章知識點為:離群點、異常檢測。


三、課程教學(xué)的基本要求
本課程是計算機專業(yè)的專業(yè)選修課程,理論性較強,涉及較多的理論知識及數(shù)學(xué)知識,是本專業(yè)的具有廣闊應(yīng)用前景的理論課程。在教學(xué)方法上,采用課堂講授,課后自學(xué),課堂討論和實踐相結(jié)合的教學(xué)形式。
(一)課堂講授
本課程屬基礎(chǔ)理論課程,涉及到較多的數(shù)學(xué)知識,在講述的過程中教師應(yīng)盡量聯(lián)系生產(chǎn)生活實際,注重物理意義,不要陷入到繁復(fù)的數(shù)學(xué)推導(dǎo)之中。在教學(xué)中要求同學(xué)重點掌握數(shù)據(jù)模型、OLAP技術(shù)、數(shù)據(jù)挖掘方法等基本概念、基本方法和基本規(guī)律,要著重培養(yǎng)學(xué)生定性分析、定量估算和模擬實驗研究的能力,在課程內(nèi)容方面既要保持理論的系統(tǒng)性,又要注意聯(lián)系工程實際,并且重視技術(shù)科學(xué)的一般方法學(xué)的培養(yǎng)。
(二)課后自學(xué)
為了培養(yǎng)學(xué)生整理歸納,綜合分析和處理問題的能力,每章都安排一部分習(xí)題內(nèi)容,課上教師只給出自學(xué)提綱,不作詳細(xì)講解,課后學(xué)生自學(xué)。
(三)課堂討論
課堂討論的目的是活躍學(xué)習(xí)氣氛,開拓思路,。教師應(yīng)認(rèn)真組織,安排重點發(fā)言,充分調(diào)動每一名同學(xué)的學(xué)習(xí)積極性,做好總結(jié)。
(四)習(xí)題課
習(xí)題課以典型例題分析為主,并適當(dāng)安排開闊思路及綜合性的練習(xí)及討論。共2學(xué)時(已包括在前述學(xué)時分配中)。
(五)課外作業(yè)
課外作業(yè)的內(nèi)容選擇基于對基本理論的理解和鞏固,培養(yǎng)綜合計算和分析、判斷能力以及使用計算工具的能力。習(xí)題以計算性小題為主,平均每學(xué)時1-2道題。
(六)實驗
實驗不占學(xué)時,實驗以學(xué)習(xí)數(shù)據(jù)挖掘基本方法和訓(xùn)練實驗?zāi)芰橹?,驗證理論為輔。通過實驗要求學(xué)生掌握數(shù)據(jù)挖掘基本方法。
(七)考試
考試可采用閉卷形式,試題包括基本概念,基本理論,基本方法,題型可采用填空,判斷,計算,簡答等方式。
總評成績:課外作業(yè),平時成績占20%;期末考試占70%;課程類大作業(yè)占10%


實踐課教學(xué)內(nèi)容

實驗分三個層次:基礎(chǔ)實驗,綜合實驗,創(chuàng)新性實驗。
1. 基礎(chǔ)實驗
掌握Clementine的基本使用,熟悉Clementine 中文教程中的案例。
實驗一 數(shù)據(jù)預(yù)處理方法
? 熟悉Clementine的基本使用
– 了解數(shù)據(jù)流操作的基本過程(輸入->處理->輸出)(以drug數(shù)據(jù)集為例)
– 熟悉數(shù)據(jù)源節(jié)點的使用:可變文件、固定文件、SPSS文件
– 熟悉字段節(jié)點的使用:類型、過濾、導(dǎo)出、分箱
– 熟悉圖形節(jié)點的使用:點圖,分布圖(條形圖),柱形圖(直方圖)
– 熟悉輸出節(jié)點的使用:表格、數(shù)據(jù)審核
– 熟悉建模節(jié)點:特征選擇
– 考慮以下3個例子
? Clementine 概述
? 篩選預(yù)測變量(特征選擇)
? 準(zhǔn)備分析數(shù)據(jù)(數(shù)據(jù)審核)
實驗二 聚類方法
? 熟悉輸出節(jié)點的使用:統(tǒng)計量、矩陣
? 熟悉建模節(jié)點:k-means, kohonen聚類, Two step(兩步聚類)
– 采用Clementine自帶的DRUG1n 數(shù)據(jù)集(可變文件), 采用k-means, SOM
和兩階段方法三種聚類算法建模,分別進(jìn)行描述。
– 使用表節(jié)點查看聚類性能。
第七章 案例三的數(shù)據(jù)分析
實驗三 分類方法
? 熟悉分類任務(wù)的過程:模型建立(C5.0)、C&R 樹、Bayes網(wǎng)絡(luò)、選擇、抽樣、
平衡、模型檢驗
– 利用Clementine自帶的DRUG1n數(shù)據(jù)集,結(jié)合C5.0算法對數(shù)據(jù)集進(jìn)行分
類分析,使用分析節(jié)點、表節(jié)點查看分類性能。
考慮以下3個例子
– 藥物治療(勘察表/C5.0)
– 有線電視服務(wù)銷售(C&R 樹)
– 預(yù)測貸款拖欠者(貝葉斯網(wǎng)絡(luò))
實驗四 回歸方法
? 熟悉建模節(jié)點:回歸,邏輯回歸
? 考慮以下2個例子
– 電信業(yè)客戶分類(多項 Logistic 回歸)
– 電信客戶流失(二項 Logistic 回歸)
實驗五 關(guān)聯(lián)分析
? 熟悉建模節(jié)點:Apriori,Anomaly
? 考慮以下3個例子
– 市場購物籃分析(規(guī)則歸納/C5.0)
– 欺詐屏蔽(異常檢測/神經(jīng)網(wǎng)絡(luò))
– 識別促銷的目標(biāo)客戶(RFM)
? 識別消費額度高的客戶
? 預(yù)測促銷目標(biāo)客戶的響應(yīng)
第七章 案例四的數(shù)據(jù)分析
? 熟悉建立項目和報告的過程
2.綜合實驗——實際案例
3.大作業(yè)(創(chuàng)新性實驗)——以 2-5人為一項目組
大作業(yè)分三大類型,完成后要報告、答辯。
(1) 數(shù)據(jù)挖掘行業(yè)應(yīng)用現(xiàn)狀調(diào)研
數(shù)據(jù)挖掘在電子商務(wù)、財務(wù)決策、會計、市場營銷、物流管理、稅務(wù)、人力
資源管理、保險、貿(mào)易等領(lǐng)域的應(yīng)用現(xiàn)狀調(diào)研分析,最終以調(diào)研報告或論文的形
式提交成果。
(2) 實際領(lǐng)域的數(shù)據(jù)挖掘
數(shù)據(jù)挖掘在電子商務(wù)、財務(wù)決策、會計、市場營銷、物流管理、稅務(wù)、人力
資源管理、保險、貿(mào)易、校園數(shù)據(jù)挖掘(教學(xué)管理、金龍卡消費模式)、上市公司
數(shù)據(jù)分析、股票數(shù)據(jù)分析等領(lǐng)域的應(yīng)用,最終以論文或系統(tǒng)(含設(shè)計文檔)的方式
作為成果提交。
(3) 數(shù)據(jù)挖掘算法研究
改進(jìn)已有算法或設(shè)計新的算法

數(shù)據(jù)挖掘教學(xué)條件

1.教材與使用建設(shè)

教學(xué)教材
Jiawei Han, M. Kamber 著,范明,孟小峰譯. 數(shù)據(jù)挖掘:概念與技術(shù),
機械工業(yè)出版社,2003.
參考教材
(1)Ian H. Wittan. 數(shù)據(jù)挖掘:實用機器學(xué)習(xí)技術(shù)(英文版). 機械
工業(yè)出版社, 2005.
(2)毛國君. 數(shù)據(jù)挖掘原理與算法. 清華大學(xué)出版社, 2005.
(3)O. P. Rud. 朱揚勇等譯. 數(shù)據(jù)挖掘?qū)嵺`. 機械工業(yè)出版社,2003.
2.輔 教學(xué)資 助 料
(1)圖片庫:數(shù)據(jù)挖掘結(jié)果的可視化展示;
(2)論文庫:課程組發(fā)表的數(shù)據(jù)挖掘論文;
(3)算法庫:課程組開發(fā)完成的各種數(shù)據(jù)挖掘算法案例庫:課程組 承擔(dān)的數(shù)據(jù)挖掘項目案例解決方案;
(4)試題庫:近年來的試題;
(5)習(xí)題庫:課后作業(yè);
(6)資源鏈接:國內(nèi)外著名數(shù)據(jù)倉庫及數(shù)據(jù)挖掘產(chǎn)品提供商的網(wǎng)站
鏈接。
3.實踐 教學(xué)環(huán) 性 境
(1)智能計算實驗室:能夠容納 100 人同時實驗,PC 機的配置為: Intel Pentium4 530,512M 內(nèi)存,915GV 主板,80G 硬盤。開發(fā)環(huán)境: MATLAB 機器學(xué)習(xí)開發(fā)環(huán)境,.Net 開發(fā)環(huán)境,J2EE 開發(fā)環(huán)境。
(2)多功能數(shù)據(jù)挖掘器:多功能數(shù)據(jù)挖掘器是課程組承擔(dān)的廣東省 重大科技攻關(guān)項目,已經(jīng)于 2004 年通過了廣東省科技廳鑒定,鑒定 結(jié)論為國內(nèi)領(lǐng)先水平。多功能數(shù)據(jù)挖掘器提供了應(yīng)用程序設(shè)計接口
API(Application Programming Interface),便于用戶二次開發(fā)。學(xué)生 既可以利用 MFDM 學(xué)習(xí)數(shù)據(jù)挖掘算法,也可以利用其 API 進(jìn)行算法
設(shè)計。
(3)數(shù)據(jù)倉庫創(chuàng)建工具:課程組購買了數(shù)據(jù)倉庫創(chuàng)建工具,著名的 數(shù)據(jù)挖掘產(chǎn)品 Clementine、IBM Intelligent Miner 等,學(xué)生可以利用它 學(xué)習(xí)、熟悉數(shù)據(jù)倉庫的創(chuàng)建過程。
4.網(wǎng)絡(luò)教學(xué)環(huán)境
通過多年的建設(shè),課程組建立了良好的網(wǎng)絡(luò)教學(xué)環(huán)境: 《數(shù)據(jù)挖掘
網(wǎng)絡(luò)教學(xué)平臺》—能夠進(jìn)行數(shù)據(jù)挖掘的網(wǎng)絡(luò)教學(xué);《多功能數(shù)據(jù)挖掘
器算法庫》—對于常見的數(shù)據(jù)挖掘功能,如分類、關(guān)聯(lián)規(guī)則、聚類分 析等,提供了相應(yīng)的算法,學(xué)生可以下載

教學(xué)方法和手段

1) 以案例講授數(shù)據(jù)挖掘算法與知識
圍繞算法,以案例的形式進(jìn)行知識傳授,將每個《數(shù)據(jù)挖掘》算法通過數(shù)據(jù) 分析案例來討論、介紹與學(xué)習(xí),并結(jié)合具體應(yīng)用,引導(dǎo)學(xué)生選擇合適的算法挖掘 數(shù)據(jù)。
2) 主動學(xué)習(xí)、學(xué)生作品庫建設(shè)
按自愿組合與分派結(jié)合,將學(xué)生分組。學(xué)習(xí)數(shù)據(jù)挖掘算法時,教師介紹算法 的基本情況后,由學(xué)生動手實現(xiàn),設(shè)計了一系列檢查機制與監(jiān)督方法,指導(dǎo)、檢
查并監(jiān)督學(xué)生實現(xiàn)挖掘算法。 要求學(xué)生編程實現(xiàn)數(shù)據(jù)挖掘算法, 做成一個個作品, 并應(yīng)用于具體數(shù)據(jù)集或開源數(shù)據(jù)集,根據(jù)學(xué)生的各類算法,可比較不同算法在某
個數(shù)據(jù)集上的效果。讓學(xué)生通過算法實現(xiàn)、算法比較學(xué)到更多的算法,并體會各 算法的差異。在此過程中,教師起指導(dǎo)、檢查作用。 學(xué)生已完成部分?jǐn)?shù)據(jù)挖掘算法的實現(xiàn)(增加部分學(xué)生的作品)。
3) 堅持科研融入教學(xué)
向?qū)W生展示、說明教師現(xiàn)有數(shù)據(jù)挖掘方面的科研項目,鼓勵并吸納學(xué)生參加 教師的科研項目。推動學(xué)生學(xué)以致用,在科研中學(xué)習(xí)。如吸納部分本科生參加國 家、省市各類科研項目,在項目實踐中鍛煉學(xué)生。 堅持科研、教學(xué)、教改三結(jié)合,課程組教師積極開展科研、教研和教學(xué)改革
工作,并跟蹤新技術(shù),將科研、教研融入教學(xué)中,將科研成果應(yīng)用到數(shù)據(jù)挖掘的 具體教學(xué)實踐。 將一些數(shù)據(jù)挖掘的項目以案例的形式進(jìn)行組織,并傳授給學(xué)生,啟發(fā)學(xué)生開
展類似的項目開發(fā)。 部分學(xué)生參加的項目如下:
教育部重點實驗室項目《基于SVM和決策樹的協(xié)同入侵檢測》、廣東省自 然科學(xué)基金項目《協(xié)同入侵檢測的數(shù)據(jù)整合與負(fù)載均衡技術(shù)研究》、廣東省科技 計劃項目《面向SLA 的移動網(wǎng)絡(luò)用戶體驗服務(wù)平臺》與《電信客戶服務(wù)的數(shù)據(jù)
分析關(guān)鍵技術(shù)研究》、廣州市科技計劃項目《基于信令挖掘的寬帶移動通信網(wǎng)絡(luò) 用戶體驗(QOE)平臺》等
4) 多層次、多渠道的開放型、自主性和創(chuàng)新型實踐教學(xué)
多層次是指實踐教學(xué)分為基本實驗、選做實驗、課程設(shè)計等多個層次。多渠 道是指課堂實踐教學(xué)、課外科研訓(xùn)練實踐、大學(xué)生電子設(shè)計競賽、高校杯、挑戰(zhàn) 杯科技競賽等多種渠道。通過多層次、多渠道的形式實現(xiàn)真正的開放型、自主性和創(chuàng)新型實踐教學(xué),提高學(xué)生創(chuàng)新能力和實踐能力,成績顯著。(近年來指導(dǎo)的 學(xué)生獲得省“高校杯” , “挑戰(zhàn)杯” , “電子設(shè)計競賽”等

課程評價

廣東工業(yè)大學(xué)計算機學(xué)院程良倫教授對本課程教學(xué)效果評價

為: “ 《數(shù)據(jù)挖掘》 課程是我院的廣東省重點課程, 我院一直非常重視, 從資金、人力和資源都給予了相當(dāng)?shù)闹С?。課程組是一支團(tuán)結(jié)協(xié)作、 結(jié)構(gòu)合理的師資隊伍。該課程組的教師愛崗敬業(yè)、有奉獻(xiàn)精神,教師 隊伍學(xué)術(shù)和教學(xué)水平高, 教學(xué)經(jīng)驗豐富。 在教學(xué)過程中, 注意將科研、 教研與教學(xué)相結(jié)合、理論與實踐相結(jié)合,堅持把教書育人放在首位,注意素質(zhì)教育。嚴(yán)格要求,把好課堂教學(xué)關(guān),教學(xué)效果優(yōu)秀,實踐性 教學(xué)環(huán)節(jié)和多媒體特色明顯,深受學(xué)生歡迎和同事們的好評。在省內(nèi) 同類課程教學(xué)中處于領(lǐng)先地位。 對我院其他課程組起到了示范作用。 ”計算機科學(xué)與技術(shù)是省名牌專業(yè), 本課程是計算機專業(yè)選修主干 課程,省名牌專業(yè)評審專家組對計算機專業(yè)(包括本課程)課程建設(shè) 和教學(xué)條件評價高。 校外同行對本課程的建設(shè)和教學(xué)成果及學(xué)生創(chuàng)新 能力等方面也都給予很高的評價:

華南師范大學(xué)計算機系湯庸教授

說: “ 《數(shù)據(jù)挖掘》課程建設(shè)從上個世紀(jì) 90 年**始,課程組就非常 重視,歷時 20 多年,先后有兩代人的投入,做了許多卓有成效的工 作。該課程在 1993 年獲廣東省重點課程,并一脈相承地承擔(dān)了國家

級項目、省教育廳“五個 100 工程”項目、省教育廳“151 工程”項 目等多項教學(xué)研究與教學(xué)改革項目。該課程從教學(xué)大綱編寫、教材選 用、實驗開設(shè)、課件制作到網(wǎng)上教學(xué)資源的運用,都體現(xiàn)出課程組的 優(yōu)良傳統(tǒng)和高效工作成果。這充分反映本課程師資、教學(xué)條件和學(xué)習(xí)環(huán)境優(yōu)越,實踐性教學(xué)環(huán)節(jié)特色明顯,課程建設(shè)成績突出。在現(xiàn)代教 育技術(shù)的利用和多媒體課件的開發(fā)和學(xué)生的綜合設(shè)計能力培養(yǎng)方面 處于國內(nèi)同類院校的領(lǐng)先地位”………。

下面摘錄計算機專業(yè)學(xué)生的部分評價:

獲得全國“挑戰(zhàn)杯”三等獎和省“高校杯”一等獎的 2009 屆學(xué)生陳東銳說“借助極其方便的校園網(wǎng),課下我們可隨時學(xué)習(xí)數(shù)據(jù)挖掘 技術(shù)以加深對課程的印象及重點、難點的理解,尤其是數(shù)據(jù)挖掘的綜合課程設(shè)計使我們對知識的結(jié)構(gòu)化、系統(tǒng)化有了進(jìn)一步的認(rèn)識。我們 的學(xué)習(xí)再也不受時間(課堂 50 分鐘)與空間(教室)的限制,這充 分調(diào)動了我們學(xué)習(xí)的主動性和積極性。另外,它使我們能夠?qū)⒆约核?理解的用設(shè)計的形式表現(xiàn)出來,給了我們一個可以舒展自己的空間, 加強了我們的動手能力和綜合設(shè)計能力, 培養(yǎng)了我們分析與解決問題 的能力, 為我們在歷次的高校杯等競賽中具有明顯優(yōu)勢打下了堅實的基礎(chǔ)。

許龍同學(xué)說: “通過這種方式學(xué)習(xí)數(shù)據(jù)挖掘課程知識,我覺得效 果特別好。彌補了老師課堂上授課內(nèi)容太多過快,學(xué)生不能很好吸收 的缺陷,我們學(xué)生可以通過網(wǎng)絡(luò)課程,根據(jù)自己的學(xué)習(xí)情況適度地學(xué) 習(xí)! ” 。羅聰同學(xué)說: “利用網(wǎng)絡(luò)多媒體進(jìn)行教學(xué),可以使平時一些比較 枯燥的學(xué)習(xí)內(nèi)容變得十分生動有趣,增加了我們的學(xué)習(xí)興趣,使新的
知識很容易被接受,而且能啟發(fā)我們的思維和創(chuàng)造性,培養(yǎng)我們發(fā)現(xiàn)問題、分析問題和解決問題的能力”


劉捷同學(xué)說: “我懷著極大的興趣學(xué)習(xí)《數(shù)據(jù)挖掘》這門課程, 我學(xué)到了很多東西, 加深了我對先前課程的認(rèn)識, 開闊了自己的視野, 最重要的是培養(yǎng)了自己的學(xué)習(xí)興趣和綜合能力, 學(xué)到了很多以前沒學(xué) 到的東西,它能夠發(fā)揮同學(xué)們的空間思維能力和綜合能力,《數(shù)據(jù)挖 掘》課程的學(xué)習(xí)使我覺得大學(xué)這三年來沒有白學(xué)。真希望以后再有這 樣的機會。 ” 陳玲同學(xué)說: “利用多媒體將教學(xué)內(nèi)容以圖、動畫、三維方式展 示出來,能將抽象的理論具體化,避免了枯燥無味的理論學(xué)習(xí),加深 了對新學(xué)內(nèi)容的印象,領(lǐng)會快且深刻。它使新學(xué)知識更容易理解和接 受。對難點重點可反復(fù)學(xué)習(xí),明顯地提高了學(xué)習(xí)和記憶的效果,拓展
了我們的視野,加大了信息量。提高了學(xué)習(xí)效率和學(xué)習(xí)質(zhì)量。

”有同 學(xué)說: “用設(shè)計型教數(shù)據(jù)挖掘課,使我們從被動的學(xué)習(xí)、聽講變?yōu)橹?動的思考問題,并學(xué)以致用。 ”

陳建雄同學(xué)說: “一方面采用這種網(wǎng)絡(luò)多媒體和教學(xué)的相結(jié)合方 式教學(xué),本身就能讓我們實實在在的感受到數(shù)據(jù)挖掘在實際中應(yīng)用,從這一點就能激發(fā)我們學(xué)生的上課興趣。另一方面,課程的內(nèi)容安排 也非常合理,從數(shù)據(jù)挖掘系統(tǒng)模型的整體認(rèn)識,到模型各個層次的系 統(tǒng)講解,同時還涉及了一些近幾年快速發(fā)展起來的數(shù)據(jù)挖掘技術(shù)(如 HADOOP、GFS 等),使我們在掌握數(shù)據(jù)挖掘基本原理的基礎(chǔ)上,對未來技術(shù)的發(fā)展有一定的認(rèn)識,也為以后的工作和技術(shù)開發(fā)打下基礎(chǔ)。數(shù)據(jù)挖掘課程組有多人次獲得全國獎項五項(《數(shù)據(jù)挖掘》獲全 國網(wǎng)絡(luò)與多媒體教育軟件3等獎, 2次獲全國多媒體教育軟件優(yōu)秀獎,


1 次學(xué)生獲全國“挑戰(zhàn)杯”3 等獎);

多人 5 次獲得省級獎項(2 人次獲廣東省科技進(jìn)步 2 等獎,1 次獲省級優(yōu)秀教學(xué)成果 2 等獎,3 次獲省級多媒體教育軟件 1、2 等獎);

學(xué)生多次獲得省級獎項;2 次獲校優(yōu)秀教學(xué)成果獎,14 人次獲校教學(xué)優(yōu)秀獎,1 人次獲校實驗教學(xué)優(yōu)秀獎。獲得優(yōu)秀指導(dǎo)教師 10 余人次, 11 人次獲年度



教學(xué)大綱 Teaching Syllabus

《數(shù)據(jù)挖掘》課程教學(xué)大綱


Data Mining


課程代碼:  課程性質(zhì):專業(yè)方向理論課
適用專業(yè):計算機科學(xué)與技術(shù),軟件工程 開課學(xué)期:
網(wǎng)絡(luò)工程
總學(xué)時數(shù):32 總學(xué)分?jǐn)?shù):2
編寫年月:2004年12月 修訂年月:2013年1月
執(zhí) 筆:滕少華

一、課程的性質(zhì)和目的
本課程是計算機專業(yè)的專業(yè)選修課。本課程的學(xué)習(xí)目的在于使學(xué)生掌握數(shù)據(jù)倉庫的基本概念、基本原理;掌握OLAP技術(shù);掌握數(shù)據(jù)挖掘的基本概念、基本方法和基本技術(shù)。為從事數(shù)據(jù)分析工作及參加數(shù)據(jù)分析工程實踐打下必要的基礎(chǔ)。

二、課程教學(xué)內(nèi)容及學(xué)時分配
第一章 緒論(2學(xué)時)
掌握數(shù)據(jù)挖掘的概念、方法,了解數(shù)據(jù)挖掘任務(wù),了解數(shù)據(jù)挖掘的發(fā)展與展望。
本章知識點為:數(shù)據(jù)挖掘概念,數(shù)據(jù)挖掘任務(wù)。

第二章 數(shù)據(jù)處理基礎(chǔ) (4學(xué)時)
掌握數(shù)據(jù)、數(shù)據(jù)類型概念,了解和掌握數(shù)據(jù)預(yù)處理過程,掌握數(shù)據(jù)清理、數(shù)據(jù)集成和變換數(shù)據(jù)歸約和數(shù)據(jù)離散化。掌握數(shù)據(jù)的相似性及相異性及其計算。
本章知識點為:數(shù)據(jù)、數(shù)據(jù)類型概念數(shù)據(jù)預(yù)處理,數(shù)據(jù)相似性、相異性及其度量。

第三章 分類與回歸(7學(xué)時)
掌握數(shù)據(jù)分類的基本概念,掌握決策樹分類方法、掌握貝葉斯分類方法、掌握k-最近鄰分類方法、掌握回歸分析,了解機器學(xué)習(xí)的分類方法,了解模型的擬合和過度擬合問題。了解評估分類器性能的方法。
本章知識點為:數(shù)據(jù)分類概念,決策樹分類、貝葉斯分類、k-最近鄰分類、機器學(xué)習(xí)、回歸,模型擬合.

第四章 聚類分析(7學(xué)時)
要求理解和掌握常見的聚類分析方法,掌握基于劃分的聚類算法、k-means聚類算法、層次聚類算法、基于密度的聚類算法、一趟聚類算法,了解聚類的評估方法。了解聚類的應(yīng)用。
本章知識點為:聚類分析,K-means均值、層次聚類、基于密度的聚類、DBSCAN,聚類評估。

第五章 關(guān)聯(lián)技術(shù)(6學(xué)時)
掌握Apriori 算法,掌握支持度、置信度、頻繁項集及求頻繁項集的方法,掌握關(guān)聯(lián)規(guī)則及挖掘方法、FP樹及其算法,掌握關(guān)聯(lián)模式的評估。
本章知識點為:關(guān)聯(lián)規(guī)則、Apriori 算法、FP樹、支持度、置信度、頻繁項集。

第六章 離群點挖掘(6學(xué)時)
要求理解和掌握孤立點(離群點)的基本概念,掌握基于統(tǒng)計的方法、基于驅(qū)離的方法、基于相對密度的方法、基于聚類的方法,了解異常檢測基本概念,基本方法,了解異常檢測的應(yīng)用。
本章知識點為:離群點、異常檢測。


三、課程教學(xué)的基本要求
本課程是計算機專業(yè)的專業(yè)選修課程,理論性較強,涉及較多的理論知識及數(shù)學(xué)知識,是本專業(yè)的具有廣闊應(yīng)用前景的理論課程。在教學(xué)方法上,采用課堂講授,課后自學(xué),課堂討論和實踐相結(jié)合的教學(xué)形式。
(一)課堂講授
本課程屬基礎(chǔ)理論課程,涉及到較多的數(shù)學(xué)知識,在講述的過程中教師應(yīng)盡量聯(lián)系生產(chǎn)生活實際,注重物理意義,不要陷入到繁復(fù)的數(shù)學(xué)推導(dǎo)之中。在教學(xué)中要求同學(xué)重點掌握數(shù)據(jù)模型、OLAP技術(shù)、數(shù)據(jù)挖掘方法等基本概念、基本方法和基本規(guī)律,要著重培養(yǎng)學(xué)生定性分析、定量估算和模擬實驗研究的能力,在課程內(nèi)容方面既要保持理論的系統(tǒng)性,又要注意聯(lián)系工程實際,并且重視技術(shù)科學(xué)的一般方法學(xué)的培養(yǎng)。
(二)課后自學(xué)
為了培養(yǎng)學(xué)生整理歸納,綜合分析和處理問題的能力,每章都安排一部分習(xí)題內(nèi)容,課上教師只給出自學(xué)提綱,不作詳細(xì)講解,課后學(xué)生自學(xué)。
(三)課堂討論
課堂討論的目的是活躍學(xué)習(xí)氣氛,開拓思路,。教師應(yīng)認(rèn)真組織,安排重點發(fā)言,充分調(diào)動每一名同學(xué)的學(xué)習(xí)積極性,做好總結(jié)。
(四)習(xí)題課
習(xí)題課以典型例題分析為主,并適當(dāng)安排開闊思路及綜合性的練習(xí)及討論。共2學(xué)時(已包括在前述學(xué)時分配中)。
(五)課外作業(yè)
課外作業(yè)的內(nèi)容選擇基于對基本理論的理解和鞏固,培養(yǎng)綜合計算和分析、判斷能力以及使用計算工具的能力。習(xí)題以計算性小題為主,平均每學(xué)時1-2道題。
(六)實驗
實驗不占學(xué)時,實驗以學(xué)習(xí)數(shù)據(jù)挖掘基本方法和訓(xùn)練實驗?zāi)芰橹?,驗證理論為輔。通過實驗要求學(xué)生掌握數(shù)據(jù)挖掘基本方法。
(七)考試
考試可采用閉卷形式,試題包括基本概念,基本理論,基本方法,題型可采用填空,判斷,計算,簡答等方式。
總評成績:課外作業(yè),平時成績占20%;期末考試占70%;課程類大作業(yè)占10%

四、本課程與其它課程的聯(lián)系與分工 
先修課程:高等數(shù)學(xué)、數(shù)據(jù)庫原理
后續(xù)課程:
五、建議教材及教學(xué)參考書 
[1] 蔣盛益,李霞,鄭琪,數(shù)據(jù)挖掘原理與實踐,電子工業(yè)出版社,2011年8月
[2] Pang-Ning Tan, Michael Steinbach, Vipin Kumar著,數(shù)據(jù)挖掘?qū)д摚?人民郵電出版社,
2006年出版
[3] Jiawei Han,Micheline Kamber,Jian Pan,《數(shù)據(jù)挖掘-概念與技術(shù)》(第3版),機械工
業(yè)出版社,2012年8月
[4] Mehmed Kanttardzic,數(shù)據(jù)挖掘-概念、模型、方法和算法,清華大學(xué)出版社,2003年出

注:1、“課程代碼”由教務(wù)處教研科統(tǒng)一填寫;
2、“課程性質(zhì)”按培養(yǎng)方案的“課程性質(zhì)”及“必/選修”兩欄填寫;
3、“適用專業(yè)”按招生簡章填寫;
4、“開課學(xué)期”指1~8(10)中的數(shù)字,例如“大學(xué)英語”課程的開課學(xué)期為1、2、3、4;

留言板 Message Board
條留言  共

  • 參與互動
    Interaction

  • 掃碼加入課程
    Scan QR Code
需要驗證您的身份,請輸入請求信息:
  • 學(xué)學(xué)號號:
  • 班級選擇:
  • 附注信息:

掃一掃二維碼,快速加入本課程!

放大二維碼 查看使用方法
課程
引導(dǎo)