該課程分為數(shù)據(jù)挖掘理論和數(shù)據(jù)挖掘?qū)嵺`兩大部分。數(shù)據(jù)挖掘理論部分的主要內(nèi)容包括數(shù)據(jù)挖掘的基本概念、數(shù)據(jù)預(yù)處理、聚類分析、分類與回歸、關(guān)聯(lián)規(guī)則挖掘、離群點(diǎn)檢測(cè)。數(shù)據(jù)挖掘?qū)嵺`部分討論了數(shù)據(jù)挖掘在文本挖掘、金融等領(lǐng)域中的應(yīng)用;通過(guò)基于內(nèi)容的垃圾郵件識(shí)別、虛假新聞檢測(cè)、新冠疫情的情緒分析等案例展示了數(shù)據(jù)挖掘在文本挖掘方面的應(yīng)用;通過(guò)潛在貸款客戶挖掘、貸款違約等案例展示了數(shù)據(jù)挖掘在金融領(lǐng)域的應(yīng)用。