該課程分為數(shù)據(jù)挖掘理論和數(shù)據(jù)挖掘實踐兩大部分。數(shù)據(jù)挖掘理論部分的主要內容包括數(shù)據(jù)挖掘的基本概念、數(shù)據(jù)預處理、聚類分析、分類與回歸、關聯(lián)規(guī)則挖掘、離群點檢測。數(shù)據(jù)挖掘實踐部分討論了數(shù)據(jù)挖掘在文本挖掘、金融等領域中的應用;通過基于內容的垃圾郵件識別、虛假新聞檢測、新冠疫情的情緒分析等案例展示了數(shù)據(jù)挖掘在文本挖掘方面的應用;通過潛在貸款客戶挖掘、貸款違約等案例展示了數(shù)據(jù)挖掘在金融領域的應用。