91一级特黄大片|婷婷中文字幕在线|av成人无码国产|日韩无码一二三区|久久不射强奸视频|九九九久久久精品|国产免费浮力限制

課程簡介 Course Introduction

(一)課程的性質、地位、作用和任務

《數(shù)據(jù)科學與大數(shù)據(jù)技術導論》課程是運用概率統(tǒng)計、分布式計算、現(xiàn)代軟件等綜合知識探索來自商業(yè)貿易,生物醫(yī)療,金融證券,社交網(wǎng)絡等眾多領域的較大規(guī)?;蚪Y構復雜數(shù)據(jù)集的高效存儲、高效管理、高效概括、深入分析和精準預測的科學和藝術。它是現(xiàn)代計算機科學教育中的一門核心課程,是一門跨計算機、統(tǒng)計學和數(shù)學領域的學科,它是計算機各專業(yè)、信息專業(yè)和其他一些與計算機技術關系密切專業(yè)的必修的基礎課程。

它的任務是討論現(xiàn)實世界中的各種邏輯結構、在計算機中的存儲結構以及實現(xiàn)各種操作的算法問題,為今后進一步學習后續(xù)專業(yè)課程、進行軟件開發(fā)和應用打好基礎。

(二)教學目的和要求

《數(shù)據(jù)科學與大數(shù)據(jù)技術導論》是一門理論和實踐緊密結合的基礎課,也是大數(shù)據(jù)技術應用的基石課程,其教學目標是運用統(tǒng)計分析、機器學習、分布式處理等技術,能從大量數(shù)據(jù)中提取對科學研究和生產(chǎn)實踐有意義的信息,以可視化等技術通過通俗易懂的形式傳達給決策者,為后續(xù)大數(shù)據(jù)技術的相關專業(yè)課學習打良好基礎。

(三)課程教學方法與手段

本課程應采用面授講解為主、指導學生自學為輔的教學方法,利用多媒體教學手段,制作條理清晰的PPT投影和動態(tài)的算法跟蹤動畫,加強學生對算法的理解。同時,開始對應的實驗指導課程,提高學生的動手操作能力。

(四)課程與其它課程的聯(lián)系

《數(shù)據(jù)科學與大數(shù)據(jù)技術導論》課程的先修課程是《概率論和數(shù)理統(tǒng)計》 、《數(shù)據(jù)結構》和《操作系統(tǒng)》,其中,《概率論和數(shù)理統(tǒng)計》提供了數(shù)據(jù)分析所需用到的基本數(shù)學模型和分析方法,為學生數(shù)據(jù)分析提供重要的理論基礎?!稊?shù)據(jù)結構》闡釋了數(shù)據(jù)在計算機中的組織結構,讓學生在進行數(shù)據(jù)分析時能通過結構的轉換了解數(shù)據(jù)的本質?!恫僮飨到y(tǒng)》讓學生了解計算機基本存儲結構和進程調度原理,為學生學習分布式計算提供重要的理論依據(jù)。本課程是后續(xù)課程如《機器學習與數(shù)據(jù)挖掘》、《分布式數(shù)據(jù)庫》、《大數(shù)據(jù)處理和數(shù)據(jù)分析技術》的基礎,這些專業(yè)課中涉及的數(shù)據(jù)的組織和處理方法正是本課程的內容。

(五) 教材與教學參考書

教材:朝樂門,《數(shù)據(jù)科學理論與實踐》,清華大學出版社,201710月。

教學參考書:

托馬斯.埃爾,《大數(shù)據(jù)導論》,機械工業(yè)出版社,20176月。

美國EMC教育服務團隊,《數(shù)據(jù)科學與大數(shù)據(jù)分析:數(shù)據(jù)發(fā)現(xiàn) 分析 可視化表示》,人民郵電出版社,20167月。

教學大綱 Teaching Syllabus

1章緒論

1.1術語定義

1.2研究目的

1.3發(fā)展簡史

1.4理論體系

1.5基本原則

1.6如何成為數(shù)據(jù)科學家

重點:掌握數(shù)據(jù)科學的理論體系,了解數(shù)據(jù)科學與大數(shù)據(jù)技術的發(fā)展歷史。

難點:據(jù)科學與大數(shù)據(jù)技術的跨學科特性,掌握本門學科的學習方法。

2章數(shù)據(jù)科學與大數(shù)據(jù)技術的理論基礎

2.1數(shù)據(jù)科學的學科地位

2.2統(tǒng)計學

2.3機器學習

2.4數(shù)據(jù)可視化

重點:重溫《概率論與數(shù)理統(tǒng)計》的基本原理。

難點:理解監(jiān)督學習和無監(jiān)督學習的基本原理,掌握基本算法的編程。

3章大數(shù)據(jù)加工和分析流程與方法

3.1基本流程

3.2數(shù)據(jù)加工

3.3數(shù)據(jù)審計

3.4數(shù)據(jù)分析

3.5數(shù)據(jù)可視化

3.6數(shù)據(jù)故事化

3.7項目管理

重點:掌握數(shù)據(jù)預處理的基本流程,掌握數(shù)據(jù)加工、數(shù)據(jù)審計、數(shù)據(jù)分析、數(shù)據(jù)可視化等常見處理手段。

難點:掌握數(shù)據(jù)預處理的基本流程,掌握數(shù)據(jù)加工、數(shù)據(jù)審計、數(shù)據(jù)分析、數(shù)據(jù)可視化等常見處理手段。

4章大數(shù)據(jù)加工和分析所用到的技術與工具

4.1技術體系

4.2MapReduce

4.3Hadoop

4.4Spark

4.5NoSQLNewSQL

4.6RPython

4.7發(fā)展趨勢

重點:掌握Python、R、MapReduceSpark等大數(shù)據(jù)加工和分析的使用。

難點:理解分布式計算的優(yōu)勢,掌握Python、R、MapReduce、Spark等大數(shù)據(jù)加工和分析的使用,并利用這些工具進行基本大數(shù)據(jù)分析。

5章大數(shù)據(jù)產(chǎn)品的設計與開發(fā)

5.1定義

5.2主要特征

5.3關鍵活動

5.4數(shù)據(jù)柔術

5.5數(shù)據(jù)能力

5.6數(shù)據(jù)戰(zhàn)略

5.7數(shù)據(jù)治理

重點:掌握大數(shù)據(jù)應用設計和開發(fā)方法,理解數(shù)據(jù)治理的基本原理。

難點:掌握大數(shù)據(jù)應用設計和開發(fā)方法,理解數(shù)據(jù)治理的基本原理。

6章大數(shù)據(jù)典型案例分析及實踐

6.12012年美國總統(tǒng)大選

6.2統(tǒng)計分析

6.3機器學習

6.4數(shù)據(jù)可視化

6.5SparkR編程

重點:掌握前面學到的工具、算法進行基本數(shù)據(jù)分析,并完成數(shù)據(jù)可視化操作。

難點:工具、算法與應用相結合的大數(shù)據(jù)應用應用開發(fā)。


留言板 Message Board
條留言  共

  • 參與互動
    Interaction

  • 掃碼加入課程
    Scan QR Code
教學隊伍Teaching Members
  • 羅家輝
    高級工程師
    廣州大學
  • 高靜
    正高級
    廣東恒電信息科技股份有限公司
請輸入以下信息:
  • 學號號:
  • 班級選擇:

掃一掃二維碼,快速加入本課程!

放大二維碼 查看使用方法
課程
引導