OpenEdu | 中華開放教育平台

大數據平行計算
開課機構
國立中山大學
課程分類
資訊工程
課程子類
電腦
學習時數
每週1小時
上課語言
中文
字幕語言
無字幕
修課費用
免費
鄭孟玉
鄭孟玉
大葉大學
副教授

本課程授課教師為鄭孟玉老師,畢業於逢甲大學商學博士主修會計與財稅,目前任職於大葉大學財務金融學系副教授。
鄭老師曾任:

  1. 教育部數位學習種子教師
  2. 經濟部中小企業財務顧問師
  3. 中小企業財務主管
  4. Project Management Professional(國際專案管理師)
  5. 個案高階講座師資
  6. BI規劃師
  7. ERP財務模組顧問師
  8. ERP配銷模組應用師

鄭老師具有豐富的業界實務經驗及豐厚的財務會計理論背景,定能透過專業的教學經驗,融合小說情節以淺顯易懂的方式帶領學生,瞭解深奧複雜的財報分析知識

課程簡介

近年來,大數據已變成相當熱門的話題,而要如何在電腦資源有限的情況下去處理過大的資料呢?此時平行計算就成為了相當重要的技術。本課程將會介紹平行計算的基本觀念以及針對不同型態下的大數據資料,要如何使用Apache Hadoop,Greenplum PostgreSQL, Apache Spark等不同的工具去對該數據進行統計相關的處理分析,此外我們還將介紹如何使用MapReduce將資料分散至不同CPU計算並回傳的方法,達到計算上更快速簡便的結果。

課程目標

課程將學習使用平行計算的數據分析工具,包含Apache Hadoop, Greenplum PostgreSQL, Apache Spark等,我們還將介紹一些常用的數據分析資料庫,如MADlib,MLlib的使用方法,使得學生能輕鬆駕馭大數據平行計算工具

適用對象

大學以上

課程特色

1.重視原理:講解電腦中的平行計算是如何發生的

2.強調實作:教學各種工具如何安裝以及使用

課程進度

課程進度
第1週:分散式檔案系統概論

第2週:MapReduce

第3週:MapReduce實例運用

第4週:迴歸分析 / 淺談資料庫

第5週:分散式資料庫及其應用

第6週:Spark 分散式計算平臺

第7週:R與Spark的實例介紹

第8週:期末報告