本課程授課教師為鄭孟玉老師,畢業於逢甲大學商學博士主修會計與財稅,目前任職於大葉大學財務金融學系副教授。
鄭老師曾任:
鄭老師具有豐富的業界實務經驗及豐厚的財務會計理論背景,定能透過專業的教學經驗,融合小說情節以淺顯易懂的方式帶領學生,瞭解深奧複雜的財報分析知識
近年來,大數據已變成相當熱門的話題,而要如何在電腦資源有限的情況下去處理過大的資料呢?此時平行計算就成為了相當重要的技術。本課程將會介紹平行計算的基本觀念以及針對不同型態下的大數據資料,要如何使用Apache Hadoop,Greenplum PostgreSQL, Apache Spark等不同的工具去對該數據進行統計相關的處理分析,此外我們還將介紹如何使用MapReduce將資料分散至不同CPU計算並回傳的方法,達到計算上更快速簡便的結果。
課程將學習使用平行計算的數據分析工具,包含Apache Hadoop, Greenplum PostgreSQL, Apache Spark等,我們還將介紹一些常用的數據分析資料庫,如MADlib,MLlib的使用方法,使得學生能輕鬆駕馭大數據平行計算工具
大學以上
1.重視原理:講解電腦中的平行計算是如何發生的
2.強調實作:教學各種工具如何安裝以及使用
課程進度
第1週:分散式檔案系統概論
第2週:MapReduce
第3週:MapReduce實例運用
第4週:迴歸分析 / 淺談資料庫
第5週:分散式資料庫及其應用
第6週:Spark 分散式計算平臺
第7週:R與Spark的實例介紹
第8週:期末報告