OpenEdu | 中華開放教育平台

【110-1】給語言學家的Python程式設計
【110-1】給語言學家的Python程式設計
註冊課程
開課機構
國立中正大學
課程分類
人文藝術
課程子類
語言
學習時數
每週3小時
上課語言
中文
字幕語言
無字幕
修課費用
免費
吳俊雄
吳俊雄
國立中正大學
教授兼所長
主要經歷
國立中正大學語言學研究所 教授兼所長
國立中正大學語言學研究所 教授
國立中正大學語言學研究所 副教授

課程簡介

語言學及語言教學研究仰賴充足的語料與語料分析,而語料的數量大到某個程度,純然依靠人力來檢視語料,是一件相當不容易的事。本課程有以下兩個的目的:(一) 對程式語言 Python做一個較完整的介紹,(二) 介紹幾個對語言學研究具實用性的模組(module),包括:re (可以對語料庫做自訂的任何種類搜尋,包括關鍵字搜尋),用scipy及/或statsmodel來進行Logistic Regression、t-test、ANOVA、chi-square等統計,pandas (資料儲存),Numpy(描述性統計),matplotlib(繪製統計圖表),等。
本人在敝所開設一系列利用Python來進行計算語言學研究的課程,在每門課程中,都要介紹使用到的Python及某個/些套件,但,礙於教學時間、目標的限制,無法對Python的各個部份做較詳細的介紹。本門課程的目標就在填補此一空缺,故對其他課程有互補的效果。
 

課程目標

本課程教學目標如下:(一) 對Python做相對詳細的介紹;(二) 介紹re、scipy及/或statsmodels中的logistic regression、t-test、chi-square、ANOVA等統計、pandas、numpy、matplotlib等套件。這兩個教學目標符合上述各點,因為學生可以學習Python,培養程式設計所需的各種邏輯、運算等能力,亦同時訓練進行運用大數據來進行研究、使用學習新型工具、數位展示及自主學習的能力;(三) 將程式設計能力運用於語言學、華語教學之研究與實務運用。

適用對象

1. 語言學研究所學生 (包括語言學組及華語教學研究組)
2. 對Python及上述套件有興趣的非資訊科系大學部高年級學生

課程特色

Python及其套件,如,re、pandas、Numpy、matplotlib及可執行logistic regression、t-test、chi-square、ANOVA等統計的scipy(及/或statsmodels)函式等

課程進度

CH1 課程大綱說明;安裝 miniconda 及建立虛擬環境 Basic、在虛擬環境中安裝Python、Spyder、Jupyter Notebook;Python程式檔的建立、儲存與開啟;認識變數與基本數學運算
CH2 認識變數與基本數學運算(Cont’d);Python的基本資料型態
CH3 Python的基本資料型態 (Cont’d);基本輸入與輸出
CH4 基本輸入與輸出 (Cont’d)
CH5 程式控制流程:if 敍述、迴圈;表列(串列 List)
CH6 表列(串列 List) (Cont’d)
CH7 有序對(元組 tuple);字典 (dictionary)
CH8 字典 (dictionary) (Cont’d);集合
CH9 迴圈;設計與應用模組;函式設計;演講:What is a linguist outside of Academia/ 中國信託商業銀行 曾文忻數據分析師
CH10 函式設計 (Cont’d);演講:華語歌曲之情感分析:男女大不同?/ 國立台灣師範大學英語系 陳政賢副教授
CH11 函式設計 (Cont’d);類別(Class)
CH12 類別(Cont’d);檔案路徑及錯誤處理等
CH13 設計與應用模組;檔案的讀取與寫入;Try … Except (錯誤、例外的處理)
CH14 正則表達式 (re);ckiptagger介紹;numpy簡述
CH15 pandas
CH16 數據圖表的表達 (matplotlib)
CH17 期末專題口頭報告
CH18 期末專題繳交截止日(期末考週)