交通大學語言學碩士,台灣大學工程科學與海洋工程研究所資訊組博士肄業,台灣 PYTHON 程式語言發展委員會成員。具有十年以上自然語言處理工具開發經驗,致力於推動具有因果推理能力的 “ROBUST AI” 技術,結合「機器學習」以及「符號邏輯 (或是資訊領域常說的 RULE-BASED)」的 HYBRID AI 方向。擁抱「融合式 AI」的態度,以「解決問題」為導向,追求實際落地的應用是卓騰語言科技採行的發展方向。
本教材以在文學領域相當重要的文本分析作為主軸,引導學生了解文本分析的重點及模式。利用ArticutAPI這個套件,幫助學生進行文本分析,透過各種不同面向的文本分析,來幫助學生更快速且方便的分析文本。
希望透過這堂課讓學生更加瞭解文本,也能夠善用工具進行解析。
未具備程式能力或具備初階程式能力的學生
將文本分析結合ArticutAPI實現更進一步的跨域結合
1. 斷詞
2. 特徵詞擷取: TF-IDF 與詞性
3. 特徵詞擷取: 人事時地物
4. 文本分類應用