[評價] 110-1 陳建錦文字探勘初論 unmolk PTT批踢踢實業坊

[評價] 110-1 陳建錦文字探勘初論

作者: unmolk (UJ) 2022-01-30 03:12:05

※ 本文是否可提供臺大同學轉作其他非營利用途？（須保留原作者 ID）
（是／否／其他條件）：是
哪一學年度修課：
110-1
ψ 授課教師 (若為多人合授請寫開課教師，以方便收錄)
陳建錦
λ 開課系所與授課對象 (是否為必修或通識課 / 內容是否與某些背景相關)
資管系選修
商資學程（？）選修
δ 課程大概內容
Text Proeprocessing
Term Weighting and Vector Space Model
Text Classification
Naive Bayes Classification
Vector Space Classification (KNN, linear and nonlinear classification, SVM)
Flat Clustering
Hierarchical Clustering (including K-Means)
Latent Semantic Analysis
Word Vectors (including BERT introduction)
Language Models
Deep Learning for Text (W2V embedding, RNN)
Ω 私心推薦指數(以五分計) ★★★★★
想學會使用文字探勘的套件：★★★★☆
想知道文字探勘能用來做什麼：★★★★☆
想學得很扎實：★★★
η 上課用書(影印講義或是指定教科書)
老師自編講義
但很多內容是從 Stanford NLP Group 網站上找下來的ＸＤ
μ 上課方式(投影片、團體討論、老師教學風格)
投影片講解，搭配程式操作（使用jupyter notebook）。
這學期疫情關係有錄影，後來可以實體上課時有恢復實體授課。
老師講得很清楚，而且不會很快，下課有不清楚都可以問，加上這門課導論性質很重，學
習品質應該很好。
σ 評分方式(給分甜嗎？是紮實分？)
三次作業共30%（7.5/11.25/11.25）、期末考35%、期末專案35%。
應該算甜，作業基本上可以拿滿，期末考給分有點謎（我沒去閱卷但比我想像中的低，身
邊的朋友也拿得偏低），平均27.5/35。
期末專案給分算不錯，平均31.5/35，而且不會花很多時間，主要時間應該都在處理資料
跟選模型？我是拿快33，不過期末報告不是最高分讓我有點想見識看看最高分的報告到底
寫了什麼ＸＤ
ρ 考題型式、作業方式
作業：
三次程式作業，第一份是做text preprocess後計算文本的TFIDF；第二份是做classifica-
tion，分別用Naive Bayes/SVM Linear/SVM Kernal做，再把結果丟上Kaggle；第三份也
是做classification，只是是使用word embedding，也是丟上Kaggle。三次作業都要交一
份報告跟source code，注意source code要能reproduce在助教那邊，所以在報告內要把
需要的環境與套件寫好，或是直接寫一份requirements.txt包在作業檔案夾內，總之寫清
楚、讓助教可以跑你的code就沒事了。
考試：
只有一份期末考，題目都是簡答題、名詞與模型解釋什麼的滿符合課程的設計，覺得沒有
很難，期末考前再準備也來得及，至少我是期末考當天凌晨才開始讀，只讀講義，最後拿
78。
專案：
內容與文字探勘有關係的就好，有人做電影的評價之類的，我們這組是做社交媒體上的政
治情感分析，有使用到的技術大概是BERT、DNN，和一些人家寫好的情感分析套件，最後寫
了六頁左右的報告，結果也滿不錯的。原本以為應該是最高分沒想到不是，有夠氣ＸＤＤ
專案基本上比較花時間的應該是想題目以及處理資料，會爬蟲的話佳，但不會的話上
kaggle之類的拿現成資料應該也可以？
ω 其它(是否注重出席率？如果為外系選修，需先有什麼基礎較好嗎？老師個性？
加簽習慣？嚴禁遲到等…)
沒有出席分，會寫python、數學會條件機率就夠了。
加簽的話有優先順序，商資學程優先加簽，資管本系會被趕去上另一個比較難的班，最後
應該簽到100多人。
Ψ 總結

作者: jamestsai1 2022-07-02 09:57:00

會寫R 但不會寫python 不知道會不會負擔很大？

繼續閱讀

[評價] 110-1 林軒田機器學習fshjlin [評價] 110-1 吳儀玲金融市場與衍生性商品 KurtZouma [評價] 110-1 廖天威全民國防教育軍事訓練課程KurtZouma [評價] 110-1 蔡宜展總體經濟學上dustin212 [通識] 110-1 A58* 梁庚辰普通心理學kso22o [評價] 110-1 李宏毅工程數學-線性代數folksuite [通識] 110-1 蘇宏達 A3 認識歐洲與歐洲聯盟（代po）aoc9889 [通識] 110-1 劉有恆 A5 議事學aoc9889 [評價] 110-1 傅楸善電腦視覺LuenLuen [評價] 109-2 李明穗工程數學Lyu7

[評價] 110-1 陳建錦 文字探勘初論

[評價] 110-1 陳建錦文字探勘初論