作者:
sxy67230 (charlesgg)
2025-08-06 08:13:32看你想走應用還是理論面,應用面如果只是你有一個ideal想做,務實一點就是找個閉源或
開源的LLM(vLLM)架起來,Prompting調一調大部分能力可能都比你傳統模型來的好太多了。
如果是應用想做深一點之類的,大概就大金->李沐那些聽一聽,想再涉及ML一點就吳恩達->
軒田。
如果還想要再深一點就需要涉及理論數學知識而且這時候就分面向了。
模型的部分數學會佔更重,尤其是線性代數,最多再一點點機統跟最佳化理論,現代的DL其
實反而不會太強調很硬的統計或非凸最佳化,大多假設DL在自監督後天然的就從海量數據中
提取了某些自然分佈。除非你真的有興趣到爆就可以往DL的最核心基礎理論邁進,那還會需
要一些消息論去探討模型壓縮跟模型內部學習時候的非凸優化轉換(high entropy 跟low e
ntropy LLM 可能會是一個很有趣的問題)。
如果是想就業的話,我自己會覺得接下來比較熱門的面向就是GPU optimization跟LLMOps,
前者主要就是要非常懂GPU計算底層,包含如何實作GPU併行,可能同事有基礎的LLM模型你
要把這個prototype implement進某些極端Edge的環境,後者就涉及分散式伺服器架構如何
架構帶有GPU群集的分散式server用來做training跟inference,雖然說離核心LLM/DL理論很
遠,但我認為是就業市場未來最穩的。
這邊補充一下,很多人覺得AI要很硬的數學才能發Paper,但是從去年ICLR的一些收錄文章
看其實現在不少Multi Agent的應用類,關鍵在於你有很好的智能體實作想法,然後再理論
系統性的描述做消融實驗。這些不見得涉及數學知識,就是要去研究能有什麼方式系統性的
開發智能體。
差不多4醬