Re: 本來學ML是該轉路還是繼續鑽研

作者: frouscy (流浪吧。)   2021-03-12 18:03:39
一個ML應用要落地產生商業價值
在data scientist把model訓練出來之後
還有很長一段路才能真正進到生產環境
ML系統的複雜度其實非常高
從資料收集,特徵處理, 模型訓練, 模型測試, 一直到後面的模型部署,模型監測
真正要落地,上面的每一步都會有相對應的系統來做處理
系統要能自動化 要reliable 要scalable 還要能控制ML流程本身的複雜度
而不是說只要跑個jupyter notebook把模型訓練出來test能過就完事了
關於這個議題還是要大推一下2015年的NIPS paper
Hidden Technical Debt in Machine Learning Systems
所以呢 目前可以看到業界職缺的演化是有以下兩種型態
一種是scientist track
另一種是engineer track
scientist就真的需要比較強的數學理解
要能夠有能力訓練出"符合需求"的模型
但是通常這種人系統及程式能力不會這麼強
所以需要engineer來補足
其實scientist track還可以分成偏研究和偏應用的
簡單來說
偏研究的比較像是增加整體公司的技術力 他們會去發paper 數學要真的好 要有研究能力
偏應用的目標則是會更聚焦在商業問題上
他們需要在有限的資源下(時間, 運算資源, etc.)提出解決商業問題的方法
在業界其實大部份搞ML演算法的都比較是這類
工作基本上就是兜兜library套一些現成的演算法
但是也不是說這種人就毫無知識含量
對相關商業domain的深度了解
使他們可以在有限的時間及資源下提出方法解決商業問題
這個就是他們的價值
engineer就比較像是構建最一開始所說的系統的人
做自動化 做scalable feature pipeline 做模型training/testing平台 模型部署
而且真正開始ML落地的公司 線上在跑的很快就不會只有一兩個模型
可能是數十個模型,甚至上百個模型
這就需要專職的engineering team來負責, 包含ML platform dev, 還有MLOps
這樣的工作其實程式和系統的能力會比較重要
比較像是介於傳統data engineer和data scientist之間
也有需要加點一些devops跟backend的技能
做這類工作就不需要對ML演算法及理論有那麼深的理解
知道點high level其實就足以勝任(因為主要是由scientist負責)
但是做這件事軟工的技能就要點得比較高
當然演算法的理解還是會對這個工作有幫助
比如說要做distributed training的系統
那有些ML演算法天生就是是沒辦法平行化
不知道演算法的細節
就可能沒辦法理解天生的限制而最後搞出了不合用的系統
我想說的是 如果數學不好 又想做ML也是可以考慮看看這個方向
隨著ML開始落地的公司愈來愈多 這樣子的職缺也會愈來愈多
如果是剛畢業想走這條路
或許從data engineer開始可能會是可以去嘗試的一條路
可以先沾個邊 在公司裡面再慢慢點上面我說的技能
※ 引述《ckrmpuhv (阿瓜)》之銘言:
: 各位板上大大好
: 小弟是後段國立科大資管碩即將畢業
: 因為一些私人原因是不用當兵
: 所以論文完成後準備開始找工作
: 目前程度:
: 大學學過JAVA
: 網頁跟資料庫也只有課堂學習過沒實際做小專案
: 因為對Ml有興趣
: 在碩階段期間 都是自學ML相關
: 聽過李宏毅老師的課
: 實作過他課程的作業
: Keras的一些神經網路搭建也沒捨問題
: Kaggle只參加過一兩次 排名都很爛
: 大部分的實作和論文都是跟影像辨識相關
: 最近看板上大大各式各樣建議
: 非四大四中 也不是kaggle的佼佼者
: 數學方面 線代沒學 統計學大學學過但也不熟
: 看完覺得自己很爛出去可能沒人要?
: 目前都還在做ml各種模型實作
: 但看完板上很迷茫要往哪些方向學習怕找不到工作非常憂鬱
: 我不清楚該橫向發展拓別的領域
: 像是網頁、App 自己做一些小專案增加作品集
: 還是去補數學 更深入研究Ml
: 又或者先去刷Leetcode打底
: 還請各位大大指教 謝謝
:
作者: aa77a ( )   2021-03-12 18:32:00
說得不錯 前一個在蝦七八亂 XD
作者: KingSteven (HHung)   2021-03-12 18:51:00
推!不過台灣稱得上Scientist的職位太少QQ 畢竟沒有FAANG那種規模……可能大多都是把現有ML方法拿來用,而不是開創新的ML方法
作者: IcecreamHsu (冰淇淋)   2021-03-12 19:00:00
推 寫得很好 MLOps 是趨勢
作者: drajan (EasoN)   2021-03-12 19:12:00
歡迎大家加入MLOps 的行列!業界很缺人喔開創新的ML模型要有商業價值 目前大多數場景用既有的框架就好 真正難度往往是系統落地真正運作在 production上
作者: andy5656 (andyandy)   2021-03-12 19:16:00
推 蠻清楚的台灣我看有些公司還是會去發paper 只是可能不多就是了
作者: drajan (EasoN)   2021-03-12 19:22:00
如果是真正想研究ML模型 基本一定要有 PhD(或是極出類拔萃的master) 以及做的研究業界要用的到才有機會真的進業界做ML research. 像我們團隊就跟很多學校鑽研 private ML的學者合作 有些團隊成員也是直接從學界加入的 像現在這種 research scientist職位競爭超級激烈 沒有三兩三連面試機會都沒有 所以大家說你做 engineer會簡單很多不是沒道理的
作者: tay2510 (Tay)   2021-03-12 19:35:00
大推這篇,講得非常貼近目前的ML現實。前一篇有點以偏概全,反而容易混淆視聽。同場推2014 NIPS Google的MachineLearning: The High Interest Credit Card of TechnicalDebt
作者: ckrmpuhv (阿瓜)   2021-03-12 19:46:00
了解感謝大大 我會在好好琢磨
作者: DarkIllusion (′・ω・‵)   2021-03-12 20:10:00
你說的沒錯
作者: robinlee   2021-03-12 23:40:00
這篇才是業界真實生態,感謝分享
作者: mmonkeyboyy (great)   2021-03-13 01:44:00
這個是比較實在的業界生態 @[email protected]~ 還是要能賺錢先前一篇就是那種去面試喜歡沒事問各種名詞的人其實學界業界很多這種人@[email protected]~ 目前要的其實是這篇講的兩種人混合 可惜的是這種人在業界也沒幾個純 ml研究燒錢外效果也不是特別好 只能說海水退了就知道誰沒穿褲子 想走ml進隊只能說超難了就我自己的團隊跟業界合作伙伴 也是套模型&DE但能套到讓一些公司掏錢做就好了啊
作者: bowin (盡其在我)   2021-03-13 03:55:00
推好文分享
作者: taipoo (要成功要積極)   2021-03-13 04:03:00
推好文
作者: rtoday (rtoday)   2021-03-13 04:10:00
作者: loter (therefore....)   2021-03-13 05:39:00
推ML大神廖大!
作者: shiauji (消極)   2021-03-13 08:54:00
感謝分享
作者: rereterry (rereterry)   2021-03-13 09:15:00
推,確實越來越有如此分工的傾向,不過行有餘力,往對方的技能點個一點有深一點的理解對自己的職涯還蠻有幫助的
作者: mmonkeyboyy (great)   2021-03-13 09:44:00
裡面還有一個workshop就是 MLOps現在這遊戲就是燒錢 有機器有卡的大聲 看看某學校不過真要做成系統除了理論外 還有蠻多"實際"的問題這些才是真正讓ml能不能用的關鍵
作者: PHEj (Vino)   2021-03-13 10:02:00
推這篇~~
作者: fig498 (一起前進!)   2021-03-13 11:59:00
感謝大大分享!!
作者: AgileSeptor (S.Duncan_JB)   2021-03-13 12:16:00
作者: KingSteven (HHung)   2021-03-13 17:00:00
再推一次~感謝原po耐心回覆小弟的推文,講的很好!
作者: blackmaninEE (黑人電機機)   2021-03-14 01:57:00
作者: lerdor (Lerdor)   2021-03-14 11:45:00
大學畢業在高雄時才三萬初...
作者: Chita5566 ((Chita))   2021-03-14 15:54:00
講得很好
作者: adrian2266 (xcx)   2021-03-17 10:09:00
優文推
作者: answerseeker (神燈)   2021-03-18 12:39:00
ElementAI 已經掛了吧 推這篇
作者: meRscliche (如此而已)   2021-03-18 23:59:00
推推
作者: keepgoing99 (Fireex)   2021-03-21 14:32:00
推推

Links booklink

Contact Us: admin [ a t ] ucptt.com