Re: [請益] 想從零開始轉行當AI軟體工程師

作者: k300plus (300plus)   2021-11-12 20:49:56
嘛,看到這標題,身為本命愛蜜莉雅的肥宅工程師也來鼓勵(?)分享一下
本肥在112讀大學時修過CSIE田神的ML
猶記得當初只會寫C/C++的自己
在沒人提示的情況下,矇逼的手刻各種矩陣運算,一個作業寫了上千行code
在EE的繁重課業下忍痛停休
然而還是有去把整學期的課聽完,說實話ML/AI背後的數學理論真的收穫很多
後來讀碩班時正好就是李鴻毅開ML的第一年
我也才第一次接觸到python這個暴力且強大的直譯語言
除了有超多數學相關的lib能夠無腦call爆外,最重要的還是處理data的能力
那時瞬間搞不懂自己大學修ML時到底在瞎忙什麼
如果有個拿著流星鎚的藍髮女僕
我會跪求他馬上砸死我,讓我re到大學時期的德田館www
隨著前兩次的作業結束,覺得寫python也太簡單爽快,突然發現自己好想往ML/AI發展
然而學期後半段進入了類神經網路後,一切開始風雲變色
第三次作業的data再怎麼前處理,模型layer再怎麼疊,kaggle上的分數始終慘輸
太無情了,我的信心似乎崩潰了
最後作業結束時,記得老師請前幾名的同學上台分享他們怎麼做的
結果...我震撼了
上台分享的同學大致上也都是亂疊亂串一通,然後分數就突然超高而已
從此,我的AI夢好像也就嘎然而止了
時光荏苒,轉眼間我已是在豬屎屋挑屎挑了三年的肥肥工程師
即使工作內容完全與AI無關
但李鴻毅的那門ML卻是深深的影響著我
自家產品的log項目亂七八糟怎麼辦? python讀出來分類啊
一堆沒用的骯髒數據怎麼辦? 用python踢掉啊
別人給的excel/csv格式排版不是我想要的怎麼辦? python重新輸出啊
反正數據處理方面,python根本神到翻天
再搭配shell語法,各種雜事過來就是一切先自動化處理再說
其實我也不知道別人是怎麼做
但有這些tool對我分析數據上來說就是如虎添翼
但要是我沒修過ML,學到python的處理資料能力
搞不好我現在就還是在用C或人工在處理資料
也許AI風潮不再那麼狂熱,如果AI有顏色那一定是過氣的藍色
但還是很鼓勵可以去接觸看看,也許也能像本肥一樣收穫良多 > <
甚至我認為各個領域都非常有機會運用到處理資料的能力
而透過ML/AI去學習如何處理資料是非常好的一個方式 (燦笑
作者: stmilk (我男的)   2021-11-12 21:03:00
屌耶,就像賈伯斯旁聽字體美學一樣,命運就是這麼神奇
作者: Morphee (千磨萬擊還堅勁)   2021-11-12 22:02:00
你講的那些處理 perl跟tcl/tk 不是都玩到爛了?
作者: j0958322080 (Tidus)   2021-11-12 22:26:00
結果你講的是 python 有多強不是 AI 阿不過說實在的很多 library 底層還是 C 實作才快有些甚至還是 Fortran
作者: mmonkeyboyy (great)   2021-11-12 22:32:00
fortran是沒辦法
作者: drajan (EasoN)   2021-11-12 22:36:00
快很好 但正確 易用 才有市場Speed is irrelevant if you are going in the wrong direction.
作者: leo08210917 (leo)   2021-11-12 22:48:00
這篇是在說 在豬屎用python打雜混的比做ai好嗎XD
作者: viper9709 (阿達)   2021-11-12 23:42:00
推拿流星槌的藍髮女僕(誤)
作者: yamakazi (大安吳彥祖)   2021-11-13 00:07:00
底層Fortran?Python 底層是C沒錯,但底層Fortran我見識少還真沒聽過
作者: j0958322080 (Tidus)   2021-11-13 00:29:00
之前看線性代數有用到 lapack 裡面有 Fortran 的語法
作者: LincolnBoy   2021-11-13 00:30:00
Fortran好懷念 好久沒寫了
作者: mmonkeyboyy (great)   2021-11-13 01:02:00
那一堆線代解的裡面很多都有fortran不信你下次compile時不要叫 gfortran看看立馬死一堆XD
作者: wahaha279 (哇哈哈:3)   2021-11-13 01:18:00
去搞懂直譯的意思 而不是在那邊我見識少
作者: shownlin (哈哈阿喔)   2021-11-13 01:59:00
Kaggle有時候真的就是比模型本身的強度有的模型就是特別適合拿來打比賽用對模型基本上分數就會飆上去剩下的就一些細節在那邊看能不能多拼個幾分之前修軒田的final project有感看leader board前面有些組很好心submit還會附上自己用什麼模型XD
作者: yamakazi (大安吳彥祖)   2021-11-13 09:47:00
我知道有些科學計算用Fortran 啊,我的意思是,有多少主流套件,或程式,或OS底層是用Fortran?印象中幾乎沒有或者本系列主題是AI,有多少搞AI工具底層是Fortran寫的?
作者: hprince (工口王子)   2021-11-13 10:09:00
結果簽名檔沒放愛蜜莉雅
作者: yamakazi (大安吳彥祖)   2021-11-13 10:10:00
而且現在科學計算主流不是幾乎都python和matlab了?
作者: mmonkeyboyy (great)   2021-11-13 11:10:00
Blas裡還有fortran 77 沒死透 而且有幾個還比c快 就被留下來了你如果說的科學計算是量子電腦 那python 是 超級電腦類 python 用很少很少 matlab 就 算了吧解數值的 FORTRAN 活的很好呢 只是包住你看不到拿cpu 解DL的 fortran 也用到很多 GPGPU 我猜也有
作者: yamakazi (大安吳彥祖)   2021-11-13 11:50:00
沒死透不就代表死的差不多了?死的剩一口氣而已
作者: j0958322080 (Tidus)   2021-11-13 11:55:00
看你怎麼定義啊,如果那幾個函式被呼叫的次數是高過其他用 python 寫的好幾個數量級算嗎?
作者: yamakazi (大安吳彥祖)   2021-11-13 12:13:00
我就只是好奇到底多少底層用Fortran寫的現在還在用就是了
作者: j0958322080 (Tidus)   2021-11-13 12:15:00
你去看看哪些呼叫 blas 阿
作者: yamakazi (大安吳彥祖)   2021-11-13 12:27:00
看起來就是特定領域的少數套件才會用到底層是fortran 寫的庫而且我剛看了一下,也不是所有blas都是用Fortran,openBlas就說是用C寫的
作者: mmonkeyboyy (great)   2021-11-13 12:43:00
我也沒有說全部啊 = ="不跟你說compile下去就知道了
作者: yamakazi (大安吳彥祖)   2021-11-13 12:43:00
OpenBlas說C compiler必備, Fortran compiler是選配
作者: mmonkeyboyy (great)   2021-11-13 12:45:00
= ="誰跟你少數領域 囧> 又不是人人都openblas更別提nv 自己都出fortran= =" 你要看接誰啊 你跑一個solver 要看它叫誰它沒叫你可以自己接啦....接很久就是了xd你真覺得沒用就沒用啊= =" 看一下各大名校都還在教還一堆是重課 = =" 你做數值拿來模擬各種東西solver 下去就是很有可能會有 @[email protected]~
作者: j0958322080 (Tidus)   2021-11-13 12:49:00
可能他沒接觸過的領域就是少數領域吧
作者: mmonkeyboyy (great)   2021-11-13 12:49:00
我講沒死透只是因為我自己也是在幫忙更新到c的但 超多好嗎= =" 你一堆工程化學藥學醫學都有會說科學計算可以用matlab 我只能笑了....python都到很最近才排得進去好嗎....世界排名前百大超級電腦 (量子不算的話) 有沒有十台可以讓你跑python都是問題 (當然商用出租的不算 這付錢的是老大) matlab....不知道有沒有一台就我記憶中 mathworks曾想去推 一個大老叫它先跑贏java 再來.... 然後我知道大家都會放一台讓小朋友在
作者: yamakazi (大安吳彥祖)   2021-11-13 12:54:00
所有以我說我見識少,沒跟你們討論我還真不知道有這個
作者: mmonkeyboyy (great)   2021-11-13 12:55:00
一邊先玩沙 玩完再叫你改成c++先某意議上來說openblas很先進的 先進到沒有fortran這是當初很多人對這東西的評價 (算一半好壞)這東西是對岸出的 專門為了某東西做的你把fortran 先拿掉 然後重compile 全部東西我認真覺得在linux 環境下 你會有一半以上hpc殘廢那東西包得太深了....深到我還見過比f77還舊的
作者: yamakazi (大安吳彥祖)   2021-11-13 13:11:00
為什麼要更新到C?是指重新用C寫嗎?
作者: mmonkeyboyy (great)   2021-11-13 13:13:00
很多東西你可以用c/c++的對應東西換掉在某程度上 會有優化上的好處 最少記憶體好做我看了一下我手正在搞的一個大包 裡面還是滿滿f啊老的東西很難丟掉的@[email protected]~ nasa想丟了fortran 才總算在2017年動手 (不過到底丟完了沒我也不知道)那有什麼時間在重寫 當沒事重造輪哦@[email protected]~當然是把別人寫好的移過去 做一堆事讓它工作
作者: kevin820308 (fdsfssdas)   2021-11-13 13:24:00
這篇講話www 好有畫面(抓頭燦笑
作者: bill1992 (我是魔法的蹤跡)   2021-11-13 13:48:00
整篇重點 太無情了 無情data
作者: bochengchen (LFII)   2021-11-13 14:07:00
data好難
作者: richardz (卍罪愛卍)   2021-11-13 16:12:00
雷姆派只能噓了
作者: zebraseven (Die walkuere)   2021-11-13 23:26:00
作者: cominlin (DiawCat)   2021-11-14 12:13:00
可惡 誰說藍髮的過氣了 她不就叫做......欸......叫什麼
作者: ricson (小僧)   2021-11-14 12:50:00
欸不是 你本命怎麼沒出現在簽名檔
作者: mmonkeyboyy (great)   2021-11-15 00:16:00
想當年我們都是初音 涼宮的 囧>(過氣的宅宅 泣T_T)_
作者: pjwck (pjwck)   2021-11-16 01:12:00
聽起來你只是需要早點認識python而已跟AI真的無關
作者: eva19452002 (^^)   2021-11-17 02:18:00
Python 底層是C,那為何不直接用C就好?
作者: damody (天亮damody)   2021-11-17 03:33:00
噗殺天使嗎
作者: longlongint (華哥爾)   2021-11-17 12:50:00
省人類的時間比省機器的時間重要
作者: mmonkeyboyy (great)   2021-11-18 13:19:00
是要決鬥泥~
作者: Yujjlin (iam1800mm)   2021-11-20 22:47:00
拿到一堆骯髒數據,真的很想哭,該複習python…

Links booklink

Contact Us: admin [ a t ] ucptt.com