[請益] 如何踏入Data Mining/Engineers領域

作者: robin112 (Robin)   2014-07-23 15:53:44
小弟四中統計研究所應屆畢業,
論文內容主要討論logitudinal data的clustering,
會想踏入這個領域主要還是因為發現自己對於資料分析還是樂在其中XD
基本統計工具都還算可以(regression,GLM,multivariate analysis),
求學階段也有使用過這些工具分析過一些小的raw data。
主要的語言工具為R(loop,array,function etc.)
可以將大部份知道邏輯或步驟的統計方法寫出來,
C++有摸過但不熟悉,目前正在跟著codecademy學Python,
目的是想作一些蜘蛛抓data下來,再進行後續分析來玩。
這一個多月在網路上投了不少Data Mining相關的履歷,
有的職缺感覺條件蠻相符的卻像石沉大海一般,
有些說可以培訓或接受新鮮人也沒有回應,
或是覺得我有潛力但還是不符要求。
看著身邊不少同學都已經找到好工作了自己也開始緊張,
爬文也了解自己的弱勢在於如何從資料庫中抓data(ex:SQL),
以及現在流行的Hadoop及MapReduce等big data的技術,
但我疑惑的是,對業界而言是否不會這些技術就無法踏入?
因此想來請各位給我一點建議,謝謝!
作者: kangta0819 (嶄新)   2014-07-23 16:06:00
何不從身邊同學的工作跟產業著手呢?
作者: robin112 (Robin)   2014-07-23 16:36:00
身邊同學大多進入品管或生物統計產業 沒人走這方面XDD
作者: circle666 (虫宅虫宅)   2014-07-23 16:36:00
感覺上資工機會比統計大得多
作者: lovdkkkk (dk)   2014-07-23 16:48:00
可以考慮考個資工博, 有學生身份可以投雅虎的 intern實習比較容易進去, 再學怎麼用工具實習完博要不要唸完就再說 (不過資格考可能的話就拼一下)然後你 "目前是想..." 那段, 建議開個 github 帳號放中間有什麼學到的覺得值得記錄的, 找個 blog 記下來整理得有條理一些, 將來可能會有幫助話說回來, 實習也不一定會上, 但最少可以修些課資結程設演算法跟資料探勘修好一點, 應徵時可以秀成績單總之起碼有些可看見的實績是最重要的另外也可以考慮新創/小公司的 Data Analyste.g. http://ppt.cc/6w4G (純舉例)雖非 big data, 但可先工作邊補足經歷/能力 (如 SQL)
作者: DrTech (竹科管理處網軍研發人員)   2014-07-23 17:34:00
來這個版問,你只會得到一種答案,去學程式語言你說你投了很多履歷,該不會都是程式缺吧。建議往BI、ETL、SPSS、資料分析、等關鍵字找,比較適合你
作者: chester06 (chester)   2014-07-23 21:13:00
程設是可以學的, 你的統計學知識反而才是關鍵
作者: berton1679 (低調boy)   2014-07-23 21:47:00
聽DrTech 資工博last resort別千萬只為這理由 念博..
作者: blueprecious (小無尾熊)   2014-07-23 22:04:00
我覺得你如果是對"資料分析"有興趣的話,應該先去找你有興趣的資料,資料分析的重點在知道要抓哪些資及能夠解釋分析的成果,程式只是種分析工具
作者: francej (~~~~)   2014-07-23 22:09:00
我想問題是出在這個領域僧多粥少吧. 資工資管數學統計工工甚至連社會經濟背景的都有在搞DM. 你算一下四大這些科系每年畢業多少人,就不難理解為何會石沉大海了建議要不去洗個學歷 阿不然就只好認命有找到工作就好累積點職場經驗值,然後再跳槽自己理想中的公司職缺還有金融,生物資訊科系也有在搞DM..多數人士校名優先..so.
作者: blueprecious (小無尾熊)   2014-07-23 22:20:00
我可以說一下DM跟統計其實有很大的不同嗎XD這個職缺很需要對某個個產業有一定的熟悉程度,這樣你才知道要抓甚麼資料及如何解釋分析成果所以建議先找到你有興趣的產業工作後再往這邊走^^
作者: lovdkkkk (dk)   2014-07-23 22:30:00
唸博只是手段啦, 隨時可以肆業...XD各領域都搞這個很正常 (指分析), 像生物學上也有用到大家都想靠個什麼神兵利器把一眼看不出的資訊抓出來...XD
作者: MOONY135 (談無慾)   2014-07-23 22:37:00
三月丟到七月面試五家這種缺 應該還好吧 我是私碩
作者: johnny94 (32767)   2014-07-23 23:52:00
http://ppt.cc/zeXf 統計版這篇文章給你參考看看
作者: sleepwu ( )   2014-07-24 00:17:00
要有真實的raw data
作者: aacs0130 (湛靈)   2014-07-24 14:32:00
http://ppt .cc/3j9n road to a data scientist.http://ppt.cc/3j9n 看完就知道自己該補什麼了
作者: lovdkkkk (dk)   2014-07-24 15:54:00
好像哪裡的捷運路線圖...XD
作者: DrTech (竹科管理處網軍研發人員)   2014-07-24 18:57:00
那篇文章很多過時的觀念,例如Excel無法處理Big Data。對Open Source的工具理解也是五年前的狀態。至於捷運圖就參考就好,圖中很多Bug。例如想不到為什麼學完Hadoop安裝後,還建議去學 MongoDB,完全沒邏輯。晚點有空再回我的看法。
作者: com183 (com183)   2014-07-26 11:27:00
科技業版,發哥剛好在徵@@

Links booklink

Contact Us: admin [ a t ] ucptt.com