Re: [請益] 關於Junior Data相關工作

作者: h310713 (虎虎虎)   2016-09-22 22:41:50
恕刪
小弟來回一下這篇好了
不免俗的介紹一下自己平庸的背景
私立統計 學士 私立統計所 碩士
大學學校教 SAS. 研究所論文寫 Fortran
研究所自學 R
工作找的還算順利 無縫接軌進入某遠字輩公司資訊處 擔任工程師
目前負責 公司統計模型建立 ETL程式開發 Open data 資料介接 固定統計報表產出
以及 MS SQL資料管理
廢話說完了 來說正事
我個人很推薦 R
這裡就不討論Python因為我也不懂
R可以做的東西其實真的很多
舉凡統計模型計算 ML 一直到我現在用R 在做 ETL 想的到的想不到的套件都有
以前R中文的教科書 我是看淡大老師 陳景祥的書 我個人是覺得不太適合新手
但是現在很多其他的書了 而且Stackoverflow 也很多稀奇古怪的問題 自學應該不是難

而且 不會被公司 限制自己 不花錢你一樣可以寫的很開心
只是可能是我個人Coding問題 我一直在優化效能 這就不多說了
也有人說要學SQL. 我個人在上班前完全不會SQL. 也是一邊做一邊學
總之 我個人蠻推薦R
對於我來說 工作上用的順手 且不會被公司的預算限制自己
公司目前也是有買SAS. 但是我還是習慣用R 個人覺得使用上比較彈性
還沒工作前我也是懂皮毛而已
直到現在才有比較懂多一些
統計模型 又或是ML 訓練出來的好不好或是餵進去的資料要怎麼做 Pre process 這又是
一門學問了
總結一下 學R對你的未來應該會有一定程度的幫助
我自己資歷也不深
給你的經驗也淺
版上很多神人可以補充
Coding 能力是一回事 統計專業也要一起培養
目前公司ETL主力工具還是C#
所以C#資料處理的步驟也有碰到
反正 Growth mindset 多碰多學多看
加油
再來補充一點事情好了
Coding 能力重要
但是解讀統計數據更是一門學問
跑出來的模型怎麼用
代表的參數是什麼意思
Factor重要與否 這倒是需要花不少時間去培養
大數據這東西很夯
我個人還是比較喜歡統計上面的抽樣
又或是把大資料變小而且又有代表性
我覺得這也是統計的另外一種價值
作者: rupcj8 (唉呀)   2016-09-22 22:56:00
不過說實在台灣公司的分工還真糟 囧不覺得你該做這麼多東東@@
作者: h310713 (虎虎虎)   2016-09-22 23:00:00
哈 我覺得多碰點 累積一下不是 壞事
作者: xsssxxzz (阿群)   2016-09-22 23:02:00
R 不錯只是對GB大小的資料真的很無力...
作者: h310713 (虎虎虎)   2016-09-22 23:05:00
所以優化效能很重要
作者: ripple0129 (perry tsai)   2016-09-23 00:49:00
R似乎不像Python有Cython Jython這類突破效能的工具?
作者: frouscy (流浪吧。)   2016-09-23 03:21:00
有Rcpp
作者: CaptainH (Cannon)   2016-09-23 09:26:00
碩士畢業還一直強調語言 唉
作者: h310713 (虎虎虎)   2016-09-23 09:41:00
可能樓上還是用計算機再運算囉
作者: childlike12 (幼稚鬼+小孩子=娃娃ˊ~ˋ)   2016-09-23 10:15:00
所以你們作DM時都會花時間去算資訊增益這件事嗎?
作者: drajan (EasoN)   2016-09-23 18:26:00
Information gain有close form solution 你是要花啥時間?
作者: swedrf0112 (M)   2016-09-23 18:54:00
對資料分析的需求 造就了好用的工具 就原po的角度而言 在強調好用的工具 作起分析更得心應手 而非比較孰優孰劣會花時間看ㄧ下 information gain 作 feature selection 還是好用的小工具XD

Links booklink

Contact Us: admin [ a t ] ucptt.com