[請益] 資料分析 R or Python ?

作者: f496328mm (為什麼會流淚)   2017-07-15 11:08:57
想請教從事 資料分析、ML 相關工作的各位,
比較常用 R 還是 Python ?
因為我上網搜尋相關工作,比較常看到必備需求中包含 Python ,幾乎沒有 R
因為 R 比較偏向學術嗎?
我上網GOOGLE到這幾篇
R, Python Duel As Top Analytics, Data Science software – KDnuggets 2016
Software Poll Results
https://goo.gl/DQNEvq
SAS, R, or Python Survey 2016: Which Tool Do Analytics Pros Prefer?
https://goo.gl/sJUubT
R vs Python for Data Science: The Winner is
http://www.kdnuggets.com/2015/05/r-vs-python-data-science.html
都是 R 使用率大於 Python
所以想請教各位,謝謝
作者: ruokcnn (Dean)   2017-07-15 11:14:00
都有人用啦 只是派森商品化能力強些
作者: johnny78615 (Johnny)   2017-07-15 11:23:00
Python
作者: besmartAE (*無敵海灘男孩*)   2017-07-15 11:58:00
Python
作者: CaptainH (Cannon)   2017-07-15 12:54:00
R是垃圾
作者: Murasaki0110 (麥當勞歡樂送)   2017-07-15 12:55:00
python沒有對手
作者: Morphee (千磨萬擊還堅勁)   2017-07-15 13:11:00
Python
作者: xsssxxzz (阿群)   2017-07-15 13:16:00
R是垃圾?怎麼會有人下這種評語?
作者: red0210 (My Name Is Red)   2017-07-15 14:00:00
Python
作者: vfgce (小兵)   2017-07-15 14:27:00
R就不好入門,和傳統程式語言差異很大,且非常不建議用迴圈..對於寫慣迴圈的人,非常不順手,python接近一般程式語言,且
作者: Rocker5566 (搖滾56)   2017-07-15 14:29:00
python比較潮
作者: vfgce (小兵)   2017-07-15 14:29:00
程式效率也比R好些,自然用的人多一點...用於資料分析,R語法簡潔許多,因為本來就是為統計分析設計..內建就是向量式計算及內建矩陣運算...
作者: testPtt (測試)   2017-07-15 14:46:00
一邊學校多教spss,lisrel
作者: grimmq427532 (Legend)   2017-07-15 14:50:00
有人開釋啦,這種評語不是大神就是蠢才
作者: seallol (carl)   2017-07-15 15:25:00
兩個都學,先學python再學R
作者: Wush978 (拒看低質媒體)   2017-07-15 15:38:00
看領域:資工人偏P,統計人偏R。這裡資工人偏多吧,業界資訊部門也是資工人比較多
作者: Telemio (Telemio)   2017-07-15 15:45:00
python開源的資源比R多很多啊 你現在用pandas numpy做分析 ML DL的套件也幾乎都是用python開發 R現在的優勢很小吧 而且python很多才多藝 又好寫
作者: Wush978 (拒看低質媒體)   2017-07-15 15:49:00
R的開源資源也不小呀,沒必要貶R吧。我覺得R開源界推的tidyverse概念整理資料很漂亮ggplot2也是R的開源界推出在資料視覺化很有影響力的套件Rstudio也是與R整合的很好的IDEPython的開源界雖大,但是不像R的開源界專注在資料處理上,因此一些資料應用在工具上的創新,R不一定比Puthon慢
作者: testUI (毫無反應,就是條魷魚)   2017-07-15 16:00:00
Python
作者: yenyu0304   2017-07-15 16:14:00
有必要這麼偏低R嗎?個人覺得R避開迴圈,用矩陣運算取代,速度並不會比python慢喔
作者: vfgce (小兵)   2017-07-15 16:38:00
呃,R的速度嚴格來說還是比優化的numpy要差.....R最大的優勢是語法簡潔,及統計方面的功能強大,
作者: Wush978 (拒看低質媒體)   2017-07-15 16:40:00
是嗎?有更換R的預設blas再比較嗎?
作者: vfgce (小兵)   2017-07-15 16:41:00
對於同時有統計及機器學習需求的人,R是不錯的選擇...換過了,資料一大,R就慢了下來....
作者: Wush978 (拒看低質媒體)   2017-07-15 16:43:00
R core team在選用運算套件上,正確性的權重比速度大很多
作者: dreamnook (亞龍)   2017-07-15 16:43:00
看來又要變成不要刪文討論串了XD
作者: drak4dd (drak4dd)   2017-07-15 16:45:00
Python,你學 R 後會瞭解,你終究要學 Python
作者: Wush978 (拒看低質媒體)   2017-07-15 16:49:00
不過R的函數只能pass by value,所以資料量一大,沒注意到這點速度就慢了。我自己看過兩者底層的C資料結構,不覺得兩者的效能會差很大。通常原因在別的地方。
作者: vfgce (小兵)   2017-07-15 16:55:00
R就偏functional language,不去變動原始資料,計算完傳回新的,記憶體耗用大,資料大一點就變慢了
作者: Wush978 (拒看低質媒體)   2017-07-15 17:31:00
針對原Po來說,我強烈建議你學一學Python,對你的視野與職涯都會有很大的幫助。你會看到一些與R不同的工具與觀點況且以現代來說,R+Python 會比 R or Python 來的有競爭力以深度學習來說,像Rstudio包的那些關於keras的R套件你就可以不用碰了,直接學Python/keras就好了。這未來都會比只堅守R來的更好
作者: vallwesture (vallwesture)   2017-07-15 18:06:00
R太慢了
作者: rodion (r-kan/reminder)   2017-07-15 18:11:00
泛用選python 專精選R不過學python根本不須那麼多考慮 因為python太簡單好學了
作者: vfgce (小兵)   2017-07-15 18:26:00
data.table格式不是R原生,很多套件不援.有時還是得再轉成data.frame,用到類神經這種,R真的太吃力..python類神經跑mnist識別幾分鐘就跑完了,R的類神經來跑....要一到兩小時.數據不大時,用R真的很享受...但數據大時....還是考慮一下python.我現在也是兩個用,雖然比較愛用R.
作者: lukelove (午睡)   2017-07-15 19:09:00
不管你是cs/math都建議學一下python 不然就像上面所說面試就先被cs噴R太慢 雖然事實上R也能做的很高效 如wush大之前文章所示 但如果沒有很懂R底層應該做不到
作者: Philcat (a cat)   2017-07-15 19:35:00
長知識
作者: roymond   2017-07-15 19:42:00
R的套件遠比python來得豐富也多很多....DL的部分Tensorflow & keras也有R的package可以使用使用哪個語言做分析,主要看自己的熟悉度與適應程度比較哪個語言好,實在沒有必要,有些人的發言實在是....
作者: eddy50811 (紅領巾)   2017-07-15 20:43:00
各有優缺點 如果要靠這行吃飯的話就兩個都學吧樓樓上 有些人的言論就別在意了 到哪都有這種人的
作者: celestialgod (天)   2017-07-15 21:51:00
用台灣的相關工作要求來看R or Python??那些老闆跟人資也根本不懂到底R跟Python區別就去問IT的,IT當然回Python阿(攤手而且你出去工作,老闆只care你有沒有產出吧管你用什麼工具....除非他是一間有規模的公司,裡面已經有既有的架構了但是你如果能夠fit既有架構,要用什麼也不是問題
作者: nfsong (圖書館我來了)   2017-07-15 22:43:00
https://juejin.im/post/59647aac5188250d9208813bPython 为何能坐稳 AI 时代头牌语言facebook這個 http://pytorch.org/ 有支援GPU運算感覺實用上應該只有python了 除非nvidia 也有開發Rhttps://github.com/pytorch/pytorchhttps://goo.gl/aWnLxs wiki Comparison_of_deep_learnin
作者: a9601268787 (SoHentai)   2017-07-16 00:15:00
我覺得學py可以跨領域做很多事情 選R路太窄了
作者: artopll (命運)   2017-07-16 11:46:00
R 跟Python 都只是工具 在業界不要被工具侷限
作者: profiles (pforileS)   2017-07-16 12:49:00
學C++不好嗎?各領域都能用
作者: red0210 (My Name Is Red)   2017-07-16 13:19:00
沒有各領域吧,資料分析有人用 C++ 嗎
作者: fantasywater (prepare myself)   2017-07-16 13:28:00
以實務來說 R很難拿來和企業內部的系統介接,一個不能production的東西,實在是頻頻被企業打槍,還是學python吧!!如果學R還要搞懂底層,那你到底是做分析還是做工程,cs也不會為為了你去搞懂R底層,R沒有不好,只是實務上太多工程問題很難解..
作者: Wush978 (拒看低質媒體)   2017-07-16 15:02:00
R 為什麼很難跟企業內部的系統介接? 很多人這麼說,但我還沒聽過真正的理由,好像只是因為台灣懂R的人少?
作者: fantasywater (prepare myself)   2017-07-16 15:47:00
真要說原因的話 R 原本就不是為了和其他系統整合介接設計的語言 當其他的語言介接的套件都很成熟 R可能還要從基本的輪子開始造起 又時間是重要的資源通常不會等 R 去發展這些基本的介接模組
作者: primary   2017-07-16 17:23:00
python進步速度很快也好上手但data viz和cluster之類的我都會用R
作者: Wush978 (拒看低質媒體)   2017-07-16 19:56:00
你能舉例嘛?我串過很多服務到R, 都很順阿資安方面有openssl / digest 等套件直接套用web 方面 oauth 2.0 也有httr等套件可以直接調用database方面,有RJDBC/RODBC等套件可以直接串聽你們的論述,我覺得台灣業界覺得R不好串是因為台灣業界對R不熟悉可能大家的印象還停留在2010 年前後的R吧,那時候的R的確缺很多串系統需要的工具。但現在是2017,有許多商業公司幫助R補上這一段了
作者: truehero (wek)   2017-07-16 21:29:00
我有現成系統 當然是看R或python誰比較好接不會反過來以rR為主體來往外接阿
作者: fantasywater (prepare myself)   2017-07-16 22:06:00
實際上我們選擇的時後也不是只有比較有沒有套件可以用這麼簡單而已,更進一步還會比較套件是否成熟,是否好維運,還有大家是否容易接受等等更多的原因,很遺憾的 現實的環境就是不會等R來慢慢證明他的能耐,有更好用更成熟的工具可以選擇,為什麼要為了R而R呢?更多的情況是專案剛起步用R提案就被客戶打槍了..
作者: polola6212 (Polo)   2017-07-16 22:07:00
python cp值高太多了
作者: fantasywater (prepare myself)   2017-07-16 22:11:00
我的建議是,既然R的強項是分析, 就把分析的部分包裝起來讓其他的語言調用就好,其他的部分讓更適合的語言及工具來發揮,才更能發揮綜效我不是很喜歡評斷語言的優劣,因為本來就各擅勝場,我們公司在world wide也是要求 junior 在 R python至少要會一種,senior 就是都要會,我出自良心的建議,如過是工作導向,我強烈建議先學python,因為我在臺灣看到的狀況就是先學 python 比較不吃虧
作者: Wush978 (拒看低質媒體)   2017-07-17 11:32:00
我覺得你們討論的好怪。如果客戶的分析團隊就是用R,那當然就是要串R阿,怎麼會有所謂「等R證明能耐」的問題呢?總之我是期待你們具體指出R那部份不好串,而不是這樣打高空,一下說要重新造輪子,一下又說套件不成熟,沒有具體事蹟...
作者: benson1212 (Da)   2017-07-19 20:45:00
其實我想問 無經驗非新鮮人有可能轉到資料科學領域嗎?感覺都要有經驗或相關研究碩博士…
作者: tsoahans (ㄎㄎ)   2017-07-23 03:28:00
很難吧 這領域很重視理論和數學,除非你有一些比賽經驗

Links booklink

Contact Us: admin [ a t ] ucptt.com