[問題] R語言在Data mining 的應用

作者: SangoDragon (SANGO)   2016-03-04 10:02:03
本人之前都是用 SQL + Mining tools (例如MS-SQL Analysis service , SPSS Modeler)
之前大部分是用 SQL 整理資料
之後再用 mining Tools run mining (包含調參數等等)
例如我們做一個羅吉斯回歸,去預測信用卡客戶是否會變呆卡
或用 CART 去做回應率分析
現在關於 R 我有一些問題:
1. R的mining 函數支援到那些演算法?
例如:分群,類神經網路,CART 等等?
2. R有辦法調參數嗎?
例如分群時分幾群,CART的切點,等等 (這部分在mining tools 都有很強的支援)
3. R怎樣做Mining前的資料處理?
SQL 強的地方在於下語法可以做很多資料預處理
例如:資料中只有生日要轉換成年齡,還有一些更複雜要套公式轉換的部份等等
SQL 的資料可以存很多資料
R 在預處理部分的強度如何?
總不能一直讀EXCEL的資料吧?
我要表達的是,在資料面SQL 資料庫有很強大的SQL語法,跟儲存面
R 的方式?
4. 這張圖 http://i.imgur.com/iMTOAoG.jpg
是否過譽?
以MS-SQL mining 而言,建構好一個預測模型,可以利用MDX等等
去對這個Model 做一些處理,例如輸入資料做預測等等
而且也有很多圖形介面的輸出
以上幾點問題
作者: JackBaska (Baska)   2016-03-04 15:02:00
R絕對可以,但前提是有coding 的 senseR是很強物件導向的weak type語言
作者: obarisk (OSWALT)   2016-03-04 18:59:00
r的物件導向真心不推...
作者: JX660 (JX)   2016-03-04 23:34:00
個人用過R SAS SPSS 比較圖中六項 R毫無疑問是完勝阿不是六項 是八項 不過SAS SPSS有其他方面的好處就是了
作者: JackBaska (Baska)   2016-03-04 23:51:00
o大 雖然R寫物件很麻煩,但他基礎型態是以物件式管理的所以相對很多問題變很好解
作者: celestialgod (天)   2016-03-05 00:34:00
我覺得R6用物件導向就還可以
作者: clickhere (It's time to go home.)   2016-03-05 09:43:00
2/29 R 剛剛滿 8000 個 packages...這圖要更新了這還不含 BioC 和 archived 的 packages.R的基礎型態不是以物件式管理的...
作者: JackBaska (Baska)   2016-03-05 09:52:00
???我之前看原文網站有強調所有資料都是一個物件 ???我一開始用的時候覺得他資料有些部分默認的方式很像物件 , 後來看到網站寫那段原網站我要再找一下,不過當時是主要查詢class用法,然後系列文章有從物件切入,然後有一段直接寫,實質上所有元素都是物件,然後再開始介紹怎麼去自己另外寫一個物件會需要另外寫主要是我有需求開發特殊物件
作者: andrew43 (討厭有好心推文後刪文者)   2016-03-05 18:31:00
物件式管理和它是不是物件應該不是同義的。
作者: JackBaska (Baska)   2016-03-05 21:50:00
感謝A大,能否多分享一點相關資訊?我最近還在研究,想問有經驗的人的人一些比較詳細的知識
作者: andrew43 (討厭有好心推文後刪文者)   2016-03-05 22:45:00
我不是專家。R確實讓所有的型態都是物件,但它和主流的物件導向語言的特色還是差距不少。在主流的S3和S4,繼承、多型、封裝都有點半調子。
作者: celestialgod (天)   2016-03-05 22:50:00
reference也是,可以考慮R6吧
作者: andrew43 (討厭有好心推文後刪文者)   2016-03-05 22:50:00
前面c大提到的R6有很大的進展,它至少把最基本物件導向該有的特徵都有了。很物件導向的朋友可以研究R6下去。又例如S3或S4連私有成員都沒有,實在很不「物件導向」。
作者: clickhere (It's time to go home.)   2016-03-06 09:17:00
繼承、多型、封裝都是在S3/S4之後才逐漸成形的.光能用在函數和變數中用"."就夠C++和java使用者頭痛了就甭說管理或導向了...S3/4當年可是很先進的咧.
作者: andrew43 (討厭有好心推文後刪文者)   2016-03-06 12:05:00
謝謝補充這段歷史先後順序。
作者: obarisk (OSWALT)   2016-03-07 19:21:00
學完s4,換rc,現在是r6

Links booklink

Contact Us: admin [ a t ] ucptt.com