Re: [問題] 矩陣的處理...拜求各位大大 a78998042a PTT批踢踢實業坊

Re: [問題] 矩陣的處理...拜求各位大大

作者: a78998042a (Benjimine) 2017-09-06 15:10:26

來個基本語法版
通常遇到行列數量差異很大的計算時
就要設法利用R語言物件的原始結構特性
像是如果你有一個矩陣 X
100萬列，20行
你需要列加總，你第一個選擇不會是
apply(X, 1, sum)
而是
X[,1] + X[,2] +....+ X[,20]
同理可證，原本的問題
# 資料生成
X = matrix(c(replicate(50, c(rep(0, 6), rnorm(1)))),,8, byrow = TRUE)
X[sample(1:dim(X)[1], 10),] = 0
# 生成結果向量
result = rep(NA, dim(X)[1])
# 依行判讀
for(i in 1:m)
result[is.na(result) & X[,i]!=0] = X[is.na(result) & X[,i]!=0, i]
result[is.na(result)] = 0
沒驗算，應該是對的吧..... XD
不知道跟data.table哪個快，晚點再比一下
※ 引述《s3714443 (metalheads)》之銘言：
:

: 資料大概是長這樣
: 我想要處理的是：
: 像第8 row就有兩個非0的數字
: 那我就是取最左的那column 26.57這個數字
: 倒數第2 row 有26.43跟26.57這兩個數字
: 那就是取最左邊column的26.43
: 反正就是先選取特定column(MA10down1~MA10donw9)之中
: 逐row先看有沒有非0的數字，有就取最左column的，沒有就取0
: 然後就是mutate出來新的一行
: 我想不到除了sapply之外的辦法了
: 但是我的資料有500多萬筆
: sapply可能會跑到電腦燒掉ＸＤ
: 感恩各位

作者: andrew43 (討厭有好心推文後刪文者) 2017-09-06 19:40:00

如果只是加總的話，rowSums還會比一個一個加再快一倍。我也是因為看了這篇好奇才自己測了一下，順便發現的。

不過我會覺得data.table > rowSums XD

繼續閱讀

[問題] Shiny中plot位置的問題MonsterBorn [問題] Shiny上做crawler(爬蟲)x9060000456 [問題] Ubuntu Rstudio 輸入中文(解決)owem0410 [問題] 大筆資料多條件的平均問題hotlin0709 [問題] 新手預測組合d03n3ji3 [問題] 迴歸分析中的交互作用項wallrose [問題] 請教一下股票資訊源username Re: [問題] 兩兩比較運算celestialgod Re: [問題] 兩兩比較運算pk790127 [問題] excel無法計算變項scts1215