Re: [問題] 矩陣的處理...拜求各位大大

作者: a78998042a (Benjimine)   2017-09-06 15:10:26
來個基本語法版
通常遇到行列數量差異很大的計算時
就要設法利用R語言物件的原始結構特性
像是如果你有一個矩陣 X
100萬列,20行
你需要列加總,你第一個選擇不會是
apply(X, 1, sum)
而是
X[,1] + X[,2] +....+ X[,20]
同理可證,原本的問題
# 資料生成
X = matrix(c(replicate(50, c(rep(0, 6), rnorm(1)))),,8, byrow = TRUE)
X[sample(1:dim(X)[1], 10),] = 0
# 生成結果向量
result = rep(NA, dim(X)[1])
# 依行判讀
for(i in 1:m)
result[is.na(result) & X[,i]!=0] = X[is.na(result) & X[,i]!=0, i]
result[is.na(result)] = 0
沒驗算,應該是對的吧..... XD
不知道跟data.table哪個快,晚點再比一下
※ 引述《s3714443 (metalheads)》之銘言:
: http://imgur.com/a/1s7Is
: 資料大概是長這樣
: 我想要處理的是:
: 像第8 row就有兩個非0的數字
: 那我就是取最左的那column 26.57這個數字
: 倒數第2 row 有26.43跟26.57這兩個數字
: 那就是取最左邊column的26.43
: 反正就是 先選取特定column(MA10down1~MA10donw9)之中
: 逐row先看有沒有非0的數字,有就取最左column的,沒有就取0
: 然後就是mutate出來新的一行
: 我想不到除了sapply之外的辦法了
: 但是我的資料有500多萬筆
: sapply可能會跑到電腦燒掉XD
: 感恩各位
作者: andrew43 (討厭有好心推文後刪文者)   2017-09-06 19:40:00
如果只是加總的話,rowSums還會比一個一個加再快一倍。我也是因為看了這篇好奇才自己測了一下,順便發現的。
作者: celestialgod (天)   2017-09-07 20:29:00
不過我會覺得data.table > rowSums XD

Links booklink

Contact Us: admin [ a t ] ucptt.com