Re: [問題] grid生樣本 避免for迴圈

作者: locka (locka)   2019-03-27 23:19:58
感謝 celestialgod 版主大大提點:
以前以為 *apply 家族的函數就已經是向量化(vectorized)的寫法了
查了資料才發現其實底層背後還是有 for 迴圈 (覺得震撼啊...)
試試看這樣的寫法
theta <- seq(0,1,len=100)
df <- rep(19,len=100)
n <- rep(20,len=100)
vrt <- Vectorize(rt)
x <- vrt(n=n, df=df, ncp=1/theta)
於是 x[,1] ... x[,100] 就是100個 n 等於20 然後對應各自 delta 值的 t 分配樣本了
(但是不知道 df, n 的預先定義有沒有意義?)
請版上各位高手再指點~ 謝謝大家
======
補充:
但還是有查到 *apply function 的好處:
1. 程式易讀性
2. 會 pre-allocate 向量的記憶體空間
2. 只影響區域變數不會改變全域變數
ref: https://www.r-bloggers.com/vectorization-in-r-why/
※ 引述《ntpuisbest (阿龍)》之銘言:
: n <- 20
: theta=seq(0,1,len=100)
: rt(n ,1/theta )
: 如題
: 我想要生100組 ,每組都是n=20的t分配樣本
: 只是這100組的theta都不一樣
: 我像上面那樣打 只會回傳20個樣本
: 並不是我想要的 2000個樣本 請問要如何打才能要我要的結果
: 想避免for loop
: 用loop的話 我知道怎麼做
作者: VIATOR (阿布拉卡達不拉)   2019-04-11 23:57:00
*apply各種變形各有些微不同,之後可能還要用do.call,rbind而且如果想用平行運算,可能還要改回foreach我雖然會用*apply了,但常常懷疑*apply的好處preallocate 大概是我目前唯一覺得的好處但懂得自己preallocate 的話,其實for迴圈也沒什麼不好
作者: VIATOR (阿布拉卡達不拉)   2019-04-11 07:59:00
其實我對於易讀性這點很懷疑大部分人都能夠很快 看懂 for迴圈可是對於apply語法不懂的人很難看懂apply
作者: locka (locka)   2019-04-11 08:32:00
看不懂apply那可以從sapply開始學(認真誤) 我以前也覺得要指定row或column參數的apply很難看懂;相較之下sapply親切多了,傳進去的就是迭代進FUN的參數,跟for是一樣的概念,還更有彈性。看得懂for就看的懂sapply(應該吧XD)
作者: celestialgod (天)   2019-04-12 14:02:00
基本上我同意apply系列沒什麼好處 這也算是R特殊的撰寫風格,大多數人稱這種寫法是functional programming,來避免一些太複雜的程式計算,至於好處壞處就是各有利弊,每個人看法不同至於平行的話,parallel::parLapply也都可以做,並不是只有foreach能用
作者: VIATOR (阿布拉卡達不拉)   2019-04-12 14:36:00
apply系列,MATLAB有類似的寫法,不過不常看到人用parLapply能處理lapply,但windows就沒有辦法平行mcapply
作者: celestialgod (天)   2019-04-12 19:50:00
MATLAB的cellfun跟arrayfun 我的愛XDD我用matlab幾乎都用那個處理資料= =matlab雖然有JIT,但是preallocation還是比較快

Links booklink

Contact Us: admin [ a t ] ucptt.com