Re: [問題] grid生樣本避免for迴圈 locka PTT批踢踢實業坊

Re: [問題] grid生樣本避免for迴圈

作者: locka (locka) 2019-03-27 23:19:58

感謝 celestialgod 版主大大提點:
以前以為 *apply 家族的函數就已經是向量化(vectorized)的寫法了
查了資料才發現其實底層背後還是有 for 迴圈 (覺得震撼啊...)
試試看這樣的寫法
theta <- seq(0,1,len=100)
df <- rep(19,len=100)
n <- rep(20,len=100)
vrt <- Vectorize(rt)
x <- vrt(n=n, df=df, ncp=1/theta)
於是 x[,1] ... x[,100] 就是100個 n 等於20 然後對應各自 delta 值的 t 分配樣本了
(但是不知道 df, n 的預先定義有沒有意義?)
請版上各位高手再指點~ 謝謝大家
======
補充：
但還是有查到 *apply function 的好處:
1. 程式易讀性
2. 會 pre-allocate 向量的記憶體空間
2. 只影響區域變數不會改變全域變數
ref: https://www.r-bloggers.com/vectorization-in-r-why/
※ 引述《ntpuisbest (阿龍)》之銘言：
: n <- 20
: theta=seq(0,1,len=100)
: rt(n ,1/theta )
: 如題
: 我想要生100組，每組都是n=20的t分配樣本
: 只是這100組的theta都不一樣
: 我像上面那樣打只會回傳20個樣本
: 並不是我想要的 2000個樣本請問要如何打才能要我要的結果
: 想避免for loop
: 用loop的話我知道怎麼做

作者: VIATOR (阿布拉卡達不拉) 2019-04-11 23:57:00

*apply各種變形各有些微不同,之後可能還要用do.call,rbind而且如果想用平行運算,可能還要改回foreach我雖然會用*apply了，但常常懷疑*apply的好處preallocate 大概是我目前唯一覺得的好處但懂得自己preallocate 的話，其實for迴圈也沒什麼不好

作者: VIATOR (阿布拉卡達不拉) 2019-04-11 07:59:00

其實我對於易讀性這點很懷疑大部分人都能夠很快看懂 for迴圈可是對於apply語法不懂的人很難看懂apply

作者: locka (locka) 2019-04-11 08:32:00

看不懂apply那可以從sapply開始學(認真誤) 我以前也覺得要指定row或column參數的apply很難看懂；相較之下sapply親切多了，傳進去的就是迭代進FUN的參數，跟for是一樣的概念，還更有彈性。看得懂for就看的懂sapply(應該吧XD)

作者: celestialgod (å¤©) 2019-04-12 14:02:00

基本上我同意apply系列沒什麼好處這也算是R特殊的撰寫風格，大多數人稱這種寫法是functional programming，來避免一些太複雜的程式計算，至於好處壞處就是各有利弊，每個人看法不同至於平行的話，parallel::parLapply也都可以做，並不是只有foreach能用

作者: VIATOR (阿布拉卡達不拉) 2019-04-12 14:36:00

apply系列，MATLAB有類似的寫法，不過不常看到人用parLapply能處理lapply,但windows就沒有辦法平行mcapply

MATLAB的cellfun跟arrayfun 我的愛XDD我用matlab幾乎都用那個處理資料= =matlab雖然有JIT，但是preallocation還是比較快

繼續閱讀

[問題] grid生樣本避免for迴圈ntpuisbest [問題] apply 排序矩陣用列排序ntpuisbest Re: [問題] dataframe運作embed及修正timedelay首欄TreeMan [問題] dataframe運作embed及修正timedelay首欄paranoia5201 Re: [問題] 多條件篩選特定資料出來TreeMan [問題] 多條件篩選特定資料出來qibqib Re: [問題] 類似樞紐分析的表格製作celestialgod [問題] 類似樞紐分析的表格製作paganina [問題] barplot中標示特定條件的barszx [問題] 空間分析eegame

Re: [問題] grid生樣本 避免for迴圈

Re: [問題] grid生樣本避免for迴圈