[運算] 多層for迴圈簡化 與 GPU加速

作者: Absolitude (別再睡了起床了愛麗)   2017-12-19 02:09:38
最近遇到一個問題目前只想到用多層for來處理,想請問有沒有辦法簡化
問題大概是這樣,有兩個m*n*k的三維矩陣atot和atotcc,atotcc是atot的共軛複數
https://imgur.com/9Eou21X
其中每一個k方向的紅框atot(1,1,:) atotcc(2,3,:)這些視為一個個向量,目標是把所
有atot中的m*n個向量和atotcc中的m*n個向量分別做內積得到(m*n)^2個值,再取總合
目前的程式大概是這樣
m=15;
n=19;
k=10000;
ar=randn(n,m,k);
ai=randn(n,m,k);
atot=ar+i*ai;
atotcc=conj(atot);
acsd=zeros(n,m,n,m)+i*zeros(n,m,n,m);
tic;
for ix=1:m
for iy=1:n
for ixc=1:m
for iyc=1:n
acsd(iy,ix,ixc,iyc)=sum(bsxfun(@times,atot(iy,ix,:),atotcc(iyc,ixc,:)));
end
end
end
end
toc
tic;
acsdsum=sum(sum(sum(sum(acsd))));
toc
說是內積但是不用dot是因為有複數用起來有些問題,一維的話我知道可以取轉置,但是
寫成(iy,ix,:)這種形式不太知道怎麼做所以先用sum配上bsxfun或.*
感覺寫這麼多層迴圈不是很有效率,而且也不適合用gpu加速(目前只會變慢),但這應該是
很適合平行化的計算(上面的程式在執行時會自動在cpu上平行化),因為所有的內積以及
內積中的運算分別都是獨立的
在這先謝謝板上先進的不吝指教 感恩
作者: sunev (Veritas)   2017-12-19 05:27:00
atot=randn(m*n,k)+1i*randn(m*n,k);acsdsum=sum(sum(atot*atot'));
作者: Absolitude (別再睡了起床了愛麗)   2017-12-19 15:40:00
之前用的時候都沒用到複數,沒想到轉置後還會變共軛
作者: sunev (Veritas)   2017-12-19 20:50:00
你畫的圖很精美,證明你完全知道自己想算什麼,也用到了一些vectorize的技巧,像是2維變1維以及bsxfun你只是不知道兩件事,1.矩陣相乘可以看成向量內積的推廣。2.複數向量怎麼做內積。有興趣可以去翻一下線性代數的書,裡面有提到這些事

Links booklink

Contact Us: admin [ a t ] ucptt.com