PTT
Submit
Submit
選擇語言
正體中文
简体中文
PTT
Marginalman
Re: batch former
作者:
sustainer123
(caster)
2025-10-09 18:35:55
※ 引述 《sustainer123 (溫水佳樹的兄長大人)》 之銘言:
:
: 可以簡單理解成針對batch的注意力機制
:
: 對每張圖片的同個位子做transformer
:
: 老實說我覺得他的想法滿有道理的
:
: 但我的實驗結果不是很好
:
: 姆咪
:
: 可能batch size太小
:
: 也可能寫錯
:
: 待觀察
:
一個指標小幅提升 另一個爆跌
但我調了一段時間的直覺應該是沒用
連假完再調一下好了
先把他模組化
換個模型試試
繼續閱讀
[閒聊] 愛惠惠什麼時候也變士大夫除了
F16V
DIY Diaper Machine 自製寶寶穿褲機 #Shorts
maitetsu
[取暖] 康姐算台女頂標了嗎
tomuy
[瓦特] fes
KurageuRoa
鐵道出大事了 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
miHoYo
Re: [閒聊] 你齁出大事
PonkotsuMiko
Re: → SuiseiLeda: 都能30分鐘跟老師二回戰了 很正
PogChampLUL
女方噴「智障台男」大炎上 黑男道歉下架影片
maitetsu
Re: [閒聊] AI小豆
liubruce502
[姆咪] 補青豬
a5WaGyu
Links
booklink
Contact Us: admin [ a t ] ucptt.com