tranformer

作者: sustainer123 (caster)   2025-09-24 11:56:21
為啥能用啊
為啥loss curve完全沒overfitting的跡象
為啥能正常收斂
我只是無聊叫ai寫一個簡單的vit測試一下
簡單調一下超參數
怎麼感覺跑出還不錯的東西
我要死了 這點資料量怎麼可能可以用transformer
作者: steven183 (steven183183)   2025-09-24 11:57:00
變形金剛
作者: wu10200512 (廷廷)   2025-09-24 11:57:00
有先預訓練吧
作者: sustainer123 (caster)   2025-09-24 11:57:00
寶 3000筆資料怎麼可能能用vit 我沒fine tune
作者: kullan (Welcome to Hentai-wan)   2025-09-24 11:58:00
機魂開心
作者: sustainer123 (caster)   2025-09-24 11:58:00
我直接重train 因為我資料特性 不太能pretrainfine tune

Links booklink

Contact Us: admin [ a t ] ucptt.com