紀錄一下

作者: sustainer123 (caster)   2025-10-20 17:52:16
pixel shuffle用在vit架構會出現無法收斂的問題
但用在cnn架構就表現良好
我猜測是學習到的特徵分布的問題
vit是全局特徵 cnn輸出的是局部特徵
我隨便猜的
明天再想想原因
作者: Wardyal (Wardyal)   2024-10-20 17:52:00
不用想 it just work
作者: sustainer123 (caster)   2025-10-20 17:53:00
就是不work我才要想 對啊

Links booklink

Contact Us: admin [ a t ] ucptt.com