到底 caat0808 PTT批踢踢實業坊

到底

作者: caat0808 (桐生キキョウ) 2025-07-15 15:34:25

我傳訊息說
你如果要自己train一個LLM
還是特定指定的最新最屌的模型款式而不是那種github寫的超迷你模型
假設8B好了
那要幾千億tokens才train的起來捏
但是老闆堅持不要finetune啊
他覺得浪費一大堆時間自己train一個別人3年前水準的東西很牛逼啊
然後老闆跟我說要不同結構的data分門別類
我同事就說這怎麼可能一個模型搞這麼複雜是把他當神了吧
又要低parameters又要少資料又要自己train
這樣跟我說可以跟投資者要到錢
==
然後還要自己上GPT生一串自己覺得很酷很炫的書籍list
覺得這個屌打huggingface上現有的general dataset

繼續閱讀

[閒聊] 沉默的魔女02dog41125 [瓦特] 0元露露CureSeal Re: 等你真的要反應已經太遲了Megacolon Re: [姆咪] 棕色塵埃gwawa0617 給弗洛洛哭弱不應誤傷卡提oz5566 等你真的要反應已經太遲了surimodo [脆熱議] 校花leopika [閒聊] 飛機輪子掉了evilmoom Re: → vanler: 已經專到米版幾個刻廚爆氣了weilu0228 Re: [閒聊] 唐伯虎點秋香leopika