[心得] 純粹聊聊AI使用 cybermeow PTT批踢踢實業坊

[心得] 純粹聊聊AI使用

作者: cybermeow (我有一隻貓) 2026-02-04 02:00:32

也不知道哪根筋不對半夜睡不著來這個基本沒在看的版發文
先上個人權
https://imgur.com/I7XPLK8
這篇文沒有打算細談任何AI實際應該怎麼使用的內容
一方面懶得說二方面我覺得這很因情況而異三方面我也不知道
純粹想到什麼打什麼打到我睡著為止
開頭放個Andrej Karpathy這篇推特
https://x.com/karpathy/status/2015883857489522876?s=46
我覺得這是最近我看到最符合個人使用經驗的文章
網路上充斥許多只有AI很強跟AI沒用論點的文章
真正中肯做出分析的反而很難看到 (當然也可能是推薦算法使然
喔對了小小自介一下
我最近的工作比較大的milestone是release了一個叫做nijiv7的動漫風格文生圖模型
https://x.com/nijijourney/status/2009714744597643503?s=20
更之前的話則是參與midjourney video 1的開發
我的工作內容基本包涵
- 上千張顯卡的模型訓練
- 以億為等級的圖片影片數據處理
- 圖片影像生成模型的各種調整跟feature development
比較忙的時候可能一天同時會碰到資料處理訓練跟模型推理的代碼
實際工作更雜像我最近就開副本在做別的事情但上面可以當作是工作的主幹
而個人在ai coding這一方面覺得算是經歷了三個大的變革
1. chatgpt 出來後複製貼上問答
2. cursor 類型的 ide 直接導入
3. claude code等的自主 ai 代理人
3這一塊我們團隊也是到最近才開始比較積極探索
主要是opus 4.5, codex等模型讓agent能力大幅提升
也讓3使用起來帶來的效益更大
(個人覺得從hype到實際落地能用通常都需要一段緩衝期
而且比起1 2 要運用好3的learning curve更陡
我最近都開玩笑說vibe coding比coding難寫skill比寫code難
現在使用算是2 3混合只有在非常偶爾的情況會把獨立的問題用1拿去問不同llm吧
至於模型嗎我們都是用最好的甚至claude code直接開api usage (比 team plan速度快
一個月一個人燒個幾百幾千美元都有 (還沒算cursor跟其他雜七雜八的
ai agent這東西感覺是用起來其實沒這麼容易
也沒有像網路上大部分講的這麼萬能
現在最大的問題基本是context management跟spec
畢竟目前ai還不會讀心他不知道你想做什麼
而且就算spec寫好了實際跑起來還是會發現常常有遺漏
所以的確是一行code都不用寫其實我去年用cursor就幾乎一行code都沒寫了
但會發現到頭來最大的bottleneck還是人類自己
因為人類要負責提出requirement (spec)跟做evaluation
這兩件事情並沒有這麼簡單
嘛所以像是brainstorm這種讓agent釐清requirement的就很好用
至於evaluation 作為有程式背景的做code review還是最直接的方式
(上面Andrej Karpathy的文也有提到
實際上ai寫的code有時候就算是對的
但就是看他的code style或是一些冗餘的內容很不爽
至於那些純vibe完全不看code的人大概需要不同的evaluation方式吧
但考慮到ml這種超大規模數據處理跟模型訓練
坦白講你不看code你安心嗎
你除了看code有什麼方式保證他在所有情況的behavior都是對的我還真不知道
所以說這東西真的很看情況
網路上kol說了ai多好用但他們也不會知道怎麼把它用在千卡的集群上對吧
我有朋友在銀行或者在quant工作那邊又是完全不同的情況跟問題
每個人都有自己的工作流程目標跟限制
只能在這個為基礎來嘗試把ai容納到工作流裡面去
是說既然為什麼這麼麻煩為什麼還要用ai agent呢
因為人就是懶而agent雖然不是萬能但如果用得好
對於偷懶不對對於提升工作效率還是有很大幫助的
大概這樣一時沒想到啥要寫了睡覺去起來繼續當agent manager

作者: viper9709 (阿達) 2026-02-04 02:07:00

推分享

作者: WTS2accuracy (宝鐘海賊団の一味) 2026-02-04 02:15:00

推那些有用無用一刀切的幻想文根本是廢文

作者: RumiManiac (Rumi!) 2026-02-04 02:15:00

強者推

作者: marra (Marra) 2026-02-04 04:04:00

有份量的人權宣言 ^_^

作者: pacino (carry me) 2026-02-04 07:42:00

如何解決contex window size limit?

作者: kuan (kuan_hiroshi) 2026-02-04 08:23:00

推

作者: neo5277 (I am an agent of chaos) 2026-02-04 09:17:00

一定還是會看過一遍啊

作者: TKB5566 (我們的元首阿道夫希特勒) 2026-02-04 09:43:00

真的很多人覺得ai是廢文製造機

作者: watashino (我同學數學很爛) 2026-02-04 10:21:00

目前用下來context還是很大的問題有時候還是要使用1

作者: yamakazi (大安吳彥祖) 2026-02-04 10:25:00

樓上完全不用1 要把任務拆成小張票每個票大概幾次對話就可以完成然後就叫ai commit寫message不知道怎麼拆叫ai幫你拆

作者: watashino (我同學數學很爛) 2026-02-04 11:14:00

不是你說的問題在大型專案中這種agent一定是用rag的形式做少數狀況下才會讀全文這種context不全很容易出問題

作者: ybite (小犬/小B) 2026-02-04 11:34:00

我用Claude Code VS Code Plugin 餵給它我要改的檔案跟它說我想幹嘛它就左翻右翻看完開始改改完跑測試好了但還是會在很難預料到的地方出差錯或者鬼打牆

作者: yamakazi (大安吳彥祖) 2026-02-04 11:35:00

我只能說 divide and conquer

作者: ybite (小犬/小B) 2026-02-04 11:37:00

長期下來我認為程式碼跟文件整理這種硬功夫即便到了AI時代還是十分重要即便你可能文件不是寫給人看的（Skill之類）

作者: prag222 (prag) 2026-02-04 11:50:00

我用ai寫自製小工具,有bug,殺進去看，解掉不用5分鐘，文件就算了，寫文件是想放輕鬆吃工作時數的吧，寫文件還用zip檔版控用ai寫code 也不存在coding stlye問題，那是人類手工才需要規範，說實在話現在ai還比人工穩，至少不會搞詐欺摸工時拖延症跟埋雷

作者: yamakazi (大安吳彥祖) 2026-02-04 12:12:00

Coding style沒差啦，用clang formatt 自動化style就好。早就沒人在手打調整style了

作者: cybermeow (我有一隻貓) 2026-02-04 12:19:00

我釐清一下我這裡coding style包含用什麼library 或者一些更接近architecture design的問題哪些函數在哪裡做什麼等等

作者: v86861062 (數字人:3) 2026-02-04 12:39:00

推推

作者: dani1992 (dani) 2026-02-04 12:51:00

推推

作者: Obama19 (^_^) 2026-02-04 13:47:00

網紅永遠只跟你介紹實現todo app的效果真正有價值的內容沒有人會分享出來都要自己試過才知道有哪些坑一堆范式隨著model越來越強很多都可以丟了

作者: TiredEvance (Evance) 2026-02-04 13:59:00

謝分享！

作者: ian90911 (xopowo) 2026-02-04 15:44:00

感謝分享

作者: kyrie77 (NTU KI) 2026-02-04 23:31:00

感謝大大分享，使用歷程一模一樣，導致最近在找工作的時候變成額外會思考工作目前導入哪種AI coding tool，很好奇大大有這方面的經驗嗎（從Team Lead/ Manager/ 企業方視角出發）？現在玩過Claude Code和Cursor之後，這兩年來AI幫我寫的code比例越來越高，但面試時聽到有些企業好像沒有買這些工具，或是用自架的Qwen等模型，但使用體感跟商用模型還是差很多… 像是大大文章中提及的其他領域也很好奇他們業內的情況XD (剛好昨天看到Anthropic又讓美股軟體股集體跳水…）

作者: prag222 (prag) 2026-02-05 03:35:00

我朋友大公司都有買AI服務,你面試的公司不夠大間吧,哈我個人是寫提示詞寫小工具,一行CODE都不用手key

作者: louner (louner) 2026-02-05 09:08:00

好奇你們怎麼把agent用在ML上的我只用來做些小修補像是實作GRPO變種寫log與monitor邏輯等我懶得寫的部分或讓agents reproduce某個GitHub的實驗成果不得不說他們省下大量我自己寫的時間但真的要上prod我還是沒那個膽子XDcontext window可以用multi agent緩解譬如讓一個agent delegate tasks到多個sub agnets等與把那些tasks的context從主線任務切出去當然主線任務太長還是沒救

作者: deltasxxk (bighao) 2026-02-05 10:39:00

所以最終還是回歸邏輯清楚定義明確才是效率能否提高的關鍵，原本工作就不明不白的人用AI就是災難

作者: ripple0129 (perry tsai) 2026-02-05 18:48:00

觀念還沒轉變而已，未來沒在看code了，就是產出大量測試碼各種行為與邊界測試。時代在轉變，人類介入就是低效而已。人類越少介入越好，未來連決策次數都還要再降低，當速度越快，成品完成丟棄的成本越低，直接做完你看行不行這樣是未來的方式。

作者: bitcch (必可取) 2026-02-05 20:54:00

人類介入的點不會再是敲鍵盤產code 而是指揮管理大量agent

作者: wulouise (在線上!=在電腦前) 2026-02-05 21:15:00

有style很爛，像是std::chrono duration一直用count

作者: zzshcool (台灣人) 2026-02-05 22:14:00

推，實際用起來，rule skill，還要管理context 更新讓後續接手agent 能銜接，要搞大系統不容易

作者: wizozd84070 2026-02-06 05:19:00

雀有

繼續閱讀

[問卷] 生成式 AI 對工作績效的影響（200P）hina0502 [討論] 不建議考慮地端 modelTonyQ Fw: [系統] Gemini AI共同設計 Cosmos 編程語言 C!!amidha [徵才]法務部調查局資安分析師LittleRuiRui [技術分享] 揭秘百萬級 TPS 核心：Open Exchangemediashow009 Re: [討論] 有人開始使用clawdbot了嗎Fixble3203 [討論] 有人開始使用clawdbot了嗎ripple0129 [心得] QA更應該擁抱AI技術，而不是害怕被其取代gigayaya Re: [討論] 華碩開始用AI取代人力了(?)TonyQ Re: [請益] 碩畢後選擇nuhciewc