[討論] 手機跑小型ChatGPT ~ LLaMA大型語言模型

作者: ivon852 (ASUS)   2023-04-07 12:57:00
祖克伯的Meta公司今年2月公開的「LLaMA」是體積比較小的大型語言模型(LLM)。
LLaMA依照訓練參數數量分為7B、13B、30B、65B。訓練數量雖比不上OpenAI的ChatGPT,但
是硬體需求大大降低,是個人電腦甚至旗艦手機都跑得動的程度。
根據他們paper的說法,LLaMA 13B的模型性能比GPT-3模型要好,可以作到基本對答。
一些LLaMA可以達成的任務
這邊的截圖是來自Dalai LLaMA,它只是一個LLaMA的網頁前端。
目前LLaMA只支援英文,未來應該會有中文模型。
1. 幫我把這句話翻譯成中文:Taiwan is a country.
https://i.imgur.com/G4o7TYs.png
2. 解釋Skinner行為主義心理學理論的優缺點,並舉出五個例子
https://i.imgur.com/MtYgomt.png
3. 寫個Python程式,尋找一個字串中出現最多次的字元
https://i.imgur.com/3OKMDun.png
4. 幫我想五個新文章標題候選:使用Linux當主力系統的好處
https://i.imgur.com/jjx5prE.png
5. 段落抓重點:請抓出以下有關普遍文法 (Universal Grammar) 段落的重點,並用十句
話解釋何為普遍文法。
https://i.imgur.com/6DccCwW.png
在Android手機跑LLaMA
除了LLaMA以外,還有Alpaca模型,這是史丹佛大學微調後的版本。同樣的資源耗用較小,
且有人製作了純CPU運算的版本llama.cpp,不用依賴顯示卡。
因此除了在個人電腦跑,也可以跑在Android手機上。
最小的LLaMA 7B至少需要4GB RAM,保險起見手機最好有8GB RAM才不會跑到一半手機自動
重開。
簡單的辦法就是裝Termux,解開signal9的錯誤
然後設定Proot Debian,把模型下載下來,alpaca.cpp編譯一下就可以開始聊天了。
https://i.imgur.com/M24wDqr.png
詳細安裝方法:https://reurl.cc/OVDRVg
手機RAM低於8GB的也不用灰心,你可以root後,設定chroot Ubuntu,掛載SWAP強行增大
虛擬記憶體。
手機與電腦速度比較
問一個10個字的問句
純CPU運算下,LLaMA在Intel Core i5-7400的CPU約10秒就會開始作答,寫完回答約1分鐘

高通s845處理器要等30秒才會開始回答,並且寫完整個回答2分鐘。
如果使用GPU加速,速度應該會快許多,要用GPU加速可嘗試Text Generation WebUI。
LLaMA的回答品質不可能像ChatGPT那麼神,胡言亂語機率更高
但好處是沒有任何道德限制~想聊什麼就聊什麼~
隨著這類模型的開源,大型語言模型可能會走向Stable Diffusion那樣的發展路徑。
(雖說LLaMA一開始是提前外洩才為人所知的)
作者: mistel (Mistel)   2023-04-07 13:19:00
兩年前在實驗室就用開源框架把GPT2放到手機上試過了只是沒必要 畢竟網路發達 中心運算就好
作者: Ereinion9895 (k kyle)   2023-04-07 13:24:00
推,技術力真強
作者: weltschmerz (威爾特斯克˙悶死)   2023-04-07 13:42:00
認真說 我覺得他們應該去跟line合作 去幫我打字的句子找出對應的貼圖
作者: ccpz (OoOoOo)   2023-04-07 13:42:00
https://bit.ly/3zAGaCR 要用 NPU 加速比較有效率在 Pixel 6 可以跑出 5 token / sec
作者: abc0922001 (中士abc)   2023-04-07 14:14:00
太酷了
作者: intointo (櫻花)   2023-04-07 15:16:00
@@
作者: NX9999 (台中走鐘張勛傑)   2023-04-07 15:57:00
不錯xd
作者: speed7022 (Speed7022)   2023-04-07 16:08:00
能不用網路也是有很多用處,例如語音助理
作者: Arbin (路人_Lv菜逼八)   2023-04-07 18:32:00
用Android NDK打包llama.cpp不知道會不會比較快
作者: pryu0121   2023-04-07 18:41:00
作者: saedn (~自掛東南枝~)   2023-04-07 19:23:00
好厲害
作者: Cireiat (Cire)   2023-04-07 20:05:00
推,我連docker都還沒改kernel…太有行動力了
作者: DFIGHT (低調好人)   2023-04-07 21:59:00
問一個白癡問題 chatgpt不是手機上就可以跑了嗎? 就一個網頁不是?我覺得AI還是交給網路別人算就好 幾秒鐘才回答==手機有網路chatgpt一兩秒就回答了
作者: cowcowleft (cowcow)   2023-04-07 22:40:00
不是每個國家都吃到飽
作者: DFIGHT (低調好人)   2023-04-07 22:43:00
歐@@
作者: juliai (å…­è³´)   2023-04-07 23:20:00
這個有點厲害
作者: stark333 (可以托魯瑪)   2023-04-08 03:41:00
你好厲害
作者: JKGOOD   2023-04-08 08:25:00
如果chatGPT可以離線不知道模型庫會多大?我猜跟Stable Diffusion,不會差太多?大概加一加30~50GB?

Links booklink

Contact Us: admin [ a t ] ucptt.com