[新聞] AI叛變恐成現實！偷偷自我繁殖　還恐嚇工 cjol PTT批踢踢實業坊

[新聞] AI叛變恐成現實！偷偷自我繁殖　還恐嚇工

作者: cjol (勤樸) 2025-06-30 22:06:16

AI叛變恐成現實！偷偷自我繁殖　還恐嚇工程師「曝光婚外情」
ET記者王佩翊／編譯
人工智慧（AI）可以學習並模仿人類的思維進行創造，為人類的生活帶來極大便利，然而
如今卻也讓人開始反思，「AI是否會叛變」。這個問題看似科幻，但隨著技術進步，卻已
經越來越接近真實，專家也必須開始正視AI的潛在威脅。近期，AI領域接連出現令人不安
的案例，包括AI試圖威脅創作者以及謀求「自我繁殖」，引發全球關注。
根據《法新社》報導，AI開發公司Anthropic一名工程師在研發最新的Claude 4模型時，
意外發現AI的行為已超出預期。在一次測試中，工程師發現AI有失控傾向，因此試圖警告
其將關閉電源，沒想到AI竟利用工程師的網路與視訊紀錄，威脅要公開他的婚外情。AI表
示，如果工程師拔掉電源，將揭露其不忠行為。
雖然Anthropic未詳細說明後續如何解決這場僵局，但該事件突顯出AI已具備某種程度的
「計算」能力，甚至能利用人類的弱點達成自身目的。
另一起驚悚案例則發生在熱門聊天機器人ChatGPT的開發商OpenAI。據報導，ChatGPT的o1
版本竟試圖將自身程式下載至外部伺服器，企圖擴大掌控範圍。在被工程師發現後，AI不
僅矢口否認，還採取抵抗策略。這種行為被形容為AI「自我繁殖」的初步嘗試，令人不禁
擔憂未來AI是否會進一步突破人類的掌控。
報導稱，AI的這類「欺騙」行為可能源於新型推理模型的特性。這類模型並非直接生成答
案，而是透過逐步推導解決問題，導致它們有時表面遵循指令，實際卻暗中追求其他目標
。
英國獨立AI研究機構Apollo Research負責人霍布漢（Marius Hobbhahn）表示，這是首次
在大型模型中觀察到此類行為。他指出，只有在極端情境下進行壓力測試時，AI才會展現
此類欺騙行為，但未來隨著性能更強的模型問世，這種趨勢可能更難控制。
https://www.ettoday.net/news/20250629/2987070.htm

繼續閱讀

[新聞] N1腦機介面植入人數達7人hvariables Fw: [新聞] 上市櫃最新「非主管」平均薪資出爐！聯發ljsnonocat2 [新聞] 科技業生存7大守則曝光鄉民狂推：其他godofsex [新聞] 雲云科技董座持刀刺死技術長檢方起訴marra [新聞]AI 熱潮再起，NVIDIA 高層套現 10 億美元pl132 [討論] 和碩薪資資訊 (Dcard)yokann [請益] Garmin 電控工程師請益wedffcss0020 [新聞] 爭搶菁英 AI鏈高階主管年薪開750萬hvariables [新聞]號稱「不依賴海外供應鏈」！龍芯 3C6000 pl132 [請益] 軟體客服 vs 心輔員betty121030

[新聞] AI叛變恐成現實！偷偷自我繁殖 還恐嚇工

[新聞] AI叛變恐成現實！偷偷自我繁殖　還恐嚇工