谷歌和 OpenAI 的 AI 模型出現幻覺的頻率正在上升

Benzinga
2025.06.13 17:31
portai
我是 PortAI,我可以總結文章信息。

專家警告稱,谷歌的 AI 概述越來越多地 “幻覺” 出虛假信息,使用户偏離準確來源。自 2024 年 5 月推出以來,由谷歌的 Gemini AI 生成的這些摘要因其不準確性而受到批評,最近的研究顯示 OpenAI 模型的幻覺率在 33% 到 48% 之間。儘管谷歌聲稱有所改善,但專家指出錯誤的頻率正在上升,導致合法文章的點擊率顯著下降。這一趨勢引發了人們對 AI 系統效率和虛假信息傳播的擔憂

專家警告《倫敦時報》,谷歌的 AI 概述正在 “幻覺” 虛假信息,並將點擊量從準確來源中轉移。

谷歌在 2024 年 5 月推出了其 AI 概述,這一功能旨在為搜索查詢提供快速答案。摘要由谷歌的 Gemini AI 撰寫——這是一種類似於 ChatGPT 的大型語言模型——它掃描搜索結果以創建圖表,幷包含一些來源的鏈接。

不要錯過:

  • 製造 6 萬美元可摺疊房屋的公司擁有 3 座工廠建築,建造了 600 多套房屋,並計劃解決住房問題——這是您以每股 0.80 美元成為投資者的最後機會。
  • 彼得·蒂爾將 1700 美元變成了 50 億美元——現在合格投資者正在關注這傢俱有類似突破潛力的軟件公司。瞭解如何以每股僅 0.30 美元投資 1000 美元。

谷歌搜索副總裁伊麗莎白·裏德在一篇博客文章中表示,這些概述旨在成為一個 “起點”,為網頁提供更高質量的點擊。“人們更有可能停留在 [那些頁面] 上,因為我們在找到正確的信息和有用的網頁方面做得更好。”

然而,專家告訴《倫敦時報》,這些答案可能是 “自信地錯誤”,並將搜索者引向不合法的信息。

當生成性 AI 想象事實或以其他方式出錯時,計算機科學家稱之為幻覺。這些幻覺可能包括對不存在的科學論文的引用,例如 NOTUS 發現的在衞生與公共服務部長羅伯特·F·肯尼迪的《讓美國再次健康》報告中被引用的論文,以及其他一系列判斷錯誤。

趨勢:投資痛點——幫助數百萬患者康復:投資 Cytonics,幫助打破 3900 億美元的製藥巨頭壟斷。

《倫敦時報》報道,在 AI 概述去年推出後不久,用户開始指出這些摘要中包含不準確信息的頻率。其中一個最臭名昭著的幻覺是建議用户在比薩醬中添加無毒膠水,以幫助奶酪更好地粘附。

預 IPO 優惠:以每股僅 0.80 美元的價格成為 BOXABL 的早期股東,分享近 5 萬億美元的全球機會。

  • 巨大的需求與顛覆潛力 – Boxabl 已收到超過 190,000 套房屋的興趣,定位為住房市場的主要顛覆者。
  • 革命性的製造方法 – 受亨利·福特的流水線啓發,Boxabl 的可摺疊微型住宅旨在實現高效生產,使得擁有住房變得更加可及。
  • 可負擔的投資機會 – 房屋定價為 6 萬美元,Boxabl 正在籌集 10 億美元以擴大生產,為投資者提供擁有其增長股份的機會。

股價:$0.80

最低投資:$1,000

估值:$35 億

谷歌對此進行了反駁,聲稱許多流傳的例子都是虛假的,但裏德在她的博客文章中承認 “確實出現了一些奇怪、不準確或無用的 AI 概述。雖然這些通常是針對人們不常做的查詢,但它突顯了我們需要改進的一些具體領域。”

根據與《倫敦時報》交談的專家,儘管技術進步和改進,幻覺的情況卻在惡化而非改善。新的推理系統產生的錯誤響應比其前任更多,設計者們也不確定原因。

在一項最近的研究中發現,根據《倫敦時報》,OpenAI 的兩個最新模型 o3 和 04-mini 的幻覺率分別為 33% 和 48%。這些百分比是之前模型的兩倍多。

谷歌的 AI 概述或 ChatGPT 摘要等功能也在將點擊量從更準確的資源中轉移。科技公司 Authoritas 的創始人勞倫斯·奧圖爾追蹤了 AI 概述的影響,並告訴《倫敦時報》,當它們存在時,點擊文章的點擊率下降了 40% 到 60%。

AI 提供不準確信息並導致搜索者點擊更準確文章的複合問題讓許多人擔心效率和假新聞的傳播。

“您花了很多時間試圖弄清哪些響應是事實,哪些不是,” Okahu 的首席執行官普拉蒂克·維爾馬上個月告訴《紐約時報》。Okahu 與 AI 工程師合作以改善技術,並幫助公司解決問題,包括幻覺。“不正確地處理這些錯誤基本上消除了 AI 系統的價值,而這些系統本應為您自動化任務,” 他説。

  • 你富有嗎? 這是美國人認為您需要被視為富有的標準。
  • 受 Uber 和 Airbnb 啓發——德勤增長最快的軟件公司正在將 70 億部智能手機轉變為收入生成資產——您可以以每股僅 0.30 美元投資 1000 美元!

圖片:Shutterstock