Ludwig.
2025.09.06 09:34

过去 24 小时(2025 年 9 月 5 日至 6 日)最重要的 AI 与技术发展总结

portai
我是 PortAI,我可以總結文章信息。

模型發佈和更新

瑞士大學的 Apertus:瑞士推出 Apertus,這是一個完全透明且開源的多語言 AI 語言模型(8B 和 70B 參數),強調倫理 AI、數據隱私和信任。它被設計為 ChatGPT 等商業模型的替代品,性能可與 Llama 3 媲美。 

DeepCogito v2:一個開源 AI 模型,具有增強的邏輯推理和任務規劃能力,在基準測試中優於許多專有模型。

DeepSeek V3.1(中國):來自中國 AI 公司 DeepSeek 的頂級開源模型,在複雜推理、編碼和代理任務中表現出重大進步,與領先的封閉模型競爭。

HunyuanWorld-Voyager(中國):騰訊發佈了這個開源的超長範圍世界模型,用於 3D 重建,在斯坦福的 WorldScore 等基準測試中位居榜首。它針對 VR、遊戲和模擬進行了優化,具有原生 3D 輸出和可擴展內存。 

OpenAI Realtime API:現在正式可用(退出 beta 版),支持生產語音代理,具有新功能,如 gpt-realtime 模型、圖像輸入、SIP 呼叫和可重用提示。

MistralAI 開源模型:針對開發者的新發布,用於使用低資源構建自定義應用。

StabilityAI 圖像生成更新:增強渲染以實現更逼真的輸出。

Google NanoBanana 模型:集成到 ai4spaces 中,用於轉變室內設計和房地產圖像。

開源語音模型:發佈了一個超富有表現力、高質量的語音 AI,據稱超越 ElevenLabs,完全免費且無限制。

即將推出:DeepSeek 代理模型(中國):計劃於 2025 年底發佈,專注於代理以與美國模型競爭;早期發佈因華為芯片問題而延遲。

即將推出:xAI 自定義視頻 AI:埃隆·馬斯克宣佈了一個強大的新視頻模型(可能與 Google 的 Veo 3 競爭),將在兩週內準備好,從現成開源轉向。

新論文

LLaVA-Critic-R1:探討批評模型作為邏輯推理評估和 LLM 微調的強大策略模型。 

長序列處理中的狀態空間建模:Transformer 時代遞歸的調查,更新了 Mamba2、RWKV、DeltaNet 和 GLA 等模型的見解。

NVIDIA SLM 代理框架:提出小型語言模型代理,可能在效率和複雜任務性能上優於 LLM。

每日 AI 論文摘要(9 月 4-5 日):亮點包括 “Open Data Synthesis For Deep Research”、“Robix: Unified Model for Robot Interaction”、“LMEnt: Analyzing Knowledge in LMs”、“MOSAIC: Multi-Subject Personalized Generation” 等,更多關於生成模型、規劃和推理的內容。 

代理 AI 的興起:對代理 AI 系統的定義、框架、架構、應用、指標和挑戰的審查。 鏈接:

開源項目和工具

ROMA(Recursive Open Meta Agent)由 Sentient AGI:一個多代理框架,用於複雜任務,在 FRAMES(81.7%)和 SimpleQA(93.9%)等基準測試中實現 SOTA。完全開源以實現可擴展性和透明度。 

Bytebot AI:一個自託管的 AI 桌面代理,用於通過自然語言在容器化 Linux 環境中自動化任務。 

Hugging Face 新數據集:一個多語言文本處理數據集,用於 AI 訓練。

Dobby AI 更新:發佈了主要功能,由 Sentient AGI 的開源模型驅動。

Yiff AI 更新:添加了自定義模型,如 “Yiff AI Advanced” 和 BB95 Furry,用於圖像生成。

其他熱門倉庫:Kestra(帶有 AI 插件的工作流編排,20k+ 星標)、Wazuh(開源安全平台,13k+ 星標)。 

其他公告

NeurIPS 2025 提交:創紀錄的 18,000 篇論文,比去年增長 30%,突顯 AI 研究快速增長。

Tesla Autopilot AI 更新:改進了導航和障礙物檢測。

IBM Watson 擴展:新的 AI 工具用於業務分析和供應鏈。

Waymo 擴展:AI 驅動的叫車服務擴展到新城市。

AI 倫理指南更新:來自 AIEthicsLab,強調透明度。

本文版權歸屬原作者/機構所有。

當前內容僅代表作者觀點,與本平台立場無關。內容僅供投資者參考,亦不構成任何投資建議。如對本平台提供的內容服務有任何疑問或建議,請聯絡我們。