过去 24 小时（2025 年 9 月 5 日至 6 日）最重要的 AI 与技术发展总结

模型發佈和更新

•瑞士大學的 Apertus：瑞士推出 Apertus，這是一個完全透明且開源的多語言 AI 語言模型（8B 和 70B 參數），強調倫理 AI、數據隱私和信任。它被設計為 ChatGPT 等商業模型的替代品，性能可與 Llama 3 媲美。

•DeepCogito v2：一個開源 AI 模型，具有增強的邏輯推理和任務規劃能力，在基準測試中優於許多專有模型。

•DeepSeek V3.1（中國）：來自中國 AI 公司 DeepSeek 的頂級開源模型，在複雜推理、編碼和代理任務中表現出重大進步，與領先的封閉模型競爭。

•HunyuanWorld-Voyager（中國）：騰訊發佈了這個開源的超長範圍世界模型，用於 3D 重建，在斯坦福的 WorldScore 等基準測試中位居榜首。它針對 VR、遊戲和模擬進行了優化，具有原生 3D 輸出和可擴展內存。

•OpenAI Realtime API：現在正式可用（退出 beta 版），支持生產語音代理，具有新功能，如 gpt-realtime 模型、圖像輸入、SIP 呼叫和可重用提示。

•MistralAI 開源模型：針對開發者的新發布，用於使用低資源構建自定義應用。

•StabilityAI 圖像生成更新：增強渲染以實現更逼真的輸出。

•Google NanoBanana 模型：集成到 ai4spaces 中，用於轉變室內設計和房地產圖像。

•開源語音模型：發佈了一個超富有表現力、高質量的語音 AI，據稱超越 ElevenLabs，完全免費且無限制。

•即將推出：DeepSeek 代理模型（中國）：計劃於 2025 年底發佈，專注於代理以與美國模型競爭；早期發佈因華為芯片問題而延遲。

•即將推出：xAI 自定義視頻 AI：埃隆·馬斯克宣佈了一個強大的新視頻模型（可能與 Google 的 Veo 3 競爭），將在兩週內準備好，從現成開源轉向。

新論文

•LLaVA-Critic-R1：探討批評模型作為邏輯推理評估和 LLM 微調的強大策略模型。

•長序列處理中的狀態空間建模：Transformer 時代遞歸的調查，更新了 Mamba2、RWKV、DeltaNet 和 GLA 等模型的見解。

•NVIDIA SLM 代理框架：提出小型語言模型代理，可能在效率和複雜任務性能上優於 LLM。

•每日 AI 論文摘要（9 月 4-5 日）：亮點包括 “Open Data Synthesis For Deep Research”、“Robix: Unified Model for Robot Interaction”、“LMEnt: Analyzing Knowledge in LMs”、“MOSAIC: Multi-Subject Personalized Generation” 等，更多關於生成模型、規劃和推理的內容。

•代理 AI 的興起：對代理 AI 系統的定義、框架、架構、應用、指標和挑戰的審查。鏈接：

開源項目和工具

•ROMA（Recursive Open Meta Agent）由 Sentient AGI：一個多代理框架，用於複雜任務，在 FRAMES（81.7%）和 SimpleQA（93.9%）等基準測試中實現 SOTA。完全開源以實現可擴展性和透明度。

•Bytebot AI：一個自託管的 AI 桌面代理，用於通過自然語言在容器化 Linux 環境中自動化任務。

•Hugging Face 新數據集：一個多語言文本處理數據集，用於 AI 訓練。

•Dobby AI 更新：發佈了主要功能，由 Sentient AGI 的開源模型驅動。

•Yiff AI 更新：添加了自定義模型，如 “Yiff AI Advanced” 和 BB95 Furry，用於圖像生成。

•其他熱門倉庫：Kestra（帶有 AI 插件的工作流編排，20k+ 星標）、Wazuh（開源安全平台，13k+ 星標）。

其他公告

•NeurIPS 2025 提交：創紀錄的 18,000 篇論文，比去年增長 30%，突顯 AI 研究快速增長。

•Tesla Autopilot AI 更新：改進了導航和障礙物檢測。

•IBM Watson 擴展：新的 AI 工具用於業務分析和供應鏈。

•Waymo 擴展：AI 驅動的叫車服務擴展到新城市。

•AI 倫理指南更新：來自 AIEthicsLab，強調透明度。