
過去 24 小時 AI 和技術發展總結(2025 年 10 月 23 日-24 日)

模型發佈與更新
• xAI 推出物理世界交互 AI 模型:xAI 發佈一款突破性 AI 模型,旨在提升對物理世界的理解和操作,支持機器人和自主系統應用。
• OpenAI 更新 ChatGPT:OpenAI 為 ChatGPT 推出重大更新,提升複雜問題解決的推理能力,併發布 ChatGPT Atlas,一款集成 AI 的瀏覽器,支持上下文記憶和自主操作(macOS 版已上線,其他平台即將跟進)。
• Anthropic 發佈 Claude 3.7 與更新:Anthropic 推出 Claude 3.7,強調增強安全協議;同時更新 Claude 3.5 Sonnet 和 Claude 3.5 Haiku,並添加 “計算機控制” 功能,支持 AI 驅動任務。
• 阿里巴巴(中國)發佈 Qwen3-VL 系列:阿里巴巴推出 Qwen3-VL-2B(適用於邊緣/雲端)和 Qwen3-VL-32B(性能超越 GPT-5-mini 和 Claude 4 Sonnet,與 235B 參數模型相當),併發布免費 AI 聊天機器人服務,支持實時文本/語音交互。
• MistralAI 推出邊緣設備輕量模型:MistralAI 發佈優化版輕量 AI 模型,適用於邊緣設備,降低延遲和功耗。
• DeepSeek(中國背景)開源 DeepSeek-OCR:DeepSeek 開源視覺編碼器模型,支持長文檔光學上下文壓縮,提升 LLM 在視覺任務的表現。
• NVIDIA 開源機器人 AI 模型:NVIDIA 發佈開源機器人 AI 模型和模擬工具,加速人形機器人開發,並開始出貨 DGX Spark 桌面 AI 超級計算機。
新論文
• LightMem:輕量高效記憶增強生成:新論文提出 LightMem 系統,模擬人類記憶模型(Atkinson-Shiffrin),顯著提升 LLM 準確率(+10.9%),減少令牌使用(117 倍)和 API 調用(159 倍),運行時間縮短 12 倍。
• Efficient Long-context Language Model Training:通過核心注意力分離(CAD)技術,提升長上下文 LLM 訓練吞吐量 1.35 倍,在 512 H200 GPU 上支持 512k 令牌上下文。
• Sentient AGI NeurIPS 論文:Sentient AGI 有 4 篇論文入選 NeurIPS,包括 OML 1.0(嵌入 24k 指紋證明模型所有權,無性能損失)、LiveCodeBench Pro(小模型編碼評估,10 倍縮小參數)、MindGames Arena(代理社交學習基準)和 LOCK-LLMs(加密保護開源模型)。
• 其他論文:包括 World-in-World(閉環世界模型)、Grasp Any Region(多模態 LLM 像素理解)和模擬計算芯片論文(模擬內存計算,提升 AI 效率 1000 倍)。
開源項目與公告
• Krea 開源實時文本到視頻模型:Krea 開源 14B 參數文本到視頻模型,支持 B200 GPU 上~11 FPS 實時生成。
• HuggingFace 開源 AI 安全工具包:HuggingFace 發佈開源工具包,幫助開發者保護 AI 模型免受對抗攻擊。
• DeepMind 醫療影像突破:DeepMind 發佈 AI 算法,提升醫療影像診斷準確性。
• Google 量子處理器 Willow:Google 發佈 105 量子比特 Willow 處理器,展示可驗證加速,執行物理算法模擬信息傳播。
• 中國相關公告:阿里 CEO 吳泳銘宣佈開源國內最大 720 億參數模型;京東 CEO 表示正測試 AI 自動生成營銷內容;Sentient AGI 開啓東亞巡迴(北京、上海、首爾),推動開源 AGI。
本文版權歸屬原作者/機構所有。
當前內容僅代表作者觀點,與本平台立場無關。內容僅供投資者參考,亦不構成任何投資建議。如對本平台提供的內容服務有任何疑問或建議,請聯絡我們。

