過去 24 小時 AI 和技術發展總結（2025 年 10 月 23 日-24 日）

模型發佈與更新
• xAI 推出物理世界交互 AI 模型：xAI 發佈一款突破性 AI 模型，旨在提升對物理世界的理解和操作，支持機器人和自主系統應用。
• OpenAI 更新 ChatGPT：OpenAI 為 ChatGPT 推出重大更新，提升複雜問題解決的推理能力，併發布 ChatGPT Atlas，一款集成 AI 的瀏覽器，支持上下文記憶和自主操作（macOS 版已上線，其他平台即將跟進）。
• Anthropic 發佈 Claude 3.7 與更新：Anthropic 推出 Claude 3.7，強調增強安全協議；同時更新 Claude 3.5 Sonnet 和 Claude 3.5 Haiku，並添加 “計算機控制” 功能，支持 AI 驅動任務。
• 阿里巴巴（中國）發佈 Qwen3-VL 系列：阿里巴巴推出 Qwen3-VL-2B（適用於邊緣/雲端）和 Qwen3-VL-32B（性能超越 GPT-5-mini 和 Claude 4 Sonnet，與 235B 參數模型相當），併發布免費 AI 聊天機器人服務，支持實時文本/語音交互。
• MistralAI 推出邊緣設備輕量模型：MistralAI 發佈優化版輕量 AI 模型，適用於邊緣設備，降低延遲和功耗。
• DeepSeek（中國背景）開源 DeepSeek-OCR：DeepSeek 開源視覺編碼器模型，支持長文檔光學上下文壓縮，提升 LLM 在視覺任務的表現。
• NVIDIA 開源機器人 AI 模型：NVIDIA 發佈開源機器人 AI 模型和模擬工具，加速人形機器人開發，並開始出貨 DGX Spark 桌面 AI 超級計算機。

新論文
• LightMem：輕量高效記憶增強生成：新論文提出 LightMem 系統，模擬人類記憶模型（Atkinson-Shiffrin），顯著提升 LLM 準確率（+10.9%），減少令牌使用（117 倍）和 API 調用（159 倍），運行時間縮短 12 倍。
• Efficient Long-context Language Model Training：通過核心注意力分離（CAD）技術，提升長上下文 LLM 訓練吞吐量 1.35 倍，在 512 H200 GPU 上支持 512k 令牌上下文。
• Sentient AGI NeurIPS 論文：Sentient AGI 有 4 篇論文入選 NeurIPS，包括 OML 1.0（嵌入 24k 指紋證明模型所有權，無性能損失）、LiveCodeBench Pro（小模型編碼評估，10 倍縮小參數）、MindGames Arena（代理社交學習基準）和 LOCK-LLMs（加密保護開源模型）。
• 其他論文：包括 World-in-World（閉環世界模型）、Grasp Any Region（多模態 LLM 像素理解）和模擬計算芯片論文（模擬內存計算，提升 AI 效率 1000 倍）。

開源項目與公告
• Krea 開源實時文本到視頻模型：Krea 開源 14B 參數文本到視頻模型，支持 B200 GPU 上～11 FPS 實時生成。
• HuggingFace 開源 AI 安全工具包：HuggingFace 發佈開源工具包，幫助開發者保護 AI 模型免受對抗攻擊。
• DeepMind 醫療影像突破：DeepMind 發佈 AI 算法，提升醫療影像診斷準確性。
• Google 量子處理器 Willow：Google 發佈 105 量子比特 Willow 處理器，展示可驗證加速，執行物理算法模擬信息傳播。
• 中國相關公告：阿里 CEO 吳泳銘宣佈開源國內最大 720 億參數模型；京東 CEO 表示正測試 AI 自動生成營銷內容；Sentient AGI 開啓東亞巡迴（北京、上海、首爾），推動開源 AGI。