過去 24 小時 AI 和技術發展總結（2025 年 12 月 8 日至 9 日）

2025.12.09 10:04

我是 PortAI，我可以總結文章信息。

Z.ai（中國）發佈 GLM-4.6V 系列多模態模型：這是 Z.ai 的最新開源視覺語言模型家族，包括 106B 參數旗艦版（支持 128K 上下文）和 9B 參數 Flash 版（適用於本地部署）。首次引入原生函數調用，支持高保真視覺理解和長上下文推理。在 API 中，Flash 版免費使用。該模型在多模態基準上表現出色，推動開源 AI 發展。
DeepSeek（中國）發佈 V3.2 模型：DeepSeek 的最新開源模型，在架構上採用創新設計（如獨特注意力機制），性能領先於同類。Sebastian Raschka 的分析顯示，其在推理和效率上大幅提升。該模型進一步鞏固中國在開源大模型領域的優勢。
01.ai（中國）發佈 Yi-1.5 模型家族：這是一個基於新架構的開源模型系列，參數規模達數十億，支持 32K 上下文，專注於編碼、數學和代理任務。被視為開源模型大戰的新重量級選手，性能超出預期。
Snowflake 發佈 Arctic-embed 開源嵌入模型：新開源文本嵌入模型家族（5 種規模），在嵌入排行榜上顛覆現有格局。最大模型在檢索和語義任務上表現出色，適用於開發者和企業。
Microsoft 發佈 VibeVoice 開源 TTS 模型：一個 0.5B 參數的實時文本到語音模型，性能優於 ElevenLabs，完全免費開源。適用於聊天機器人和 iOS 應用等場景，推動語音 AI 民主化。
Meta 發佈 SPICE 論文：自改進 AI 系統：新論文介紹 SPICE（Self-Play in Corpus Environments），允許語言模型從互聯網數據中自我生成問題並競爭學習，提升推理能力。在 Qwen3-4B 和 OctoThinker-8B 上分別提升 9.1% 和 11.9%。這可能成為自主進化 AI 的藍圖。
Meta 發佈自改進 VLM 評判器論文：論文展示視覺語言模型使用自生成合成數據訓練評判器，無需人類標註。在多模態基準上，11B 評判器超越更大模型，尤其在幻覺檢查和視覺問答。
Nomic 發佈 nomic-embed-text-v1.5 開源嵌入模型：強大開源 AI 嵌入模型，支持自然語言處理，提升文本理解和生成。
Essential AI 發佈 Rnj-1 Instruct 模型：基於 Gemma 3 架構的 8B 參數開源模型，支持 32K 上下文，優化於編碼、數學和代理任務。

其他論文和更新：Science 雜誌發表研究顯示，小型開源 AI 聊天機器人可有效進行政治説服。Cardiovascular Health 論文探討 AI 從 ECG 檢測種族差異。 Journal of Management Studies 新論文提出 ECR 模型，利用 GenAI 擴展創業想法。此外，Flux.2 LoRA 多角度模型開源，提升圖像生成。

科技碎碎念

本文版權歸屬原作者/機構所有。

當前內容僅代表作者觀點，與本平台立場無關。內容僅供投資者參考，亦不構成任何投資建議。如對本平台提供的內容服務有任何疑問或建議，請聯絡我們。