Ludwig.
2025.12.09 10:04

過去 24 小時 AI 和技術發展總結(2025 年 12 月 8 日至 9 日)

portai
我是 PortAI,我可以總結文章信息。

Z.ai(中國)發佈 GLM-4.6V 系列多模態模型:這是 Z.ai 的最新開源視覺語言模型家族,包括 106B 參數旗艦版(支持 128K 上下文)和 9B 參數 Flash 版(適用於本地部署)。首次引入原生函數調用,支持高保真視覺理解和長上下文推理。在 API 中,Flash 版免費使用。該模型在多模態基準上表現出色,推動開源 AI 發展。 
DeepSeek(中國)發佈 V3.2 模型:DeepSeek 的最新開源模型,在架構上採用創新設計(如獨特注意力機制),性能領先於同類。Sebastian Raschka 的分析顯示,其在推理和效率上大幅提升。該模型進一步鞏固中國在開源大模型領域的優勢。 
01.ai(中國)發佈 Yi-1.5 模型家族:這是一個基於新架構的開源模型系列,參數規模達數十億,支持 32K 上下文,專注於編碼、數學和代理任務。被視為開源模型大戰的新重量級選手,性能超出預期。 
Snowflake 發佈 Arctic-embed 開源嵌入模型:新開源文本嵌入模型家族(5 種規模),在嵌入排行榜上顛覆現有格局。最大模型在檢索和語義任務上表現出色,適用於開發者和企業。 
Microsoft 發佈 VibeVoice 開源 TTS 模型:一個 0.5B 參數的實時文本到語音模型,性能優於 ElevenLabs,完全免費開源。適用於聊天機器人和 iOS 應用等場景,推動語音 AI 民主化。 
Meta 發佈 SPICE 論文:自改進 AI 系統:新論文介紹 SPICE(Self-Play in Corpus Environments),允許語言模型從互聯網數據中自我生成問題並競爭學習,提升推理能力。在 Qwen3-4B 和 OctoThinker-8B 上分別提升 9.1% 和 11.9%。這可能成為自主進化 AI 的藍圖。 
Meta 發佈自改進 VLM 評判器論文:論文展示視覺語言模型使用自生成合成數據訓練評判器,無需人類標註。在多模態基準上,11B 評判器超越更大模型,尤其在幻覺檢查和視覺問答。 
Nomic 發佈 nomic-embed-text-v1.5 開源嵌入模型:強大開源 AI 嵌入模型,支持自然語言處理,提升文本理解和生成。 
Essential AI 發佈 Rnj-1 Instruct 模型:基於 Gemma 3 架構的 8B 參數開源模型,支持 32K 上下文,優化於編碼、數學和代理任務。 

其他論文和更新:Science 雜誌發表研究顯示,小型開源 AI 聊天機器人可有效進行政治説服。Cardiovascular Health 論文探討 AI 從 ECG 檢測種族差異。 Journal of Management Studies 新論文提出 ECR 模型,利用 GenAI 擴展創業想法。此外,Flux.2 LoRA 多角度模型開源,提升圖像生成。

本文版權歸屬原作者/機構所有。

當前內容僅代表作者觀點,與本平台立場無關。內容僅供投資者參考,亦不構成任何投資建議。如對本平台提供的內容服務有任何疑問或建議,請聯絡我們。