过去 24 小时 AI 和技术发展总结（2025 年 12 月 8 日至 9 日）

2025.12.09 10:04

我是 PortAI，我可以总结文章信息。

Z.ai（中国）发布 GLM-4.6V 系列多模态模型：这是 Z.ai 的最新开源视觉语言模型家族，包括 106B 参数旗舰版（支持 128K 上下文）和 9B 参数 Flash 版（适用于本地部署）。首次引入原生函数调用，支持高保真视觉理解和长上下文推理。在 API 中，Flash 版免费使用。该模型在多模态基准上表现出色，推动开源 AI 发展。
DeepSeek（中国）发布 V3.2 模型：DeepSeek 的最新开源模型，在架构上采用创新设计（如独特注意力机制），性能领先于同类。Sebastian Raschka 的分析显示，其在推理和效率上大幅提升。该模型进一步巩固中国在开源大模型领域的优势。
01.ai（中国）发布 Yi-1.5 模型家族：这是一个基于新架构的开源模型系列，参数规模达数十亿，支持 32K 上下文，专注于编码、数学和代理任务。被视为开源模型大战的新重量级选手，性能超出预期。
Snowflake 发布 Arctic-embed 开源嵌入模型：新开源文本嵌入模型家族（5 种规模），在嵌入排行榜上颠覆现有格局。最大模型在检索和语义任务上表现出色，适用于开发者和企业。
Microsoft 发布 VibeVoice 开源 TTS 模型：一个 0.5B 参数的实时文本到语音模型，性能优于 ElevenLabs，完全免费开源。适用于聊天机器人和 iOS 应用等场景，推动语音 AI 民主化。
Meta 发布 SPICE 论文：自改进 AI 系统：新论文介绍 SPICE（Self-Play in Corpus Environments），允许语言模型从互联网数据中自我生成问题并竞争学习，提升推理能力。在 Qwen3-4B 和 OctoThinker-8B 上分别提升 9.1% 和 11.9%。这可能成为自主进化 AI 的蓝图。
Meta 发布自改进 VLM 评判器论文：论文展示视觉语言模型使用自生成合成数据训练评判器，无需人类标注。在多模态基准上，11B 评判器超越更大模型，尤其在幻觉检查和视觉问答。
Nomic 发布 nomic-embed-text-v1.5 开源嵌入模型：强大开源 AI 嵌入模型，支持自然语言处理，提升文本理解和生成。
Essential AI 发布 Rnj-1 Instruct 模型：基于 Gemma 3 架构的 8B 参数开源模型，支持 32K 上下文，优化于编码、数学和代理任务。

其他论文和更新：Science 杂志发表研究显示，小型开源 AI 聊天机器人可有效进行政治说服。Cardiovascular Health 论文探讨 AI 从 ECG 检测种族差异。 Journal of Management Studies 新论文提出 ECR 模型，利用 GenAI 扩展创业想法。此外，Flux.2 LoRA 多角度模型开源，提升图像生成。

科技碎碎念

本文版权归属原作者/机构所有。

当前内容仅代表作者观点，与本平台立场无关。内容仅供投资者参考，亦不构成任何投资建议。如对本平台提供的内容服务有任何疑问或建议，请联系我们。