Ludwig.
2025.12.09 10:04

过去 24 小时 AI 和技术发展总结(2025 年 12 月 8 日至 9 日)

portai
我是 PortAI,我可以总结文章信息。

Z.ai(中国)发布 GLM-4.6V 系列多模态模型:这是 Z.ai 的最新开源视觉语言模型家族,包括 106B 参数旗舰版(支持 128K 上下文)和 9B 参数 Flash 版(适用于本地部署)。首次引入原生函数调用,支持高保真视觉理解和长上下文推理。在 API 中,Flash 版免费使用。该模型在多模态基准上表现出色,推动开源 AI 发展。 
DeepSeek(中国)发布 V3.2 模型:DeepSeek 的最新开源模型,在架构上采用创新设计(如独特注意力机制),性能领先于同类。Sebastian Raschka 的分析显示,其在推理和效率上大幅提升。该模型进一步巩固中国在开源大模型领域的优势。 
01.ai(中国)发布 Yi-1.5 模型家族:这是一个基于新架构的开源模型系列,参数规模达数十亿,支持 32K 上下文,专注于编码、数学和代理任务。被视为开源模型大战的新重量级选手,性能超出预期。 
Snowflake 发布 Arctic-embed 开源嵌入模型:新开源文本嵌入模型家族(5 种规模),在嵌入排行榜上颠覆现有格局。最大模型在检索和语义任务上表现出色,适用于开发者和企业。 
Microsoft 发布 VibeVoice 开源 TTS 模型:一个 0.5B 参数的实时文本到语音模型,性能优于 ElevenLabs,完全免费开源。适用于聊天机器人和 iOS 应用等场景,推动语音 AI 民主化。 
Meta 发布 SPICE 论文:自改进 AI 系统:新论文介绍 SPICE(Self-Play in Corpus Environments),允许语言模型从互联网数据中自我生成问题并竞争学习,提升推理能力。在 Qwen3-4B 和 OctoThinker-8B 上分别提升 9.1% 和 11.9%。这可能成为自主进化 AI 的蓝图。 
Meta 发布自改进 VLM 评判器论文:论文展示视觉语言模型使用自生成合成数据训练评判器,无需人类标注。在多模态基准上,11B 评判器超越更大模型,尤其在幻觉检查和视觉问答。 
Nomic 发布 nomic-embed-text-v1.5 开源嵌入模型:强大开源 AI 嵌入模型,支持自然语言处理,提升文本理解和生成。 
Essential AI 发布 Rnj-1 Instruct 模型:基于 Gemma 3 架构的 8B 参数开源模型,支持 32K 上下文,优化于编码、数学和代理任务。 

其他论文和更新:Science 杂志发表研究显示,小型开源 AI 聊天机器人可有效进行政治说服。Cardiovascular Health 论文探讨 AI 从 ECG 检测种族差异。 Journal of Management Studies 新论文提出 ECR 模型,利用 GenAI 扩展创业想法。此外,Flux.2 LoRA 多角度模型开源,提升图像生成。

本文版权归属原作者/机构所有。

当前内容仅代表作者观点,与本平台立场无关。内容仅供投资者参考,亦不构成任何投资建议。如对本平台提供的内容服务有任何疑问或建议,请联系我们。