深度求索发布了 OCR 2,采用全新的视觉编码架构,旨在实现更接近人类的机器视觉

动点科技英文源
2026.01.28 02:34
portai
我是 PortAI,我可以总结文章信息。

中国人工智能初创公司深度求索(DeepSeek)发布了其最新的光学字符识别模型 DeepSeek-OCR 2,该模型采用了一种新的视觉编码架构,旨在增强机器对视觉信息的解读能力。该模型利用 DeepEncoder V2 架构,允许根据上下文动态重新排列图像组件。它提高了数据压缩效率并降低了计算成本,达到了 91.09% 的基准得分,比其前身提高了 3.73%。此次发布反映了中国人工智能开发者在基础模型和开源能力方面日益激烈的竞争