深度求索發佈了 OCR 2,採用全新的視覺編碼架構,旨在實現更接近人類的機器視覺

動點科技英文源
2026.01.28 02:34
portai
我是 PortAI,我可以總結文章信息。

中國人工智能初創公司深度求索(DeepSeek)發佈了其最新的光學字符識別模型 DeepSeek-OCR 2,該模型採用了一種新的視覺編碼架構,旨在增強機器對視覺信息的解讀能力。該模型利用 DeepEncoder V2 架構,允許根據上下文動態重新排列圖像組件。它提高了數據壓縮效率並降低了計算成本,達到了 91.09% 的基準得分,比其前身提高了 3.73%。此次發佈反映了中國人工智能開發者在基礎模型和開源能力方面日益激烈的競爭