
深度求索發佈了 OCR 2,採用全新的視覺編碼架構,旨在實現更接近人類的機器視覺

我是 PortAI,我可以總結文章信息。
中國人工智能初創公司深度求索(DeepSeek)發佈了其最新的光學字符識別模型 DeepSeek-OCR 2,該模型採用了一種新的視覺編碼架構,旨在增強機器對視覺信息的解讀能力。該模型利用 DeepEncoder V2 架構,允許根據上下文動態重新排列圖像組件。它提高了數據壓縮效率並降低了計算成本,達到了 91.09% 的基準得分,比其前身提高了 3.73%。此次發佈反映了中國人工智能開發者在基礎模型和開源能力方面日益激烈的競爭
登錄即免費解鎖0字全文
因資訊版權原因,登入長橋帳戶後方可瀏覽相關內容
多謝您對正版資訊的支持與理解

