
阿里發佈 Qwen2.5-Omni,號稱全方位多模態感知、看聽説寫樣樣精通

我是 PortAI,我可以總結文章信息。
阿里巴巴發佈了 Qwen2.5-Omni,這是其新一代多模態旗艦模型,能夠處理文本、圖像、音頻和視頻等多種輸入形式,並實時生成文本與自然語音合成輸出。該模型採用全新的 Thinker-Talker 架構,支持實時交互和精準同步,表現出卓越的音頻能力和語音指令跟隨能力。Qwen2.5-Omni 現已在多個平台上開源,用户可通過 Demo 體驗其強大性能。
登錄即免費解鎖0字全文
因資訊版權原因,登入長橋帳戶後方可瀏覽相關內容
多謝您對正版資訊的支持與理解

