牧羊聽海
2023.09.25 22:13

$英偉達(NVDA.US)

ChatGPT 現在可以看到、聽到和説話 —— GPT-4 多模態版本上線

OpenAI 開始在 ChatGPT 中推出新的語音和圖像功能,允許您進行語音對話或向 ChatGPT 展示畫面。Plus 和企業用户將在未來兩週內體驗語音和圖像,不久後推出給其他用户組,包括開發人員。

圖像理解由多模態 GPT-3.5 和 GPT-4 提供支持,你現在可以向 ChatGPT 展示一個或多個圖像。這些模型可以將其語言推理技能應用於各種圖像,例如照片、屏幕截圖以及包含文本和圖像的文檔。

文本轉語音由新的模型提供支持,它能夠從幾秒鐘的真實語音中製作出逼真的合成語音。ChatGPT 的預設語音來自直接合作的專業配音演員。語音轉文本由 OpenAI Whisper 模型支持。

本文版權歸屬原作者/機構所有。

當前內容僅代表作者觀點,與本平台立場無關。內容僅供投資者參考,亦不構成任何投資建議。如對本平台提供的內容服務有任何疑問或建議,請聯絡我們。