看到 META 推出 SAM Audio,感覺很像聲音界的 “Prompt AI 2.0”?以前想挑出錄音裏的某個聲音得用好幾層插件、手工調參,現在只要對模型説 “把狗叫聲去掉”“把吉他拉出來” 這種自然語言提示,它就會按你説的做還有視覺提示功能——視頻畫面裏點一下發聲的主體,它就能識別對應音頻這對短視頻剪輯效率提升可能很猛,畢竟視頻剪輯和創作越來越普及,有工具能更智能地把聲音拆解出來,對效率提升不小
看到 META 推出 SAM Audio,感覺很像聲音界的 “Prompt AI 2.0”?以前想挑出錄音裏的某個聲音得用好幾層插件、手工調參,現在只要對模型説 “把狗叫聲去掉”“把吉他拉出來” 這種自然語言提示,它就會按你説的做還有視覺提示功能——視頻畫面裏點一下發聲的主體,它就能識別對應音頻這對短視頻剪輯效率提升可能很猛,畢竟視頻剪輯和創作越來越普及,有工具能更智能地把聲音拆解出來,對效率提升不小