看到 META 推出 SAM Audio，感覺很像聲音界的 “Prompt AI 2.0”？以前想挑出錄音裏的某個聲音得用好幾層插件、手工調參，現在只要對模型説 “把狗叫聲去掉”“把吉他拉出來” 這種自然語言提示，它就會按你説的做還有視覺提示功能——視頻畫面裏點一下發聲的主體，它就能識別對應音頻這對短視頻剪輯效率提升可能很猛，畢竟視頻剪輯和創作越來越普及，有工具能更智能地把聲音拆解出來，對效率提升不小