看到 META 推出 SAM Audio，感觉很像声音界的 “Prompt AI 2.0”？以前想挑出录音里的某个声音得用好几层插件、手工调参，现在只要对模型说 “把狗叫声去掉”“把吉他拉出来” 这种自然语言提示，它就会按你说的做还有视觉提示功能——视频画面里点一下发声的主体，它就能识别对应音频这对短视频剪辑效率提升可能很猛，毕竟视频剪辑和创作越来越普及，有工具能更智能地把声音拆解出来，对效率提升不小