看到 META 推出 SAM Audio,感觉很像声音界的 “Prompt AI 2.0”?以前想挑出录音里的某个声音得用好几层插件、手工调参,现在只要对模型说 “把狗叫声去掉”“把吉他拉出来” 这种自然语言提示,它就会按你说的做还有视觉提示功能——视频画面里点一下发声的主体,它就能识别对应音频这对短视频剪辑效率提升可能很猛,毕竟视频剪辑和创作越来越普及,有工具能更智能地把声音拆解出来,对效率提升不小
看到 META 推出 SAM Audio,感觉很像声音界的 “Prompt AI 2.0”?以前想挑出录音里的某个声音得用好几层插件、手工调参,现在只要对模型说 “把狗叫声去掉”“把吉他拉出来” 这种自然语言提示,它就会按你说的做还有视觉提示功能——视频画面里点一下发声的主体,它就能识别对应音频这对短视频剪辑效率提升可能很猛,毕竟视频剪辑和创作越来越普及,有工具能更智能地把声音拆解出来,对效率提升不小