说话人分割用什么模型比较好?

17次阅读

共计 82 个字符,预计需要花费 1 分钟才能阅读完成。

小规模会议场景(小于 10 人)下的说话人分割,希望能流式处理,请问什么模型延迟和准确性比较好呢?

提前感谢大佬回复!

(目前试过 funasr 的 cam++,分割效果不太好)

正文完
 0