共计 82 个字符,预计需要花费 1 分钟才能阅读完成。
小规模会议场景(小于 10 人)下的说话人分割,希望能流式处理,请问什么模型延迟和准确性比较好呢?
提前感谢大佬回复!
(目前试过 funasr 的 cam++,分割效果不太好)
正文完
共计 82 个字符,预计需要花费 1 分钟才能阅读完成。
小规模会议场景(小于 10 人)下的说话人分割,希望能流式处理,请问什么模型延迟和准确性比较好呢?
提前感谢大佬回复!
(目前试过 funasr 的 cam++,分割效果不太好)