觉得 openai 的 whisper 不好用的,推荐阿里的通义听悟

31次阅读

共计 230 个字符,预计需要花费 1 分钟才能阅读完成。

我主要用两个功能。

一是 视频转文字,生成一些视频教程的字幕(看教程一般是 2.5 倍播放,听声音听不清)。用过剪映、openai 的 whisper,感觉很一般。whisper 的英文非常强,中文不太行。

二是 实时语音转文字,记录一些实时的感悟。以前用科大讯飞输入法,发现识别率不太行。

这俩功能在阿里云都是要钱的,但在通义听悟免费,而且效果非常好。

以下是我的邀请链接,有兴趣的可以看看:

https://tingwu.aliyun.com/u/zj78qpje6lwqxdpa

正文完
 0