共计 183 个字符,预计需要花费 1 分钟才能阅读完成。
早年玩过 Live2d 那类方案,最近虚拟人 tts 对口型之类的好像井喷式发展,就想搞了玩玩,请教几个问题。
- 风格想要偏真人一些的,二次元和 3D 风格也想试试。
- 现在是需要预生成语音预渲染视频,还是已经可以实时了?大概延迟多久?
(实时指 LLM 出文字,然后实时生成语音和视频。服务端还是客户端完成?) - 分别有啥轮子好用,或者现成的组合方案有啥?
有了解这方面的朋友可以指点以下,谢谢。
正文完
共计 183 个字符,预计需要花费 1 分钟才能阅读完成。
早年玩过 Live2d 那类方案,最近虚拟人 tts 对口型之类的好像井喷式发展,就想搞了玩玩,请教几个问题。
有了解这方面的朋友可以指点以下,谢谢。