请教关于 AI 生图、音频、视频的本地部署及 api 问题

17次阅读

共计 441 个字符，预计需要花费 2 分钟才能阅读完成。

请教有 AI 生图、音频、视频的本地部署经验的朋友，有客户呢，对这块兴趣挺高，
想合作做一点事情，但是需要我们先做到能演示的地步再谈下一步合作。
技术背景，后端开发背景。AIGC 生成文本的各大厂家的各种 api 调用，或是自建 llm3 服务都熟悉。
前两天 sd3(英文生成图这不也开源了嘛），就是视频这块，一直没有打通可用的大厂 api 或者自建。
自建平台，目前只有咸鱼购的两块 3060Ti 的显卡，可验证一些本地的可行性，然后再租赁 gpu 部署 … 大概这思路。
AI 音视频确实太陌生，没太多时间摸索。
特向有经验者请教几个问题：
1. 文生视频、图生视频，目前是否有可以 API 调用的厂家服务。
2. 文生视频、图生视频，自部署测试的话，3060Ti，够不够扛，用到哪些开源框架，有没有例子。
3. 数字人克隆的全流程，可以私有化部署的框架？哪种比较可靠运转。
4. 那种给一张图片，就来一段 2 分钟左右的 ktv 音乐的，自部署怎么搞的。
谢谢有经验的人分享一下经验，个人动手能力比较强，后面就争取动手干起来给客户演示，再看下一步

正文完