请教关于 AI 生图、音频、视频的本地部署及 api 问题

17次阅读

共计 441 个字符,预计需要花费 2 分钟才能阅读完成。

请教有 AI 生图、音频、视频的本地部署经验的朋友,有客户呢,对这块兴趣挺高,
想合作做一点事情,但是需要我们先做到能演示的地步再谈下一步合作。
技术背景,后端开发背景。AIGC 生成文本的各大厂家的各种 api 调用,或是自建 llm3 服务都熟悉。
前两天 sd3(英文生成图 这不也开源了嘛),就是视频这块,一直没有打通可用的大厂 api 或者自建。
自建平台,目前只有咸鱼购的两块 3060Ti 的显卡,可验证一些本地的可行性,然后再租赁 gpu 部署 … 大概这思路。
AI 音视频 确实太陌生,没太多时间摸索。
特向有经验者请教几个问题:
1. 文生视频、图生视频,目前是否有可以 API 调用的厂家服务。
2. 文生视频、图生视频,自部署测试的话,3060Ti,够不够扛,用到哪些开源框架,有没有例子。
3. 数字人克隆的全流程,可以私有化部署的框架?哪种比较可靠运转。
4. 那种给一张图片,就来一段 2 分钟左右的 ktv 音乐的,自部署怎么搞的。
谢谢有经验的人分享一下经验,个人动手能力比较强,后面就争取动手干起来给客户演示,再看下一步

正文完
 0