有个叫字说的App可以一键生成 三花AI的小视频宝有这种方案。 还能给你配上icon呢 我看了下这个博主的抖音,他的视频一般在3分钟左右。输入一段长文案(可能1000字左右),现有的文生视频模型很难输出3分钟的AI视频。我估计大概率还是以传统策略为主。现在抖音的剪映App可以做到,你输入一段长文案,它会通过AI分句,然后对每个句子单独生成黑底白字的图片,然后生成声音,最后融合起来。我猜测剪映的路径是这样的,不难实现。 github上有个这样的开源项目,就是视频接口还是国外网站,人像素材都是外国人 MoneyPrinterTurbo