文章详情

专注互联网科技,赋能企业数字化发展

AI短视频实战~台词转分镜

作者:AI短视频实战~台词转分镜

分享下,这两天针对台词生成分镜需求的模型选型过程 之前笔记也跟大家分享过,我们最近开始搞AI短视频制作平台了 流程中,会涉及到将台词转换成分镜描述 这里使用大语言模型生成 我想跟gpt详细沟通了我的业务场景,需求背景,目的 让gpt给我生成业务需要的prompt 虽然说现在基本都依赖大模型自己生成prompt了 但是我还是建议对大模型给的prompt去人工走读一遍 有些地方存在不合理,或者有冗余 手动修改一版,基本就大差不差了 或者更多的时候,是你没有给到大模型足够的信息 所以给出来的提示词没那么精确 给出提示词后,接下来就是使用不同模型生成分镜描述 我这次使用了qwen,deepseek,gpt,claude模型 因为设计到多个模型的结果收集 这里我推荐大家一个工具,cherry studio 非常方便,可以一套提示词,@多个模型, 这些模型就会同时一次性给出结果 把结果规整到excel表格里面,这个步骤是我自己手动做的 其实有点繁琐,为什么不用agent类产品呢 如果我每个模型都有key的话,我肯定就用agent来做了 生成台词+不同模型的分镜结果汇总到一个excel表格后 接下来就是分镜描述评测 我把这excel表格,丢给了codex 跟他讨论了背景和我的目标 又跟他讨论了评测的方案,达成一致后 他就自己使用gpt5.5模型针对每个模型的分镜结果进行打分 这体验简直不要太爽 最后的评测结果也跟大家分享一下, 如果优先看综合质量,首选 Claude Sonnet 4.6。 如果优先看稳定批量生产,qwen3.6-plus 当前版本很可用,但建议在提示词里增加动作去重和动作丰富度约束。 如果选择 chatgpt5.5 或 Claude Opus 4.7,建议额外加一句:总时长贴近真实口播预估,每个 duration 不要保守拉长 因为我们目前的场景其实比较聚焦单角色单场景口播类的 所以其实对于分镜画面描述要求没那么高,当前的llm,只要提示词写到位,基本大差不差了 更多的还是在后面的图生视频的能力了 好了,今天就分享这么多,后面会持续分享相关落地干货知识,欢迎交流分享 #产品经理 #大模型 #AI视频 #分镜头脚本 #AI人工智能 #剪辑工具

返回新闻列表