图像/视频模型迭代和产品化的演变之路 2022-2025

终于写完Gap期间的最后一篇。做多模态应用产品,平时会关注跟工作相关的模型更新、竞品动态和内容玩法。基于日常记录,本文系统梳理了图像/视频模型是如何一步步进化的?每一次迭代,解锁了哪些新的能力?这些新能力又带来了哪些产品机会?对行业产生了什么影响?

1. 模型迭代:开源闭源并进,最开始纯基模的粗糙直出->基模叠加lora/controlnet/ip保持等插件提高一致性和可控性->最终又内化到更强大的基模

2. 产品发展:从依赖工程打补丁的单点能力->服务特定垂类的工作流,效率高但限制固化->自主规划的Agent来服务更开放的创意场景

3. 内容行业:从生成单镜头素材->创作更丰富的多镜头叙事->打造更立体有情绪的IP形象
 
 
Back to Top