就在刚刚!智谱「新清影」上线,开源+4K60帧,正式开启有声视频生成新时代!
智谱「新清影」正式上线,以开源、4K60帧及音效功能开启AI生成视频有声新时代。其核心升级包括画质、时长、音效开源模型支持等,具体亮点如下:
一、核心升级:从“无声”到“有声”的跨越- 音效功能上线:新清影即将在本月公测生成与画面匹配的音效功能,使AI视频从“默片”升级为“有声视频”。这一技术突破填补了市场空白,显著提升视频的生动性与沉浸感。
应用场景:
影视制作:大规模战斗、灾难场景的音效可由AI生成,缩短制作周期并降低成本,推动行业从流水线向智能化转型。
游戏与广告:降低音效创作门槛,无需专业团队即可完成高质量音效制作,催化行业繁荣。
- 开源模型发布:智谱开源了CogVideoX v1.5-5B及CogVideoX v1.5-5B-I2V模型,支持消费级显卡流畅运行,性能领先。此前开源的CogVideoX-5B已衍生出大量二次开发项目(如CogVideoX-factory),形成活跃的开发者生态。
新清影在以下方面实现突破:
画质与逻辑性:
图生视频的质量、美学表现、运动合理性及复杂语义理解能力显著增强。
人物面部细节、动作连贯性及物理特性模拟更逼真,提升视频自然度。
超高清与灵活性:
支持生成10秒、4K分辨率、60帧超高清视频,且支持任意比例图像生成视频,满足多样化需求。
多通道生成能力:
同一指令或图片可一次性生成4个视频,提升创作效率。
音效集成:
音效功能上线后,视频将具备画面与声音的同步生成能力,进一步拓展应用场景。
技术迭代趋势:从Sora、快手可灵到Dream Machine,行业竞争焦点从生成时长、画面质量逐步转向AI特效与音效集成。新清影的发布标志着AI视频进入“有声时代”,降低艺术创作门槛。
用户价值:
专业领域:影视、游戏、广告等行业可通过AI高效完成基础制作,聚焦创意优化。
个人用户:无需专业设备或技能,即可生成高质量有声视频,推动内容创作民主化。
结语:新清影的发布不仅代表了技术层面的突破,更通过开源生态与音效功能重新定义了AI视频生成的标准。随着有声视频时代的到来,内容创作将迎来更广阔的想象空间。
湖北微观视界文化传媒有限公司