2月18日,昆仑万维(300418)开源首个面向AI短剧创作的视频生成模型SkyReels-V1,及基于视频基座模型的表情动作可控算法SkyReels-A1。
针对当前全球AI视频生成模型和产品不开源、用不到、费用高、不好用等痛点,昆仑万维此次开源的两款模型和算法,可帮助解决传统短剧制作面临的挑战,如线下拍剧涵盖剧本创作、选演员、场景布景、分镜创作、拍摄、后期处理等复杂流程,大模型有助于缩减成本。

SkyReels-V1针对表演细节打标,利用好莱坞级别数据训练微调。
据介绍,为提升表情生成、肢体生成的可控表演效果,SkyReels-V1针对表演细节打标,利用好莱坞级别数据训练微调。针对人物微表情、人物表演细节、场景描述、光影、画面构图等进行更精细的技术升级。为了实现更加精准可控的人物视频生成,昆仑万维开源了基于视频基座模型的表情动作可控算法SkyReels-A1,支持视频驱动的电影级表情捕捉,能够基于任意人体比例生成高度逼真的人物动态视频,以及皮肤肌理、身体动作跟随等多维度细节的深度还原。
同日,大模型企业阶跃星辰与吉利汽车集团联合开源两款多模态大模型,包括开源视频生成模型阶跃Step-Video-T2V、开源语音交互大模型阶跃Step-Audio。阶跃星辰表示,此次联合开源旨在促进大模型技术的共享与创新,推动人工智能普惠发展。
据阶跃星辰介绍,阶跃Step-Video-T2V模型参数量达300亿,可直接生成204帧、540P分辨率的视频。阶跃Step-Video-T2V在复杂运动、美感人物、视觉想象力、基础文字生成、原生中英双语输入和镜头语言等方面能力突出。
上海对外经贸大学人工智能与变革管理研究院副院长、上海开源信息技术协会秘书长张国锋此前对澎湃科技表示,开源是数字经济公共基础设施,开源在物理世界萌芽发展、逐步壮大,成为数字经济创新创业主导模式,这是历史趋势。作为社会创新方法论的开源降低了创新创业门槛,激发了创业热情,将改变软件的产业链和供应链,改变游戏规则。DeepSeek让人们看到了开源的重要性,开源项目将雨后春笋般涌现,2025年是开源大发展之年,一场波澜壮阔的开源社会运动正在开展。
还没有评论,来说两句吧...