
12月3日,腾讯混元大模子通知负责上线视频生成才调。腾讯方面默示,腾讯开源该视频生成大模子参数目达到130亿,是现时最大的视频开源模子。
“用户只需要输入一段态状,即可生成视频,”腾讯混元关系负责东谈主领略,现在生成视频撑捏中英文双语输入、多种视频尺寸以及多种视频明晰度。现在该模子已上线腾讯元宝APP,用户可在AI利用中的“AI视频”板块苦求试用。企业客户通过腾讯云提供就业接入,现在API同步盛开内测苦求。

通过腾讯元宝APP-AI利用-AI视频即可使用该功能(前期需苦求)
腾讯方面 默示,在与国表里多个顶尖模子的评测对比高慢,混元视频生成模子在文本视频一致性、开通质料和画面质料多个维度后果跨越,在东谈主物、东谈主造场面等场景下发扬尤为出色。
据悉,腾讯混元生成视频大模子不错罢了超写实画质、生成高度适应提醒词的视频画面,画面开通不易变形。比如,在冲浪、舞蹈等大幅度开通画面的生成中,腾讯混元不错生成卓越开通、合理的开通镜头,物体不易出现变形;光影反射基本适应物理司法,在镜面或者照镜子场景中,不错作念到镜面表里看成一致。同期,模子还不错罢了在画面主角保捏不变的情况下自动切换镜头,这是业界大部分模子所不具备的才调。

视频由腾讯混元视频生成,提醒词:超大波澜,冲浪者在浪花上起跳,完成空中转体。影相机从波澜里面穿越而出,捕捉阳光透过海水的一刹。水花在空中变成完满曲线,冲浪板划过水面留住轨迹。临了定格在冲浪者穿越水帘的完满一刹。
视频由腾讯混元视频生成,提醒词:一位中国好意思女衣着汉服,头发摇荡,配景是伦敦,然后镜头切换到特写镜头。
现在,腾讯通知开源该视频生成大模子已在 Hugging Face 平台及 Github 上发布,包含模子权重、推理代码、模子算法等完整模子,可供企业与个东谈主建造者免费使用和建造生态插件。基于腾讯混元的开源模子,建造者及企业无需重新窥探,即可胜利用于推理,并可基于腾讯混元系列打造专属利用及就业,或者省俭大齐东谈主力及算力,加快行业更始挨次。
据南边+记者了解到,此前腾讯混元也曾开源了旗下文生文、文生图和3D生成大模子。至此,腾讯混元系列大模子已罢了全面开源。
南边+记者 叶丹开云(中国)Kaiyun·体育官方网
