九游体育娱乐网用户也不错输入笔墨或音频-欢迎访问九游体育(JIUYOU) 中国大陆大陆官网

发布日期:2025-08-13 10:26    点击次数:146

大模子开源潮从文本模子膨大到了视频生成限度。2月25日,阿里巴巴开源了万相2.1视频生成模子,3月6日,腾讯开源图生视频模子,阶跃星辰也贪图在本月开源图生视频模子。

据腾讯先容,新开源的图生视频模子总参数目130亿,适用于写实视频制作、动漫扮装制作生成等,开源践诺包含权重、推理代码和LoRA考验代码。用户上传一张图片,并节略描摹但愿画面奈何畅通、镜头奈何逶迤,就能生成5秒短视频。用户也不错输入笔墨或音频,让图片中的东说念主物对口型话语或唱歌。

腾讯展示的视频生成案例包括爱因斯坦吃苹果、梵高喝红酒、机械马来往、臆造东说念主物念急口令等。从演示视频看,视频中的主体畅通较为洞开,对口型也比较信得过。

2月,阿里开源的万相2.1视频生成模子则有14B(B为10亿)和1.3B两个参数规格,万相2.1的特色包括赞助无穷长1080P视频的高效编解码,以及初度完了中语笔墨视频生收遵循。

就视频生成的熟识度和开源的作用,腾讯混元多模态生成技巧老成东说念主凯撒客岁12月经受第一财经等媒体采访时示意,视频生成开源生态不是很成征象,最大的问题是开源的视频生成底模(基座模子)与闭源差距太大。视频生成所需算力、数据豪侈量和图像生成比较是数目级的差距,业内不念念把我方花大资本作念出来的模子开源出来。而在这种闭门觅句的情况下,许多东说念主莫得效到最佳的模子,混元于是在客岁12月开源了文生视频模子。

此外,也有业内东说念主士告诉记者,视频生成模子的技巧旅途未透澈明晰,行业还在摸索。在技巧打磨阶段,开源也能激动行业跳动。

记者钟情到,跟着近期多家大模子厂商激动开源,在才气较凸起的视频生成大模子中,开源模子已占有置锥之地。记者在视频生成模子评测体系VBench榜单看到,万相2.1模子现在列该榜单第一,总分86.22%,卓著闭源的Sora。除此以外,名次前20的模子中还有另外6款模子标注为开源模子。腾讯客岁12月推出的HunyuanVideo位列第12位,智谱旗下的CogVideoX1.5-5B位列第15位,这两款均是开源模子。而在该榜单第20名至第50名中,开源模子的数目则远超闭源模子。

图像生成模子手脚图生视频模子的基础,记者还从香港大学不断学院获悉,该学院当天发布了《东说念主工智能模子图像生成才气详细评测陈说》。在新图像生成践诺质地(包括图文一致性、好意思感等维度)方面,字节即梦AI位列第一,在该榜单前20名内,包括DALL-E3、Hunyuan-DiT在内的多个模子是开源模子。

举报 第一财经告白合营,请点击这里此践诺为第一财经原创,文章权归第一财经扫数。未经第一财经籍面授权,不得以任何神志加以使用,包括转载、摘编、复制或设立镜像。第一财经保留根究侵权者法律包袱的职权。 如需得到授权请干系第一财经版权部:021-22002972或021-22002335;banquan@yicai.com。 文章作家

郑栩彤

干系阅读 AI周报 | OpenAI发布GPT-4.5;DeepSeek最高日赚346万元

英伟达2025财年营收同比增长114%;阿里巴巴开源万相2.1视频生成模子。

164 03-02 09:58 玄铁首款就业器级CPU杀入战局,RISC-V能否叫板X86、ARM?

AI会不会叩响管理器架构翻新的闸门?

217 03-01 18:04 一个向左一个向右, OpenAI与DeepSeek 谁能主导AI竞争模式?

OpenAI 发布了崇高的GPT-4.5,而DeepSeek进行着临了一天的代码开源共享。

464 02-28 13:20 DeepSeek吃光了云霄的闲置算力 | 海斌访谈

DeepSeek给云贪图厂商带来立竿见影的答复。

317 02-27 21:00 DeepSeek开源第三日,行业影响几何?

这些“脚手架”的开源故意于之后的生态搭建九游体育娱乐网。

230 02-26 12:14 一财最热 点击关闭



Powered by 欢迎访问九游体育(JIUYOU) 中国大陆大陆官网 @2013-2022 RSS地图 HTML地图

Copyright Powered by站群系统 © 2013-2024