繁星资讯社 >> 行业洞察>>

模型用户可灵突破进入代,万0时数已全系全球

模型用户可灵突破进入代,万0时数已全系全球 本章共2字, 更新于: 2025-04-22 11:02:14

4月15日,可灵可灵AI在北京中关村国际创新中心举行“灵感成真”2.0模型发布会,全系全球宣布基座模型再次升级,模型面向全球正式发布可灵2.0视频生成模型及可图2.0图像生成模型。进入

截至目前,时代数已可灵AI全球用户规模突破2200万。用户来自世界各地的突破超1.5万开发者和企业客户,将可灵的可灵API应用于不同的行业场景中。

快手高级副总裁、全系全球社区科学线负责人盖坤表示,模型可灵希望让每个人都能用AI讲出好故事,进入实现更加精准的时代数已复杂创意表达。


 可灵AI全系模型进入2.0时代,用户定义人和AI交互的突破全新方式

4月15日,可灵大模型2.0版本及可图大模型2.0版本正式面向全球发布。可灵据悉,可灵2.0模型在动态质量、语义响应、画面美学等维度,保持全球领先;可图2.0模型在指令遵循、电影质感及艺术风格表现等方面显著提升。

盖坤介绍,两款模型在团队内部的多项胜负率评测中,均稳居业内第一。例如在文生视频领域,可灵2.0对比谷歌Veo2的胜负比为205%,对比Sora的胜负比达367%,在文字相关性、画面质量、动态质量等维度上显著超越对手。

自去年6月发布以来,可灵AI已累计完成超20次迭代。3月27日,全球知名AI基准测试机构Artificial Analysis发布了最新的全球视频生成大模型榜单,快手可灵1.6pro(高品质模式)以1000分的Arena ELO基准测试评分登陆图生视频(Image to Video)赛道榜首。

作为全球首个用户可用的DiT视频生成模型,截至目前,可灵AI全球用户规模已突破2200万,累计生成1.68亿个视频及3.44亿张图片素材。自去年6月上线至今的10个月时间里,可灵AI的月活用户数量增长25倍。

可灵AI全系模型进入2.0时代,全球用户数已突破2200万

快手高级副总裁、社区科学线负责人盖坤(图片来源:快手)

盖坤认为,AI在辅助创意表达上拥有巨大潜力,但当前的行业发展现状还远远无法满足用户需求,在AI生成内容的稳定性、以及用户复杂创意的精确传达上仍有“很多挑战”。也因此,要真正实现“用AI讲好每一个故事”的愿景,必须对基模型能力进行全方位提升,定义人和AI交互的“全新语言”。

一直以来,可灵AI致力于提升模型基础质量和模型效果,并引入更多创新功能,以满足用户的多样化需求。在本次2.0模型的迭代中,可灵AI正式发布AI视频生成的全新交互理念Multi-modal Visual Language(MVL),让用户能够结合图像参考、视频片段等多模态信息,将脑海中包含身份、外观、风格、场景、动作、表情、运镜在内的多维度复杂创意,高效地传达给AI。

“大家应该很自然地会感受到文字在表达影像信息时,是不完备的。我们需要有新的方式,能让人真正精准地表达出心中所想。”盖坤指出,MVL由TXT(Pure Text,语义骨架)和MMW(Multi-modal-document as a Word,多模态描述子)组成,能从视频生成设定的基础方向以及精细控制这两个层面,实现AI创作者们的创意表达。

基于MVL理念,可灵AI正式推出多模态编辑功能。“从今天起,大家可以在可灵AI的平台上体验我们的多模态编辑能力。用户可以非常直接地把自己的想法用图像等方式作为输入,生成符合自己想法的创意视频。”盖坤介绍,MMW(多模态描述子)将不只局限于图片和视频,也可以引入其它模态的信息,例如声音、运动轨迹等,让用户实现更加丰富的表达。

可灵AI全系模型进入2.0时代,全球用户数已突破2200万

“灵感成真”可灵AI2.0发布会现场(图片来源:快手)


 可灵2.0大师版正式发布,全新上线多模态视频编辑功能

基于MVL这一全新交互方式,发布会现场,快手副总裁、可灵AI负责人张迪发布了全新的可灵2.0大师版,在语义响应、动态质量、画面美学等方面显著提升生成效果。

“可灵2.0大师版不仅仅是一次简单的技术升级,更是一次全方位的体验跃升。”张迪介绍,可灵2.0大师版实现了技术、体验、美学的三重突破。

可灵AI全系模型进入2.0时代,全球用户数已突破2200万

快手副总裁、可灵AI负责人张迪(图片来源:快手)

据雷峰网(公众号:雷峰网)了解,可灵2.0大师版升级视频及图像创作可控生成与编辑能力,上线全新的多模态视频编辑功能,能灵活理解用户意图。支持在一段视频的基础之上,通过输入图片或文字,对生成的视频内容实现元素的增加、删减、替换,帮助创作者们实现更加灵活的二次编辑和处理。

 

可灵AI全系模型进入2.0时代,全球用户数已突破2200万

可灵2.0大师版操作界面(图片来源:快手)

张迪披露,当前,图生视频约占到可灵AI视频创作量的85%,图片质量也对视频的生成效果产生重要作用。

在图像生成大模型领域,快手的可图2.0处于行业领先水平,拥有多项核心优势,诸如强大的复杂语义理解能力、电影级的画面质感、多条件的可控风格化生成等。在团队内部的多项胜负率评测中,相较于Midjourney V7、FLUX1.1 [pro]以及Reve等行业领先的图像模型,均保持明显优势。

张迪介绍,可图2.0文生图能力迎来全面升级。包括大幅提升指令遵循能力、显著增强电影美学表现力以及更多元的艺术风格。在风格化响应上,可图2.0可支持60多种风格化的效果转绘,模型出图创意和想象力实现提升。

同时,可图2.0也上线了实用的图像可控编辑功能——局部重绘和扩图,支持图片的增加、修改和修复。在图像的多模态可控生成中,可图2.0还上线了全新的风格转绘功能,只需要上传一张图片加上风格描述,就能一键切换图片的艺术风格,同时保留原图的语义内容。


AIGC技术迅猛发展,为全行业发展注入全新活力

除了C端订阅用户,可灵AI也面向B端商家提供API接入等服务。目前,可灵AI已与包括小米、亚马逊云科技、阿里云、Freepik、蓝色光标等在内的数千家国内外企业客户建立了合作关系。

盖坤披露,来自世界各地的超1.5万开发者,已将可灵的API应用于不同的行业场景中,累计生成的图像数量约1200万个,生成的视频素材超过4000万个。

如今,可灵正在成为AI时代视频创作的新基础设施。AIGC技术的迅猛发展,也正在重构包括广告营销、专业创作、影视、娱乐创意等在内的多个行业。

以二次元AI创作社区产品狸谱为例,其产品负责人一休介绍,可灵AI为狸谱带来了创新突破。其1.6版本在人物运动流畅度、镜头移动等方面展现出卓越性能,助力狸谱成功接入“动态LIVE”和“新春萌偶摇”两大功能。前者实现“图 - 影 - 音”快速创作,后者在春节期间引发60万用户转播。

未来,双方将基于狸谱的优质内容数据与可灵的算法能力,打造动画模型,推动AI成为内容引擎,并共同孵化优质创作者,构建更活跃的创作生态。

“可灵AI可全面融入剧集级创作流程”。可灵AI超级创作者、《新世界加载中》总导演、异类Outliers创始人陈翔宇在分享中介绍,AIGC相较于实拍和动画,不仅是效率的提升,更是试错空间的革命性释放。

从剧本创作到内容发行,异类Outliers团队完成了一次完整的影像工业化创作流程,覆盖从美学表达到镜头结构,再到复杂动作场景与细节的全面呈现。

“我们实践之后发现,可灵AI是一个能够稳定、大规模嵌入剧集创作流程的生成式协作大模型。”陈翔宇认为,在AI的辅助下,导演及编剧团队的大量内容创意也实现了更富有想象力的表达,“AIGC也许是下一代内容结构的雏形”。

可灵AI全系模型进入2.0时代,全球用户数已突破2200万

可灵AI超级创作者、《新世界加载中》总导演、异类Outliers创始人陈翔宇(图片来源:快手)

快手副总裁、可灵AI负责人张迪还在发布会现场正式发起“可灵AI NextGen 新影像创投计划”。

该计划将加大对于AIGC创作者的扶持力度,通过千万资金投入、全球宣发、IP打造和保障,以全资出品、联合出品和技术支持等灵活多样的合作方式,让AI好故事走向世界。同时,可灵AI面向全球创作者发出征集邀约,邀请用户共同打造全球首支用户共创AI创意短片,让创作者的灵感和创意登陆上海、香港、东京、巴黎、多伦多等世界多地广告大屏。

面向未来,盖坤表示,可灵AI将持续大力推动技术创新,用人与AI交互的全新语言,帮助用户实现复杂创意的精确表达,“我们的初心,是让每个人都能用AI讲出好的故事,我们也真切地希望这一天更快到来”。


本书首发来自繁星资讯社,第一时间看正版内容!

更多

编辑推荐榜

110岁男孩拿父亲丧葬费打赏主播 平台:正办理退款
2《熹妃Q传》新白将启仄公主富丽上线 唯好CG尾暴光
3截止2018年12月,小爱音箱唤醒次数累计超50亿
4化身半叶枯叶的“伪装者”枯叶尖鼻蛛
5一只榴莲顶三只鸡?榴莲虽对身体有5大益处,但提醒这些人要少吃
6乌bai ?无常减盟《妖灵契》 水陪共建国风妖鬼传奇
7《龙珠Z:卡卡罗特》最新演示 贝凶塔大年夜战魔人布欧
8米家推出洗烘一体机,低价策略能否成功打入市场?
9维生素种类多,体内缺少时身体往往会有这些表现,需及时补充!
10真同屏战役 37《烈焰讯断》深度复本传奇细华
资讯快递
人气热销 言情热销

GamirrorGames将发行清版过关动作游戏《漫威宇宙入侵》 独立游戏发行商Gamirror Games(原Gamera Games)今日正式宣布,将与Dotemu、Marvel Games合作,携手联合发行像素风清版过关联机动作游戏《漫威宇宙入侵》。Steam

布叮萌动反击《我一面皆没有成心》本日尾收 由新动文明独代、Blingame工做室研收的国产下分独游《我一面皆没有成心》本日正式登岸安卓仄台,游戏散摹拟运营、闭卡应战、汇散、挨扮于一身,弄法歉富、建制细好,拆配Q萌敬爱的游戏绘风,给您带去沉松畅

《塞伯利亚之谜:之前的天下》公布新预报 游戏3月18日出售 法国游戏收止商Microids本日公布了旗下新做《塞伯利亚之谜:之前的天下》的出售预报片,该游戏为冒险游戏《塞伯利亚》系列的最新做,将于3月18日收止。出售预报游戏背景沃恩,1937年:达娜·罗兹Da

《任务吸唤:当代战役》配音演员表 钱队新配音帅气、抵挡军批示苦好 中媒Twinfinite浑算了《任务吸唤:当代战役》的配音演员表,此中有人初次为电子游戏献声,没有过您们能够会正在影视剧或一些电视节目中曾碰到过,也有些正在电子游戏财产配音过多次的人。起尾是Price

安徽芜湖:朵朵荷花映红致富路 新华网合肥6月20日电李东标)仲夏时节,安徽省芜湖市湾沚区陶辛镇2万余亩荷塘里,朵朵荷花次第绽放。碧绿的荷叶、娇艳的荷花,在蓝天白云的映衬下,呈现出“接天莲叶无穷碧,映日荷花别样红”的诗画意境。陶辛镇

华纳民宣两部DC新剧:绿灯侠终究回回荧幕! CW 台的 DC 漫改剧散卖力人 Greg Berlanti 颁布收表将为 HBO Max 建制两部剧散,此中一部为绿灯侠剧散。另中一部是同改编自DC漫绘的《独特冒险》:一部由多个独立故事构成的选散剧

加载更多

潜力大作 女生必读

1 今日股市开盘行情沪指涨0.07%,报3568.58点 作者:
7592字
今日上证指数行情:今日A股三大股指集体高开,沪指涨0.07%,报3568.58点,深成指涨0.22%,报14876.73点,创业板指涨0.22%,报3326.33点;盘面上,新能源概念涨幅居前,光伏板

1 MMO《玄色戈壁》“永冬之山”拓展4月6日正式上线 作者:
69881字
MMO游戏《玄色戈壁》颁布收表“永冬之山”拓展将于4月6日正式上线,新拓展将会增减多个新天区战新设备。“经由过程六位魔女的试炼并单独站上冰峰的懦妇啊。去永冬之山,泰初苦睡的天圆吧……”永冬之山位正在德

1 MMO《玄色戈壁》“永冬之山”拓展4月6日正式上线 作者:
7字
MMO游戏《玄色戈壁》颁布收表“永冬之山”拓展将于4月6日正式上线,新拓展将会增减多个新天区战新设备。“经由过程六位魔女的试炼并单独站上冰峰的懦妇啊。去永冬之山,泰初苦睡的天圆吧……”永冬之山位正在德

1 《闭幕者6》终究预报 施瓦辛格残暴新闭幕者 作者:
2字
本日,电影《闭幕者:暗中运气》民专公布影片终究预报,施瓦辛格重披战甲老当益壮,足慎重兵器残暴闭幕者,一起去看看。《闭幕者:暗中运气》终究预报:gsVideo("劣酷", "https://v.youk

1 汉阴新闻20250416 作者:
3492字

1 搜狗与新华社联合发布全球首个站立式AI合成主播 作者:
514字
2月19日,在新华社新媒体中心与搜狗公司战略合作签约仪式上,搜狗公司与新华社新媒体中心联合发布了全球首个站立式AI合成主播,新的AI合成主播将从过去的“坐着播新闻”升级成结合肢体动作的“站立式播报”,

1 拥有绝佳导航与运动能力的科莫多龙为何没有到处分布 作者:
11字
一头公科莫多龙在海滩上休息后进入水里。科莫多龙有时的确会享受海水浴,但新研究显示,它们只有在特别罕见的状况下才会勇敢面对开放海域,这种习性限制了跳岛迁徙。 PHOTOGRAPH BY STEPHEN

1 马丁斯科塞斯再讲漫威电影:主题公园是一种齐新艺术情势 作者:
59596字
月初,马丁斯科塞斯批评漫威影片没有克没有及算“电影”而是“主题公园”,正在引收了大年夜量会商微风波以后,正在远期他对那一批评做了弥补:“主题公园”一种“完整分歧的电影情势,或是一种新的艺术情势”。正在

1 广东印发现代农业产业集群培育行动方案 作者:
37749字
南方日报讯记者/黄进彭琳通讯员/粤农轩)近日,广东省委农办、省农业农村厅印发《关于现代农业产业集群培育行动方案2025年—2027年)》以下简称《行动方案》),在全省重点培育一批千亿、百亿、十亿元级现

1 俄罗斯放归野外的阿穆尔虎“赛汗”越境中国并吃了一只羊 作者:
1963字
俄罗斯放归野外的阿穆尔虎“赛汗”越境中国并吃了一只羊神秘的地球uux.cn报道)俄罗斯“阿穆尔虎种群研究与保护中心”发布消息称,在滨海边疆区获救、后在犹太自治州被放归野外的阿穆尔虎“赛汗”Saikha

系统发生错误

系统发生错误

您可以选择 [ 重试 ] [ 返回 ] 或者 [ 回到首页 ]

[ 错误信息 ]

页面发生异常错误,系统设置开启调试模式后,刷新本页查看具体错误!