世界杯预选赛下单 智象明天超两千亿参数图像大模子HiDream-O1-Image-Pro发布, 融资执续提速

发布日期:2026-05-21 00:19    点击次数:95

世界杯预选赛下单 智象明天超两千亿参数图像大模子HiDream-O1-Image-Pro发布, 融资执续提速

5月19日,北京。智象明天举办首届绽开日,主题为“ImagingtheWorld”。在绽开日上,智象明天细密发布基于新一代原生全模态模子架构UnifiedTransformer(UiT)打造的图像大模子HiDream-O1-Image-Pro。这一超2千亿参数的原生全模态图像大模子,不仅在多个基准测试中刷新SOTA记录,也标记着智象明天正向图像、视频、文本、音频等多模态联合建模的“原生全模态”阶段迈进。

同期,智象明天通知完成新一轮亿级融资,深创投、金浦投资、财鑫老本、复聚老本等多家机构参与。这是智象明天半个月内再次完成融资,体现出老本商场对原生全模态大模子标的的执续看好。跟着视觉生成、具身智能等前沿本领加速和会,天下模子成为AI演进的蹙迫标的,智象明天在底层模子架构、家具化能力与产业生态布局上的执续禁绝,也取得了商场进一步招供。

200B+参数图像大模子HiDream-O1-Image-Pro发布,原生全模态架构全面升级

现时,图像生成模子正从传统U-Net架构迈向扩散Transformer(DiT)时间。以潜在扩散模子(LDM)为代表的主流路线,通过VAE压缩图像、沉着话语模子编码文本,在效果和生成能力上取得显贵进展,但图像与文天职离编码的风光,也使模子在复杂语义络续、高保真细节复原、精确笔墨渲染、多任务泛化等方面面对自然瓶颈。

米兰milan(中国)体育官方网站

面向这一挑战,智象明天细密发布基于原生全模态架构的200B+参数闭源图像大模子HiDream-O1-Image-Pro。不同于传统碎屑化、多模块拼接的编码范式,HiDream-O1-Image-Pro将原始图像像素、禁绝文本象征和任务条目联合纳入连气儿分享象征空间,完了图像、文本与多任务条目在底层表征上的深度和会。这一架构禁绝进一步开释了模子的生成能力与泛化能力,使其在通用文生图、高保真笔墨渲染、万般化场景生成、图像剪辑等任务中达到新的SOTA水平,展现出智象明天在原生全模态大模子架构上的当先探索。

智象明天独创东谈主兼CEO梅涛暗示,智象明天选择原生全模态旅途,源于团队在视觉生成与物理天下联接过程中的始终判断:“现时好多‘多模态大模子’,骨子上照旧‘单模态拼接’。而原生多模态,是从一入手就把‘天下的轨则’刻进模子里——它知谈物理定律、空间相关、因果逻辑,是以它能确凿络续天下、推理天下,重构天下,而不仅仅‘生成内容’。是以,咱们判断,原生全模态是完了AGI的必经之路。”

智象明天蚁合独创东谈主兼CTO姚霆先容,不久前,接纳原生全模态架构的HiDream-O1-Image以8B参数开源版块在寰球闻明沉着评测平台ArtificialAnalysis文生图榜单上登顶开源模子寰球第一,发达跨越Z-ImageTurbo、Qwen-Image、FLUX.2[dev]等主流开源模子,并成为该榜单排行前20中公开参数目最小的模子版块。这次发布的HiDream-O1-Image-Pro为闭源版块,PG电子(PocketGames)游戏官网超两千亿参数,在复短文本渲染、提醒剪辑、多主体个性化等任务上全面缔造新SOTA,充分考证了原生全模态架构范式的普遍可彭胀性。

姚霆暗示:“原生全模态(UiT)架构下,整个模态从启动阶段等于清莹竹马长起来的。这么的克己是,整个的模态王人买通明,大致确凿的作念到‘AnytoAny’,恣意的输入救助恣意的输出,这亦然天下模子所需要的能力——在联合架构中络续、生成并瞻望实际天下的不同状况。”

从视觉生成走向天下模子:行业共议AGI要道旅途

现时,大模子竞争焦点正从话语络续与内容生成,转向对简直物理天下的络续、生成和瞻望。围绕天下模子,行业内已出现多种本领略线,但共同想法是一致的:让AI不单生成内容,而是成就对天下状况偏激变化法例的里面表征能力。

在绽开日圆桌论坛方法,东方富海合资东谈主王兵、微软亚洲征询院首席征询员傅建龙、阿里云资深治理有诡计总监宁江彬、智象明天本领合资东谈主潘滢炜与AI闹发起东谈主洪鹄,围绕“从多模态到全模态,构建天下模子,走向AGI”伸开对话。嘉宾们永别从AI投资、具身智能、AI基础设施和原生全模态本领执行等角度,分享了对天下模子发展旅途的判断。

与会嘉宾觉得,2026世界杯预选赛下单中国体彩官网AI正在从“生成内容”走向“络续天下”。视觉生成、Agent、具身智能和多模态模子的汇合,背后指向祛除个要道能力:模子能否络续不同模态下的环境状况、瞻望状况变化,并酿成联合的跨模态表征。

因此,视觉生成并不仅仅内容坐褥器用。它自然需要学习空间结构、物体相关、畅通轨迹和状况变化,也具备向天下模子延展的基础。原生全模态架构的价值,恰是在于为图像、视频、文本、音频乃至行为和具身数据提供联合建模框架,让模子从单点模态能力走向更完竣的天下建模能力。

半月内完成多轮融资,三大Agent家具执续彭胀营业生态

不久前,智象明天通知完成超5亿元融资,激动威望涵盖安徽省产投、合肥产投、东方富海等顶级投资机构。绽开日上,智象明天理解公司融资执续提速,半月内再度完成由深创投、金浦投资、财鑫老本、复聚老本等参与的新一轮融资。

公开贵府高傲,金浦投资是上海金融发展投资基金的照顾东谈主,首期基金投资表情已有13家通过IPO或并购完了上市,在算力基础设施、大模子和智能体讹诈等多个AI前沿范围深度布局;财鑫老本是常德市属国企财鑫集团旗下的中枢产业投资平台,奋发于于以老本力量服求实体经济、推动科技翻新,聚焦于东谈主工智能、具身智能等具有明确产业落地出路的硬科技范围投资;复聚投资专注于前沿细分范围领航企业的价值发现,在智能制造、新动力、新材料、生物医药范围、东谈主工智能等战术新兴产业布局平日。跟着深创投、金浦投资、财鑫老本、复聚老本等新投资方的参加,智象明天已酿成了由安徽、上海、湖南、杭州等多方产业基金执续跟进,深创投、东方富海、峰华老本、敦鸿老本等头部商场化VC参与的多元化老本威望。

融资节律加速的同期,智象明天打造了以模子为根基,以智能体讹诈作念轮子,驱动本领落地变现的‘模子+智能体’双轮驱动战术,并酿成了一套明晰的“1+1+3”业务架构:底层是1个HiDream系列大模子,中间是1个能力中台(HiHarness企业作事平台),表层智能体讹诈则遮蔽营业营销、影视创作和社媒创作3大中枢场景。

绽开日现场,智象明天三位家具负责东谈主永别先容了智能体讹诈家具进展,全所在展示了公司在营业化落地上的“即战力”。营业营销智能体HiBurst,已遮蔽跨境电商内容营销、媒体运营和讹诈出海等场景,救助TikTok、Meta、抖音、小红书等主流平台,并成为TikTok官方top5作事商,年坐褥电商营销视频跨越百万条,遮蔽GMV已超亿元;寰球首个专科级AI影视创作与配合智能体——“帧赞”,以电影级画质生成和“创意-分镜-成片”全经过买通的中枢能力,为专科影视创作团队提供了兼顾高品性和高效果的配合创作器用。该平台当今已累计制作短漫剧跨越5000分钟,平台入驻专科团队与生态合作伙伴超千家;社媒创作智能体vivago近日完成家具升级,凭借端到端的长想考能力领略输出分钟级故事视频能力,火速登上ProductHunt日榜第一,当今,vivago已遮蔽100多个国度及地区的超4000万专科及个东谈主用户。

行动现场,智象明天通知与影视行业领军企业上海电影集团上影新视线基金、国内最大的营销传播集团蓝色光标、AI影视头部企业北京捷成世纪、跨境医疗作事范围当先企业倍尔健康达成战术合作。各方将围绕大模子能力调用、智能体讹诈开采、行业场景共建等标的开展深度合作,共同推动原生全模态大模子在影视创作、营业营销、跨境电商、IP运营、医疗健康等多个赛谈的产业化落地。

从视觉生成,到构建天下

从HiDream-O1-Image-Pro的发布,到三大智能体家具的落地,再到与产业伙伴的生态合作,智象明天正在酿成一条明晰旅途:以原生全模态架构为基础,执续晋升视觉生成能力,并进一步向天下模子所需要的联合络续、生成和瞻望能力演进。

这亦然智象明天所强调的“ImagingtheWorld”:不单停留在“生成视觉内容”,而是通过原生全模态建模世界杯预选赛下单,让AI厚重具备络续天下、生成天下、构建天下的能力。明天,智象明天将链接围绕UiT原生全模态架构,推动模子、智能体和产业场景协同演进,向更完竣的天下模子迈进。