智象未来团队研发成果获ICML 2025收录!图像生成更有“全局视野”

智象未来团队提出全新层级自回归生成范式 Hierarchical Masked Autoregressive models (Hi-MAR),有效解决自回归图像生成中结构失真问题。该研究已被 ICML 2025 收录,并在多个图像生成任务中取得领先性能。

现有自回归图像生成模型存在缺乏全局结构建模能力、训练-推理分布不一致、尺度引导缺失等问题。Hi – MAR 借鉴人类绘画过程,采用自顶向下层次化生成范式,还引入多尺度联合训练策略等。实验显示,其在图像质量和语义一致性上优于主流方法,可以显著提升模型的全局感知能力与生成质量。

本次发表的论文《Hierarchical Masked Autoregressive Models with Low-Resolution Token Pivots》,展示了团队在多模态生成式基础架构设计领域的前沿探索。这一全新的层级自回归生成架构 Hi-MAR,为构建具备“全局感知+局部细化”能力的生成基础架构提供了新的范式,同时它也是HiDream系列开源模型家族重要的一员,为下一代多模态生成式基础架构的技术演进带来更多的可能性!

主题测试文章,只做测试使用。发布者:人脑网,转转请注明出处:https://www.rennao.com.cn/15856.html

(0)
人脑网的头像人脑网
上一篇 2025年5月23日 下午4:30
下一篇 2025年5月23日 下午4:30

相关推荐

  • 决赛圈:Find X8 Ultra vs X200 Ultra

    估计不少朋友跟我一样,在OPPO Find X8 Ultra和vivo X200 Ultra之间纠结得头皮发麻。 由于我的新机发货时间又双叒延迟了, 索性借着博主@斗室听澜的全自费购机体验短评(跟我短暂上手后的感觉基本一致),来掰扯掰扯这两台旗舰的优缺点,帮你看看哪个更适合你! – 外观篇 – Find X8 Ultra:相机模组面积…

    2025年5月2日
    1000
  • 魅族Flyme预热!应用多开0卡顿

    5月4日,魅族官方终终终于开启了全新 Flyme AIOS 2系统的预热。 从官方介绍来看,新系统的四大引擎将是Flyme AIOS 2的核心亮点之一。 Flyme AIOS 2在瞬息流畅引擎加持下,能够扛得住20个应用连续启动都不卡顿,得益于内存使用效率提升了近20%,应用启动速度也快了不少;因为有流光视效引擎支撑,系统动画效果也将更加丝滑。 晶核能效引擎…

    2025年5月4日
    900
  • 深圳市长覃伟中:加快培育壮大人工智能、机器人等战略性新兴产业集群

    财联社4月11日电,以“具身智能 生态赋能一共塑未来产业新图景”为主题的具身智能产业化发展座谈会4月10日在深圳证券交易所举行。深圳市市长覃伟中在座谈会上指出,具身智能作为人工智能与机器人交叉融合的前沿领域,是拥有巨大发展潜力和空间的产业新赛道。深圳将深入开展“人工智能+”行动,全力全速建设全球人工智能先锋城市,加快培育壮大人工智能、机器人等战略性新兴产业集…

    2025年4月11日
    2500
  • 卧槽!红米K80至尊版含金量+N

    你猜怎么着?红米K80至尊版的硬件配置又双叒加码了! 4月14日,知名博主数码闲聊站发帖爆料称:“ 天玑9400+新机和小平板可能会小提前,听说现在在争取6月底。然后这两个新品马达我都很喜欢,工程机振感反馈都不错,一个0916,一个双0815 ” 。 好家伙,这配置一曝光,我直接两眼放光——红米这回是憋了大招啊! 来,咱们把K80至尊版的亮点掰开揉碎聊聊,看…

    2025年4月14日
    3500
  • 美国撤销拜登时期AI芯片出口限制 新规明确针对华为

    人脑网讯 5月14日消息(颜翊)当地时间5月13日,美国商务部工业与安全局(BIS)发布公告称,美国启动撤销拜登政府颁布的《人工智能扩散规则》(AI Diffusion Rule),同时宣布将采取进一步措施加强全球范围内对半导体的出口管制。 《人工智能扩散规则》于2025年1月15日发布,原定于2025年5月15日生效。公告称,这些新规定原本会严重阻碍美国的…

    2025年5月14日
    500

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信