微软MAI-Image-2模型跻身前三 正面挑战Google与OpenAI
微软近日正式发布第二代自研图像生成模型 MAI-Image-2,在第三方评测平台 Arena 的图像生成模型排行榜中已升至第 3 名,仅落后于Google gemini-3.1-flash-image-preview 和 OpenAI 的 gpt-image-1.5-high-fidelity,这也标志着微软在生成式 AI 领域从“追赶者”转型为一线强者。
目前,MAI-Image-2 已面向 Copilot 和必应图像创作者用户逐步开放,用户也可通过 MAI Playground 率先体验,开发者则可以借助 Microsoft Foundry 提供的 API,将该模型集成到自有应用与服务中。

回顾 2025 年 10 月,微软首次公布其自研图像生成模型 MAI-Image-1,希望在该领域与 OpenAI 的 gpt-image-1 以及Google的 Gemini/Imagen 等产品展开竞争。 随后,微软将 MAI-Image-1 扩展至 Bing.com/create 以及必应移动应用,让更多终端用户能够通过图像生成工具进行创作。 不过,在第三方平台 Arena 的 Image Arena 排行中,MAI-Image-1 初登场仅位列第 9,与其他领先实验室的模型相比差距明显。 当时微软强调,其训练策略着重减少重复和过度风格化输出,并突出生成速度优势,声称在同类大规模图像生成模型中拥有更快的响应表现。
此次发布的 MAI-Image-2 则是微软 AI 团队在上述基础上的一次大幅升级。 官方介绍称,新一代模型在自然光效果、肤色还原以及环境细节方面均有显著提升,有助于创意工作者减少后期修图时间,更高效地完成商业与创意项目。 同时,MAI-Image-2 针对文本渲染能力进行了重点优化,使其在制作信息图表、演示文稿、流程图和技术示意图等场景中更加适用,提升了图文一体内容创作的可用性。 微软还表示,该模型在生成电影感、超细节风格图像方面有明显进步,尤其擅长处理超现实概念、复杂华丽构图以及宏大场景等高难度创意需求。
微软管理层也在社交媒体上为 MAI-Image-2 造势。 微软消费者 AI 业务负责人 Mustafa Suleyman 在平台上表示,新图像生成器 MAI-Image-2 已经上线 MAI Playground,可用于从逼真写实到复杂信息图等多种用途,并强调微软团队为这一版本付出了巨大努力,如今该模型家族已跻身 Arena 排行的前三。 他鼓励用户前往体验,并展示了由该模型生成的图像示例。
就整体战略而言,MAI-Image-2 的推出与微软近年来在 AI 领域“自给自足”的方向相呼应。 在继续深度合作 OpenAI 的同时,微软正加速打造自有模型矩阵,从图像生成到语音转写等多个细分方向发力,以减少对单一外部合作伙伴的依赖。 伴随 MAI-Image-2 在排行榜上的快速攀升,微软在高端图像生成赛道上对Google与 OpenAI 的直接竞争态势已愈发明显。
踩一下[0]

站长云网
顶一下[0]