微软MAI-Image-2模型跻身前三正面挑战Google与OpenAI

微软近日正式发布第二代自研图像生成模型 MAI-Image-2，在第三方评测平台 Arena 的图像生成模型排行榜中已升至第 3 名，仅落后于Google gemini-3.1-flash-image-preview 和 OpenAI 的 gpt-image-1.5-high-fidelity，这也标志着微软在生成式 AI 领域从“追赶者”转型为一线强者。

目前，MAI-Image-2 已面向 Copilot 和必应图像创作者用户逐步开放，用户也可通过 MAI Playground 率先体验，开发者则可以借助 Microsoft Foundry 提供的 API，将该模型集成到自有应用与服务中。

回顾 2025 年 10 月，微软首次公布其自研图像生成模型 MAI-Image-1，希望在该领域与 OpenAI 的 gpt-image-1 以及Google的 Gemini/Imagen 等产品展开竞争。随后，微软将 MAI-Image-1 扩展至 Bing.com/create 以及必应移动应用，让更多终端用户能够通过图像生成工具进行创作。不过，在第三方平台 Arena 的 Image Arena 排行中，MAI-Image-1 初登场仅位列第 9，与其他领先实验室的模型相比差距明显。当时微软强调，其训练策略着重减少重复和过度风格化输出，并突出生成速度优势，声称在同类大规模图像生成模型中拥有更快的响应表现。

此次发布的 MAI-Image-2 则是微软 AI 团队在上述基础上的一次大幅升级。官方介绍称，新一代模型在自然光效果、肤色还原以及环境细节方面均有显著提升，有助于创意工作者减少后期修图时间，更高效地完成商业与创意项目。同时，MAI-Image-2 针对文本渲染能力进行了重点优化，使其在制作信息图表、演示文稿、流程图和技术示意图等场景中更加适用，提升了图文一体内容创作的可用性。微软还表示，该模型在生成电影感、超细节风格图像方面有明显进步，尤其擅长处理超现实概念、复杂华丽构图以及宏大场景等高难度创意需求。

微软管理层也在社交媒体上为 MAI-Image-2 造势。微软消费者 AI 业务负责人 Mustafa Suleyman 在平台上表示，新图像生成器 MAI-Image-2 已经上线 MAI Playground，可用于从逼真写实到复杂信息图等多种用途，并强调微软团队为这一版本付出了巨大努力，如今该模型家族已跻身 Arena 排行的前三。他鼓励用户前往体验，并展示了由该模型生成的图像示例。

就整体战略而言，MAI-Image-2 的推出与微软近年来在 AI 领域“自给自足”的方向相呼应。在继续深度合作 OpenAI 的同时，微软正加速打造自有模型矩阵，从图像生成到语音转写等多个细分方向发力，以减少对单一外部合作伙伴的依赖。伴随 MAI-Image-2 在排行榜上的快速攀升，微软在高端图像生成赛道上对Google与 OpenAI 的直接竞争态势已愈发明显。