🔥 重磅泄露 · 即将发布

GPT-Image-2 图像生成的 下一个时代

OpenAI 史上最强图像模型,近乎完美的文字渲染、4K 超清分辨率、3 秒极速生成、媲美真实照片的画质——已在 LM Arena 泄露测试中震惊全球开发者社区。

4K
最高分辨率输出
<3s
极速生成时间
99%+
文字渲染准确率
#1
Arena 盲测排名
gpt-image-2 · maskingtape-alpha · LM Arena test screenshots
GPT-Image-2: hyper-realistic engineer's desk scene
prompt: engineer's desk at 9am
GPT-Image-2: UI screenshot with near-perfect text rendering
prompt: YouTube homepage UI
GPT-Image-2: product shot on pharmacy shelf
prompt: product shot pharmacy shelf
GPT-Image-2: first-person game city scene
prompt: Minecraft Manhattan first person
4096×4096
最大原生分辨率(4K 级别)
2.8 秒
Arena 测试平均生成时长
439K+
泄露帖子 X 平台浏览量
全面领先
盲测击败 Nano Banana Pro

六大革命性升级

GPT-Image-2 采用全新独立架构,从根本上重新定义 AI 图像生成的边界

🔤

近乎完美的文字渲染

准确率从 1.5 版的 90-95% 提升至 99%+。标牌、UI 按钮、代码片段、多语言文字——均能精准嵌入场景,不再出现乱码或拼写错误。

📸

照片级真实感

彻底消除困扰 GPT-Image-1.5 的黄色色偏,自然中性色彩还原。人像与真实照片无法区分,手部解剖结构准确,太阳镜反光细节逼真。

🌍

强大的世界知识

能精准还原宜家门店建筑外观、YouTube 主页界面布局、Windows 系统 UI、我的世界曼哈顿场景——无需参考图,仅凭提示词即可实现。

极速 3 秒生成

全新单次推理架构,生成时间从 8-12 秒压缩至 3 秒以内。Arena 测试均值 2.8 秒,批量生产效率提升 4 倍。

🖼️

4K 超高清输出

原生支持 2048×2048,可扩展至 4096×4096(4K)。新增 16:9 宽屏比例,完美适配演示、视频缩略图、宽幅广告场景。

🔡

多语言文字支持

大幅提升非拉丁文字(中文、日文、阿拉伯文、韩文等)的渲染准确率,真正实现全球化图像生成需求。

GPT-Image-2 leak video thumbnail
Community Recap: LM Arena Leak Test Walkthrough
@blakeir · April 4, 2026
🔥 事件回顾

那个让全球 AI 社区震惊的夜晚

2026 年 4 月 4 日,三个匿名模型悄然出现在 LM Arena,化名 maskingtape-alphapackingtape-alphagaffertape-alpha

开发者 Pieter Levels 率先发推:"它展现出极强的世界知识和完美的文字渲染"。数小时内,该帖子获得 439,000+ 浏览,社区一致判断:这就是 GPT-Image-2。随后模型被静默撤下——但截图已经传遍全网。

文字渲染 真实感 世界知识 4K 分辨率 3秒生成

GPT-Image-2 vs GPT-Image-1.5

全新独立架构带来的不只是迭代更新,而是跨代级的飞跃

GPT-Image-1.5(当前版本)

已上线
GPT-Image-1.5 sample — color cast, missing detail
  • Text rendering accuracy 90-95%, still has misspellings
  • Noticeable warm yellow color cast
  • Max resolution 1536×1024
  • Generation time 8–12s
  • Based on extended GPT-4o pipeline
  • Poor non-Latin text rendering
  • No 16:9 widescreen support

GPT-Image-2(即将发布)

即将发布
GPT-Image-2 sample — photorealistic with natural colors
  • Text rendering accuracy 99%+, near-perfect
  • Natural neutral colors, no color cast
  • Supports 2048×2048 to 4096×4096
  • Generation time under 3s
  • Brand-new independent architecture, single-pass inference
  • Dramatically improved non-Latin text rendering
  • New 16:9 widescreen ratio
能力维度 GPT-Image-2 ⚡ GPT-Image-1.5 Midjourney v7 Nano Banana Pro DALL-E 3
Text Render Accuracy 99%+ 90-95% 70-80% 88-92% 65-75%
Max Resolution 4096×4096 1536×1024 2048×2048 2048×2048 1024×1024
Avg. Generation Time < 3s 8–12s 15–60s 5–8s 10–15s
Realism Photorealistic Very High Artistic High Medium
World Knowledge Excellent Good Limited Good Limited
16:9 Widescreen Support ✓ Native
API Price / Image $0.15-0.20 $0.133-0.200 By subscription $0.12-0.18 $0.04-0.12

社区真实反应

这些是 2026 年 4 月 4 日泄露测试期间,来自 X(原 Twitter)的真实开发者声音

Blake Robbins avatar
Blake Robbins
@blakeir · Venture Capitalist
𝕏
"People are speculating that GPT-Image-2 is being tested on @arena. The early samples leaking out are mind-blowing. All three of these images are AI-generated — can you believe it?"
Blake Robbins's shared GPT-Image-2 test screenshot
❤️ 12.4K 🔁 4.2K 👁️ 439K
Justine Moore avatar
Justine Moore
@venturetwins · a16z Partner
𝕏
I tried two simple prompts — "average engineer's screen" and "young woman taking selfie with Sam Altman" — and the results were jaw-dropping. This model's grasp of real-world context is beyond anything I've seen.
Justine Moore's shared GPT-Image-2 engineer desk screenshot
❤️ 8.9K 🔁 2.7K 👁️ 218K
Pieter Levels avatar
Pieter Levels
@levelsio · Indie Developer
𝕏
These Arena models show incredibly strong world knowledge and great text rendering. They may surpass Nano Banana Pro. This is solid proof that the tape-series models make NBP "look like DALL-E."
Pieter Levels's shared game scene screenshot
❤️ 15.2K 🔁 5.1K 👁️ 512K
Min Choi avatar
Min Choi
@minchoi · AI Engineer
𝕏
What floored me most about the tape leak is its UI generation — browsers, productivity tools, code editors. The pixel-level fidelity is good enough to use directly for prototyping.
❤️ 6.3K 🔁 1.8K 👁️ 143K
AI tester avatar
Elena K.
@elaniak_dev · Full-stack Developer
𝕏
I blind-tested maskingtape-alpha on Arena for two solid hours. This model dominates every other model on realism, text rendering, and world knowledge simultaneously — a triple-threat we've never seen in AI image generation.
❤️ 4.1K 🔁 1.2K 👁️ 87K
Product manager avatar
David Chen
@dchen_pm · Product Manager
𝕏
I got noticeably better images in ChatGPT — must have been an A/B test. The quality was so different I thought my account was bugged. Turns out this is the pre-rollout test of GPT-Image-2.
❤️ 3.7K 🔁 987 👁️ 62K

谁在等待 GPT-Image-2?

从品牌设计到游戏开发,GPT-Image-2 重新定义各行各业的图像生产范式

E-commerce product image generation use case
电商运营

产品图一键生成

货架陈列、场景搭配、白底图——秒级生产,彻底解放摄影成本。

UI/UX prototype design use case
产品设计

UI 原型极速可视化

文字描述秒出高保真界面截图,完美辅助早期产品演示与客户沟通。

Developer API integration use case
开发者

API 深度集成

通过 APIMart 统一 API 调用,批量生成、多风格切换,轻松嵌入任何产品。

Marketing content creation use case
内容营销

营销物料批量产出

社媒海报、广告 Banner、邮件配图——品牌调性一致,文字精准无误。

GPT-Image-2 发布时间线

基于 OpenAI 历史节奏与当前测试信号的综合研判

2025 年 3 月

GPT-Image-1 正式发布

首次将图像生成集成入 GPT-4o 架构,颠覆 DALL-E 独立产品形态。

2025 年 12 月

GPT-Image-1.5 灰度测试(Chestnut/Hazelnut)

以代号在 Arena 灰度,测试数周后正式上线,此模式为 GPT-Image-2 提供参照。

🔥
2026 年 3 月 24 日

Sora 关闭,释放大量 GPU 资源

约每日 1500 万美元推理成本的算力被重新分配,为 Image V2 的大规模训练与测试铺路。

🔥
2026 年 4 月 4 日

LM Arena 泄露——社区震动

三个 tape 系列代号模型短暂现身,数小时内被撤下,泄露截图迅速传遍 X 平台。

2026 年 4 月底 — 5 月 12 日前

正式发布窗口(预测)

DALL-E 2/3 下线截止日期 5 月 12 日形成重要时间节点,预计 ChatGPT 优先上线,API 访问 2-4 周后开放。

通过 APIMart 调用 GPT-Image-2

GPT-Image-2 API 开放后,APIMart 将第一时间接入,提供比官方更优惠的价格

开发者
$0.15 / 张
标准质量 · 1024×1024
  • GPT-Image-2 标准质量
  • 1:1 / 3:2 / 2:3 比例
  • 99%+ 文字渲染准确率
  • 3 秒极速生成
  • REST API 访问
开始使用
企业版
$0.20 / 张
4K 极清 · 4096×4096
  • GPT-Image-2 4K 极清
  • 原生 4096×4096 分辨率
  • 专属速率限制
  • SLA 服务保障
  • 专属技术支持
联系销售

关于 GPT-Image-2 的一切

最全面的 GPT-Image-2 解答,持续更新

GPT-Image-2 什么时候正式发布?
根据 OpenAI 的历史发布节奏以及当前测试进展,GPT-Image-2 预计于 2026 年 4 月底至 5 月中旬正式发布。关键时间节点是 5 月 12 日——DALL-E 2/3 的正式下线截止日期。目前模型已在 LM Arena 和 ChatGPT A/B 测试中大规模测试,APIMart 将在 API 正式开放后第一时间接入。
GPT-Image-2 和 GPT-Image-1.5 有什么本质区别?
GPT-Image-2 是一次跨代级架构升级,而非迭代改进。核心提升:文字渲染准确率 90-95% → 99%+;消除黄色色偏;分辨率 1536×1024 → 4096×4096;生成速度 8-12 秒 → 3 秒以内;新增 16:9 宽屏支持。
GPT-Image-2 的 tape 系列代号是怎么回事?
2026 年 4 月 4 日,OpenAI 以三个代号将 GPT-Image-2 上传至 LM Arena:packingtape-alphamaskingtape-alphagaffertape-alpha。模型数小时内被撤下,但社区已留存大量测试截图。
GPT-Image-2 能通过 API 调用吗?价格是多少?
是的。预计 API 定价为 $0.15-0.20 每张。ChatGPT Plus/Pro/Go 订阅用户将在订阅内获得访问权。APIMart 将提供统一调用接口,批量用户可享受阶梯价格。
GPT-Image-2 支持哪些图像尺寸和宽高比?
支持 1:1 方形、3:2、2:3 竖版以及全新的 16:9 宽屏比例。最高分辨率可达 4096×4096(4K 极清)。
GPT-Image-2 的文字渲染为什么这么强?
源于其自回归生成架构——与 GPT 语言模型的 token 预测机制深度融合。传统扩散模型依赖概率采样,容易出错;GPT-Image-2 通过语义理解直接约束文字生成,实现接近 100% 准确率。
API 即将开放

第一时间用上 GPT-Image-2

GPT-Image-2 API 正式开放后,APIMart 将在 24 小时内完成接入。留下邮箱,第一时间获取访问权限和专属优惠。

已有 3,200+ 开发者加入等待名单 · 无垃圾邮件 · 随时退订