OpenAI祭出绘画神器:DALL·E 3联手ChatGPT轰Midjourney一夜下台

站长云网 2023-09-21 互联网 AI编辑

Prompt不存在了?DALL·E3忽然合并进ChatGPT,作图精准,细节逼真,OpenAI今天真的炸翻了AI绘画圈。早上醒来,AI绘画圈已被炸翻。OpenAI丢下一枚重磅炸弹——合并ChatGPT的DALL·E3,官宣了!



一个是史上最强大语言模型,一个是史上最强文生图模型,二者一合体,势必要颠覆整个AIGC圈。

经过最强变身后的DALL·E3,能够理解语义的细微差别,细节逼真到可怕。


Prompt:“一幅鳄梨坐在治疗师椅子上的插图,说『Ijustfeelsoemptyinside』,中间有一个坑大小的洞。治疗师,一把勺子,涂鸦笔记”

网友惊呼:“如果DALL·E3真的能准确呈现图像中的文本,那么它将彻底改变游戏规则!!!”


同时,prompt的门槛,也大大降低。

“语死早”的用户,再也不用担心写不出华丽丽的提示词。给个提示,ChatGPT就给你写出洋洋洒洒的段落。

总之,你可以尽情展开想象,让ChatGPT带你飞!


再也不用绞尽脑汁去思考如何prompt了!仅仅和ChatGPT对话,就能妙笔生花

甚至,你还可以在对话过程中,基于生成的图像随时做出修改。

可以看出,为了赶在Google发布多模态Gemini前夜,OpenAI先下手了。

英伟达高级AI科学家JimFan兴奋表示,这就是大规模多模态LLM与GoogleGemini史诗之战的提前预演!

OpenAICEOSamAltman也在评论区得意地表示:“Wearesoback”。


目前,DALL·E3还在内测中,预计将在10月上旬向所有Plus用户和企业用户推出。

Midjourney劲敌真来了!

DALL·E3的独特之处在于,它是在ChatGPT上原生构建的。

只需向ChatGPT提出要求,一个简单的句子,或者一个详细的段落,它就能开启头脑风暴,改进提示。


英伟达顶级科学家JimFan表示,这太震撼了!

DALL·E3的意义在于,它不仅是Midjourney的强劲对手,更代表着多模态大模型之战的一触即发。

DALL·E3的卓越语言匹配能力,是建立在坚实的文本GPT基础之上的。Midjourney其实并没有多少“推理大脑”,这就是为什么需要这么多的提示黑客。

先有大脑,再有像素,这就是构建强大多模态人工智能的方法。


不用学提示工程,你只管天马行空。提示词,ChatGPT帮你代笔,而精美画作细节,就由DALL·E3承包了。

下面这个例子告诉你,DALL·E3生成如下一幅画时,是如何详尽地将文字中的每一个场景,栩栩如生地刻在画中,画质仿佛电影一般。

一轮满月下洒满街道,熙熙攘攘的行人正享受着夜生活。

街角摊位上,一位有着火红秀发,身着典雅天鹅绒斗篷的少女,正与脾气暴躁的老板讨价还价。

这个老板身材高大魁梧,身穿笔挺的西装,留着引人注目的山羊胡,正用他那部复古蒸汽朋克风格的电话兴致勃勃地交谈着。


另外,在同一个提示下,比起DALL·E2,DALL·E3绘出的图像会更加精准。

比如,“Anexpressiveoilpaintingofabasketballplayerdunking,depictedasanexplosionofanebula”,DALL·E3在人物、篮球、更宏观背景生成上更加详细。


从网友做的对比图中可以看到,DALL·E3和DALL·E2之间的差距,可以说是史诗级的。


网友表示,OpenAI这次绝不仅仅是为了超越Midjourney。Google才是他们最大的竞争对手,尤其最近Gemini一直箭在弦上。


有人说,这种变化体现了AI作画工具的一个重要演进趋势:听懂人话

如果AI能让我们更好地描述和修改图像,那就太好了!DALL·E3能走多远,让我们拭目以待。


DALL·E3+ChatGPT

DALL·E3+ChatGPT,有多惊艳?

Altman在一段宣传视频暗藏了DALL·E3生成的可爱细节。


DALL·E3能够把一个5岁孩子的幻想,变成现实。

“我家5岁宝宝一直在说一个「超级向日葵刺猬”,它该长什么样?」

ChatGPT自动根据4个不同提示词,生成了不同的风格的图像。这里选择了最后一张,就可定下继续创作的基图。


接下来,给小刺猬起名Larry,并为它画一个房子。

可以看到,DALL·E3不仅准确理解了要求,而且还能够在图片中标注文字,在一个邮箱上面有“Larry”。

完全解决了,之前DALL·E模型完全不会写字的难题。


你还可以边画,边完善故事情节,甚至还能为其配上插画。


另外,DALL·E3还可以根据以上风格,生成可爱的贴纸,


最后,让ChatGPT总结上上述内容,再生成一个睡前故事,简直绝绝子。


OpenAI官方,也给出了一大波精美图集。

prompt:这是一件纸艺作品,描绘了一个女孩温柔地拥抱猫咪。她们都坐在盆栽中,猫满足地打着呼噜,女孩则面带微笑。场景中点缀着手工制作的纸花和纸叶。


Apapercraftartdepictingagirlgivinghercatagentlehug.Bothsitamidstpottedplants,withthecatpurringcontentedlywhilethegirlsmiles.Thesceneisadornedwithhandcraftedpaperflowersandleaves.

DALL·E3可以制作精美海报,还能配上文字。

prompt:金星复古旅游海报,纵向。画面描绘了金星周边围绕着厚厚的淡黄色云层,以及一艘老式火箭飞船驶近的剪影。神秘的形状暗示着云层下的山脉和山谷。底部文字为“探索金星:迷雾背后之美”。配色方案由金色、黄色和柔和的橙色组成,唤起人们的好奇心。


AvintagetravelposterforVenusinportraitorientation.Thesceneportraysthethick,yellowishcloudsofVenuswithasilhouetteofavintagerocketshipapproaching.Mysteriousshapeshintatmountainsandvalleysbelowtheclouds.Thebottomtextreads,'ExploreVenus:BeautyBehindtheMist'.Thecolorschemeconsistsofgolds,yellows,andsoftoranges,evokingasenseofwonder.

prompt:这幅插画描绘了一颗由半透明玻璃制成的人心,矗立在惊涛骇浪中的基座上。一缕阳光穿透云层,照亮了心脏,揭示了其中的小宇宙。地平线上碑座镌刻着一行醒目的大字“寻找你内心的宇宙”。


Anillustrationofahumanheartmadeoftranslucentglass,standingonapedestalamidstastormysea.Raysofsunlightpiercetheclouds,illuminatingtheheart,revealingatinyuniversewithin.Thequote'Findtheuniversewithinyou'isetchedinboldlettersacrossthehorizon.

prompt:这是一张暴风雨天放在窗台上的咖啡杯的3D效果图。窗外的暴风雨倒映在咖啡杯中,杯内可见微型闪电和汹涌的波涛。室内光线昏暗,更增添了戏剧性的气氛。


A3Drenderofacoffeemugplacedonawindowsillduringastormyday.Thestormoutsidethewindowisreflectedinthecoffee,withminiaturelightningboltsandturbulentwavesseeninsidethemug.Theroomisdimlylit,addingtothedramaticatmosphere.

prompt:一幅详细的油画,描绘了一位老船长,驾驶他的船穿过暴风雨。盐水溅在他饱经风霜的脸上,眼神坚定。在上方可以看到旋转的邪恶云层,严厉的海浪威胁着淹没船,而海鸥则在混乱的景观中潜水和旋转。远处传来雷声和灯光,将现场照亮,发出诡异的绿色光芒。


Adetailedoilpaintingofanoldseacaptain,steeringhisshipthroughastorm.Saltwaterissplashingagainsthisweatheredface,determinationinhiseves.Twirlingmalevolentcloudsareseenaboveanosternwavesthreatentosubmergetheshipwhileseagullsdiveandtwirlthrouahthechaoticandscape.Thunderandlightsembarkinthedistance.illuminatingthescenewithaneeriegreenglow.

Midjourney弱爆了

消息一出,网上很快就出现了一波和Midjourney的对比图。

同样的提示,Midjourney和DALL·E3,简直不在一个级别上。


还有,SDXL和DALL·E3生成对比图。


还有网友称,自己用RawMidjourney、Non-rawMidjourney以及DALL·E3用同一个提示生成图。


还有网友做出出了更多Midjourney和DALL·E3PK图。












全新原型,代号“Gizmo”

与此同时,网友“TiborBlaho”还爆料称,OpenAI正在为ChatGPT开发一款代号为“Gizmo”的全新原型——

它有着更新的UI界面,并为企业客户引入了强大的“Gizmo编辑器”,允许用户创建自己的“GPT”。






具体来说,你可以为自己的GPT定义个人资料图片、模型(GPT-3.5或GPT-4)、能力(包括DALL·E、网页浏览、编码沙盒、插件等)、已启用的插件列表、行为(这个GPT是什么,它做什么,它应该知道什么)、欢迎消息(当用户与这个GPT开始新的聊天时,它应该说什么),并决定这个GPT是不是私有的。

责任编辑:站长云网