早在几个月前,我体验了midjourney的AI绘画,当时我冲了10美元,体验了大概几个小时吧,然后也使用AI给自己绘制了一个头像,也就是我网站现在这个头像。
当时觉得midjourney用起来还是挺方便的,毕竟stable diffusion需要高级显卡,再加一堆环境部署才能跑起来,midjourney只需要充少量的钱就能进行AI绘图了,相比之下不要太方便。
在冲的10美元花光了之后,我再也没充值,因为说实话,太贵了,10美元在当时我记得就玩了2个下午就耗光了。因为我不是UI或者UE,所以我后面就没有再继续深入研究AI绘画。
在上个月的时候,OpenAI宣布DALL·E将升级至DALL·E 3,同时将集成在chatGPT中。我当时看了一些新闻,但在我登录自己的账号时不知是没注意还是什么问题,我并没有看到这个功能,直到昨天晚些时候我发现在GPT4下面新增了一个DALL·E 3
,我当时就迫不及待的体验了下,感觉真的是方便了不少。
体验
- 首先需要是GPT-4的模型,只要账号正常就可以在模型下面看到
DALL·E 3
这个功能了。
- 选择之后跟普通的GPT对话框没有任何区别,这点跟midjourney区别挺大,使用MJ的时候要按下
\
,然后输入prompt
,紧接着需要找一个提示词生成工具去生成英文模式下的提示词,类似下面这样:
/imagine prompt: An astronaut wearing a spacesuit floats in space beyond Earth, with a blue Earth background. The astronaut holds a bundle of balloons in his hand and faces the audience, greek interior design, Fauvism, business card --ar 16:9 --v 5.2
但是GPT-4中的DALL·E 3完全不需要这么繁琐,按照第一性原理,我们想要描述一张图片会怎么说?肯定是用最直白、最通俗的语言来进行描述,比如我上面的提示词中文原意是:一个宇航员穿着宇航服漂浮在地球之外的太空,背景是蓝色的地球,宇航员手里握着一束气球面对着观众
,我们直接将其输入DALL·E 3即可,就这么简单,不需要去想更繁琐的提示词。
就这么简单,如果有人要教学DALL·E 3该如何使用,他一定是个骗子,因为你会用语言来描述就可以了,尽可能把你的需求通过语言描述出来,剩下的交给DALL·E 3就好。
我用AI绘图最开始的时候感觉一个很有意义的事是,可以将你的”梦想“进行可视化还原,我之前做过一个梦,梦见在一个中国的木质古建筑群中发现了一口棺材,我站在棺材旁边看着古建筑群。我尝试用DALL·E 3来将这个梦境还原。
感觉还不错吧,不过这个棺材感觉还是偏西方的那种,而且这种画风过于写实,梦境一般都过于虚幻,有点像水墨风,于是我让DALL·E 3帮我修改成水墨风试试~
这么一改之后,图1跟图3就有点达到我梦境中的样子了。
对比midjourney
跟MJ对比而言,DALL·E 3说实话操作起来简单了不少,再也不用去想繁琐的提示词了,开箱即用,怎么说就可以怎么出图。但是对比mj页还有一些不足,下面是我初步想到的一些。
缺点:
- 以图生图:这个功能有多好用就不用说了吧,我可以上传一个刘德华的图像让刘德华出现在上面的古建筑群中,之前网上很火的FBI逮捕特朗普就是用这种方式生成的,目前还没发现DALL·E 3能否通过上传图片来生成图片;
- mj一次出4张图,可以针对满意的图进行继续生成,这样能够逐渐实现自己满意的图,而且可以针对新的图片提出新的prompt;DALL·E 3是一次就生成好图片,不过这个我感觉深入使用后应该能找到方法;
优点:
- 首先我目前还没发现DALL·E 3有mj上面那种时间限制,我当时冲了10美元,只能用200分钟的图形处理时间,而DALL·E 3中没有限制,我感觉光凭这一点简直不要太香,要知道MJ上面要是玩30小时的费用是60美元,GPT PLUS一个月只要20美元,而且能同时使用DALL·E 3跟GPT4;
- 其次是操作真的很简单,而且符合人类直觉,比如我要给刚刚水墨风下面加点天气因素,我只需要对DALL·E 3说,当天天气有些阴冷,天空下着小雨,而且在吹风。DALL·E 3就可以继续上面的对话为我继续输出图片,这个体验非常好。
一瞬间那个恐怖的梦境就朝我袭来了,哈哈哈~
总结
回到标题的问题,midjourney还香吗?我觉得不香辣,毕竟20美元一个月的价格同时使用GPT4加DALL·E 3,太香辣!最后让DALL·E 3给本文生成一张博文配图。
我选了第2张,你们觉得哪一张更好呢?
第二张提示词(prompt):
An illustration where ChatGPT and DALL·E 3 characters are engaged in a friendly handshake amid a dreamy landscape. In the distance, a signboard reading 'midjourney' appears slightly worn out, contrasting the modern and the old.
评论区