随着生成型AI技术力的显著提升,越来越多创作者和商业公司加入AIGC浪潮,随之涌现出了大量AI绘图模型。如Midjourney、Dreambooth、Novel AI和Stable Diffusion等具备强大的文生图、图生图能力AI绘图模型。
但严格来说,目前热门AI绘图模型的发展,基本形成了以Midjourney和Stable Diffusion为代表的两强争霸趋势。
其中,采用订阅付费制服务、只需寥寥数语就能在Discord上在线生成图片的Midjourney,受到无数网民和设计师的欢迎。与之相对,开源免费、且可拓展性极强的Stable Diffusion则得到了大量专业开发者、游戏企业和设计团队的青睐。
今年4月,Midjourney进一步宣布推出Niji-journey V5,这是Midjourney针对二次元、动漫风格的预训练好的绘图模型,可在Midjourney中通过添加提示词直接调用Niji V5模型,由Midjourney和来自麻省理工的团队Spellbrush共同打造,此前火热的二次元AI作图工具Waifu,正是出自Spellbrush之手。
从Niji V5生成结果来看,该版本一定程度上改善了AI作图在表情和手部方面的问题。更重要的是,Niji V5展现出相当出众的造型张力和色彩使用、以及丰富的风格化表现力。不光看傻一众吃瓜群众,甚至惊艳了业内画师:“如果说之前只能替代低层和中层原画,现在这个版本无疑已经向高级原画开刀了。”
AI绘图二次元品质升级,顶级画师直呼破防
众所周知,此前讨论度最高的二次元AI模型主要是Novel AI。不过,由于其素材训练集多来自知名图片网站Danbooru,产出图片的风格相对单一,逐渐陆续被成熟的Midjourney和Stable Diffusion所取代。
对比来看,如今的Niji V5的画风不仅更加多元,还呈现出了相对高级的游戏原画表现力。参照网友分享,从宫崎骏手绘风到迪士尼电影画风,再到市面上热门的古风科幻、蒸汽朋克、废土朋克、西方魔幻等各种题材,该模型适用性极高。
之所以能够实现品质上的质变,一大原因在于相较此前版本,Niji V5 支持了风格化(stylize)参数设置。
在使用上,Niji V5基本同Midjourney没有太大区别,只需喂图得到Prompt,或是直接在Prompts最后输入“–niji 5” 即可,这段Prompts便会调动Niji V5模型进行绘制。在该版本下,用户可以使用风格化命令,即引用不同艺术家设计风格产出图片。同时,随着AI绘图品质越来越高,开始引发业内高水平画师的惊恐。
如一名完美世界的游戏原画师在知乎自述,从觉得AI是诈骗到逐渐了解,再到完全熟练,只用了一个礼拜。“以前我是真的不担心,因为那时AI产图距离优秀概念设计还有相当大差距,直到Niji V5出来。”
他认为,Niji V5产出图片的品质相当优秀,角色造型张力十足,几乎覆盖市面上的常见风格,已经可以用于美宣、角色设计和概念灵感。最关键的是,上手门槛极低,只需要微调设计,基本能够达到大部分优秀高级原画的工作需求。“半个月而已,太快了”。
当然,Niji V5本身还是存在不少问题。虽然整体风格化特征突出,细节绘制质量也得到了显著提升,但还是避免不了个别人体结果错误,或是无意义的复杂结构,且并未完全杜绝AI作图的手指错误问题。不过,从整体来看,这已经能够比肩现实中高水平画师的作品。
AIGC大潮下,两大主流工具的内卷竞赛
不难发现,自AIGC热潮席卷全球以来,两大热门AI模型Midjourney和Stable Diffusio开始了一场内卷竞赛。
与很多生成型AI相比,开源的Stable Diffusion能够让很多开发者训练自己的模型,以形成特定风格。同时,上限较高的Stable Diffusion可扩展能力极强,社区创造的插件很多,甚至有ControlNet这样能够对生成图片进行精准控制的插件。因此,专注Stable Diffusion的AIGC社区Civitai,也在诞生5个月后网站月访问量狂飙至3600万。
不过,由于Stable Diffusion需要本地部署,不光下载安装具有一定使用门槛,其对于用户的显卡和硬件性能的要求也较高。同时,如Civitai上大量预训练模型下载、安装、使用上存在一些难度,对于小白用户并不算友好。相比之下,Stable Diffusion更适用于专业设计师或企业。
与之相对,Midjourney功能强大且不需要本地安装,操作简单可在线使用。同时,它采用了付费订阅制,且同一个指令每次得到的结果都不尽相同,更适用于泛用户玩票体验。
从Google Trends来看,自去年AIGC话题兴起以来,面向大众的Midjourney热度受媒体报道的影响,基本呈现波浪式大幅度上涨;而功能多、开源、免费的Stable Diffusion成为专业人士的理想选择,热度增长较为平缓、但十分稳定。
具体来看,面向专业开发者的Stable Diffusion,整体热度其实落后于针对泛用户使用的Midjourney。而从地域分布来看,日本、韩国更关注Stable Diffusion,而包括中国在内的其他地区,都对“亲民”的Midjourney更有兴趣。
相比之下,Midjourney更受欢迎的原因,除了面向大众、操作便捷等因素外,更在于这款闭源模型的发展迅速。
在同Stable Diffusion的画质竞赛过程中,刚推出的Niji V5展现出了二次元图片生成能力的显著提升。虽然前者存在自由度高、可定制化等优势,但在线生成的AI模型已经达到这种品质,甚至让专业人士“破防”后,难免令人疑惑:是否还需要继续使用Stable Diffusion?
随着球再度踢向Stable Diffusion,它也给出了自己的答案:继续内卷。同样是在今年4月,Stability AI 发布了SDXL(Stable Diffusion XL)的测试版,带来更突出的清晰文本生成能力,能够实现更逼真、自然的人像和人体结构,同时具备生成双色调图片,充分实现艺术风格等优势。
想要真正“替代”画师,AI仍需努力
今年以来,AI几乎是以月为单位的夸张速度进化,预训练模型品质开始变得越来越“可怕”。如今,Niji V5达到顶级画师水平后,更是让整个画师行业产生了强烈的危机感。
必须承认,Midjourney仍然存在不小的短板,如生成图的随机性太强。但从品质层面来说,完全可以充当角色设计和概念灵感的参考,助力开发者制定风格和角色形象。对比之下,Stable Diffusion利用插件修改细节,可以直接产出成品,在这方面更具优势。
但整体来看,二者同样亟需面对一大难关,即多角色的生成问题。目前AI原生图还是以生成单角色为主,想要实现多个角色在同个画面互动,如做出勾肩搭背等复杂行为和动作时,很难精确控制表情和形体结构,或多或少会出现问题。
可以想象,一旦成功攻克多角色生成,Niji V5进一步攻破二次元风格,必然会对相关领域产品,包括动画、漫画和游戏生产方面造成重大冲击。彼时,由于AIGC完全可以无缝制作漫画、动画、游戏和周边,中低层画师的职能也将随之改变:从创造变为负责对AI生成图片进行挑选,或是利ControlNet等插件进行二次修改和精准调整。
GameLook认为,担心被“开刀”的顶级原画师,可以转向研究原创画风的创作方向,用以自行训练AI绘图模型,再面向企业和普通用户收费。在AIGC主导的未来,如何匹配相应商业模式,让真正有实力的画师群体从中获利,应该成为之后专业人士最关心的话题。