AI有可能批量制造虚拟博主吗?
文|云飞扬
编|张 洁
文章来源|新榜(ID:newrankcn)
最近,UP主“勘云工造”创作的一组纯写实AI人物引起了不小讨论。乍一看几乎和网上刷到的博主看不出差别,但这的确是用AI画出来的。
图源:B站“勘云工造”
与此前爆火的“AYAYI”等超写实虚拟人不同,最近走红的纯写实AI人物得到的大多是“以假乱真”“和真人差别不大”等评价。
图源:左小红书“AYAYI”,右“宽粉”
得益于这些AI人物的高颜值和高拟真度,最近小红书上不仅出现有偿定制头像等生意,还有了不少虚拟博主。以“爱旅游的小多”为例,通过分享小红书“自拍”美图,目前粉丝量已经超过2万,其中数据最好的一条笔记获赞超5962。
图源:小红书
虚拟博主评论区,有网友感叹“这么好看你告诉我不是真人”,还有网友提问“这种纯由AI作图的账号有没有变现价值”。
那么问题来了,AI有可能批量制造虚拟博主吗?真人博主会被抢饭吃吗?
近日,新榜编辑部和“勘云工造”以及多位内容从业者聊了聊,探讨了虚拟博主在技术上的可行性,以及市场应用的可能。
“勘云工造”主业是原型师,研究AI是他多年来的兴趣。得益于对AI技术的持续钻研,“勘云工造”最近几组AI作品不仅在B站获得百万级播放,还得到了日推新闻的报道,在推特上的最终浏览量超三千万次。
关于AI人物的技术原理,“勘云工造”曾解释,自己制作的AI人物主要使用stable diffusion本地部署进行制作,其中,他主要使用chilloutmix模型进行制作,所使用的的人物lora模型则基于二次元角色立绘进行训练,实现了不使用真人cos照片的同时让AI学会cosplay。
那么,AI人物在技术上有成为虚拟博主的可能吗?“勘云工造”以一个资深AI玩家的身份认为,至少在图片领域,虚拟博主已经不存在太大的技术难点,大部分真人博主能做的,虚拟博主也都能做到。
当然,受限于算法还不够聪明,细分领域的素材库还不够丰富,虚拟博主的生产效率和生产精度还不行。不过,目前业内已经出现不少商用级AI产品,如果有公司能整合现有技术,输出一套虚拟博主的整体解决方案,这些也未必还会是难点。
关于虚拟博主具体能做到什么程度,可参见新榜编辑部和“勘云工造”的对话:
新榜编辑部:现在的AI人物的技术原理是什么?与之前相比,为什么拟真度提高了这么多?
勘云工造:AI人物的底层逻辑就是向AI输入很多人物照片,利用照片训练目标结构上的相似之处进行学习。
至于为什么现在AI人物能让人几乎看不出真假,是因为经过几次迭代,数据模型不断混合,不断产生出新的模型。
图源:小红书“应 墨ink”
新榜编辑部:假设我想生成一个有着特定形象的AI人物Susan,以现在的技术能做到吗?
勘云工造:可以很接近,但不能保证完全一样。比如说我可以生成1万张照片,用穷举法找出其中最接近你需求的,然后以这个为模板制作其他的图片。
新榜编辑部:我可以让Susan做出不同动作造型吗?比如跳舞、自拍……
勘云工造:可以。最近刚出的一个新插件就可以用来做人体识别模型,通过控制骨骼的方式还原AI人物的动作造型。现在视频还不太行,但静态照片已经可以把指定动作做得非常自然。
目前AI人物的肢体动作已经能做到相对自然。 图源:小红书“AI少女团”
新榜编辑部:服装呢?我能让Susan每天换上不同的衣服吗?包括一些刚上市的新款式。
勘云工造:可以,但可能没那么方便。如果是模型库中没有训练过的衣服素材,你必须先给衣服拍照,把它做成一个训练集,然后再加入到模型中。整个流程大约需要半天。
但是,以目前的技术还没办法精细还原衣服的材质以及因为人物动作不同导致的衣服褶皱。解决方案同样是穷举法,在AI自动生成大量照片后,从中选出最自然的一张。
新榜编辑部:我能给Susan化妆吗?因为博主通常要紧跟潮流,体验各种新妆容。
勘云工造:这个也需要训练,先从不同角度拍摄这个妆容的高清人物肖像图,然后处理成一个训练集。
但有一个难点,因为AI的鉴别机制还不够灵活,在人数较少的情况下AI很可能分辨不出来到底是要学习照片上的人脸还是妆容。
新榜编辑部:我能把Susan放到咖啡馆、书店等不同的场景中吗?也要拍照片然后做成训练集吗?
勘云工造:不需要,现在有更好的办法。有的插件已经可以把背景图片直接融入到图片中生成。
新榜编辑部:以现在的技术,能同时生成双人甚至多人吗?
勘云工造:最开始可能没办法精准识别,有可能会把不同特征匹配到不同人身上,但最近的技术进步很快,现在已经可以完美控制多人差分生成了。
图源:小红书“天高不高-AI”
新榜编辑部:能让Susan表演出不同的微表情吗?比如模仿梁朝伟的眼神戏。
勘云工造:我前段时间刚好在研究微表情。通过加入不同的情绪标签,然后利用不同的权重组合,是能够搭配出不同的微表情的。
但AI必须要有很多图片来参照学习,一张照片很难训练出效果。如果是模仿某个特定人物的特定微表情,AI很可能没办法识别是要学习对方的脸还是微表情。
最大的难点是原始数据不够,假设能拿到北影、上戏这些表演学校的教学视频作为基础素材,通过控制变量,理论上可以让AI人物学会各种各样的微表情。
图源:小红书“oppa-yang”
新榜编辑部:你认为目前困扰Susan成为虚拟博主的最大难点是什么?
勘云工造:创造力不是难点。很多不了解扩散算法的人对AI的理解还是简单的元素缝合,没有创新能力,但新的lora模型证明了AI的能力是在不断提升的。
我认为现在最大的问题不是数据喂养不够,而是算法不够智能。这导致AI无法精确处理庞大的素材,最终的结果就是AI生成的人物的精确性和灵活性不足。
新榜编辑部:我见到不少AI人物在手部等细节上有不小的Bug,你认为这些什么时候能解决?
勘云工造:现在手已经不是问题了,已经有技术可以进行控制,只不过还稍微麻烦一点。
注意人物的手。图源:Ai-Jessica
新榜编辑部:假设我们现在接到一个品牌投放,需要虚拟博主Susan通过造型动作、服装妆容、所处场景以及微表情等细节呈现品牌想要的效果,大约需要多长时间?
勘云工造:时间会比较长,因为这是一个组合需求,不是单纯的加减法,整个过程必须进行多次嵌套,有点像图片的后期合成。
时间最少可能也需要一周,因为一定会需要后期微调,而且成功跑出来一张照片后,如果换了新动作、新场景,新照片消耗的时间也不会缩短太多。
新榜编辑部:如果要求不那么高呢?比如让Susan生成一些小红书风格的美图。
勘云工造:这取决于你的设备性能,给到AI的自由度,以及后期修图速度。
假设你拥有一台1万元左右的电脑,给AI设定了校园主题让它自由地跑,24小时大约能跑出来500张,至于其中有多少张能用,要看你的修图速度。一般AI直接跑出来的图,效果不会那么好,需要进行微调后再次投入AI进行迭代。
如果不要求定制化,只是日常美图,AI的表现不错。图源:小红书“爱旅游的小多”
新榜编辑部:视频呢?有AI画师参照照片从去年到今年的进化速度,认为1-3年内视频也能达到像照片一样令人惊艳的效果。
勘云工造:这没办法直接类比。因为技术突破不是线性的,而是爆炸性的,什么时候会有瓶颈也不好说。
视频的本质就是连续性图片,AI视频的技术难点则在于,目前没办法让两张照片之间形成平滑的过渡,比如在视频中,随着画面的变化,阴影关系也会发生变化,这个目前很难解决。
当然,AI的技术突破也都是在这几个月内实现爆炸性进化的,未来会怎么样,我也说不好。
PS. 目前已经有部分知识博主利用数字人代替自己生产口播视频,但这类视频的特点是动作固定、场景单一,技术原理更像是皮影戏,是利用AI技术让一张图片动起来,与真正凭空生成AI视频还有所差别。
目前来看,随着AI技术的持续发展,虚拟博主在技术上并不会有太大困难,但如果是在真实的市场竞争中,虚拟博主还能Hold得住吗?虚拟博主会跟真人博主抢饭吃吗?
为此,我咨询了多位内容从业者,大部分人觉得,至少以目前AI的技术表现,他们在虚拟博主身上看不到太多威胁。
MCN机构小红發负责人钱大暖认为,虚拟博主无法代替真人博主的核心原因在于,虚拟博主的优势是足够美、可操控、好复制,但这并不是高商业价值博主的必要条件。“一个博主为什么会火?你问任何一个MCN的运营负责人,他们的回答大概率是‘看命’,每一个头部博主都是难以复刻的,美也不是博主的核心竞争力。”
KOL的根基在于能和一部分人共情。钱大暖说:“一个成功的博主,一定是通过展示学习、工作、爱情等内容吸引到了和自己一样的人,或者内心深处向往拥有博主这样生活的人。”
以博主“氧化菊”为例,她的经纪人心怡认为,“氧化菊”最根本的吸引力是这个来自广西小乡村的女孩,成为了小镇女孩的梦。(延伸阅读:《 》)
图源:抖音“氧化菊”
个人魅力往往来源于真人的丰富经历和细腻情感,虚拟博主很难具备;完美无死角的脸蛋在网红行业并不意味着一定红,虚拟博主好看的的优势也未必是优势。
KOC的根基则是真实。钱大暖认为,KOC商业价值是品牌需要一些真实的人帮助品牌做舆情。“为什么品牌开始投博主?因为明星过于商业化以后消费了消费者的信任度;为什么品牌开始投KOC?因为博主过度商业化,也出现了消费者的不信任。对品牌来说,投KOC就像做淘宝好评,需要一些看起来更真实的内容。虚拟博主很难做到KOC的差异化和真实感。
在这个行业,真实和真诚恰恰是最重要的,只有这样,博主才能帮助品牌与消费者对话,进而增加自身的商业价值。顺着这个逻辑,即使能解决技术问题,虚拟博主也没办法成为美妆护肤这类需要真人体验的博主。
MCN机构OST的编导刘倩雯则并不看好虚拟博主的技术表现力。
刘倩雯以颜值博主举例,一方面,颜值博主的竞争力就在眼神交流等细节上,必须要真实丰富、灵活的情感化细节才能吸引粉丝;另一方面,大部分颜值博主都需要靠直播来锁粉,单纯的图片是不够的。
“另外,虚拟博主的那种精致也未必是优势,贴近生活的内容反而更受欢迎”,刘倩雯说。
从游戏电影的经验来看,把人物做精致很简单,但要把人物做“粗糙”做“脏”,却是一件很考验技术、时间的事情。
AI人物最大的特点就是“干净”,图源:小红书“往之”
MCN机构番茄蛋联合创始人罗锴也提到,AI美女虽然颜值不俗,但同质化问题也非常明显。
“目前的AI美女也许能满足宅男的审美需求,但其他的需求我觉得还达不到。虚拟博主的核心是需要AI能产生真正的人格和灵魂,给到粉丝日常沟通的感觉。这件事我觉得是非常难的。”罗锴认为,从实际应用来看,目前的AI还没有到达技术拐点,更多是噱头。
虚拟博主对真人博主真的毫无影响吗?我认为,随着技术发展,真正制约虚拟博主的只会是AI的情感表现力,但情感未必是真人博主的护城河,虚拟博主也未必不能和用户建立情感链接。
最近,UP主“Clement日记”以“我7岁那年,妈妈去世了。你能当我的妈妈吗?”为主题,和ChatGPT进行了一系列对话,这些对话虽然仍带有“机器翻译”的感觉,但不少网友也觉得,ChatGPT的回复已经足够感人。
图源:B站“Clement日记”
真人博主的骄傲在于虚拟博主无法像真人一样给粉丝带去情感价值,但至少二次元宅男已经证明了,爱上虚拟女友并非不可能,AI同样可以提供受认可、能变现的情绪价值。
而除了“爱上AI”这样掺杂了一定社会学、心理学的可能外,虚拟博主还会对网红行业产生一些更真实的冲击。
罗锴提到,受影响最大的会是近几年火起来的虚拟人博主。“之前的虚拟人博主需要一整个团队,但现在的虚拟博主可能只需要一个人一台电脑就可以搞定了。工具的平民化,使得虚拟人团队的生产效率受到冲击。”
内容质量不高、与粉丝情感链接不深的博主也可能受到冲击。虚拟博主好操控、易复制的优势将得到极大释放。罗锴认为:“虚拟博主会抢占一部分只会发图片的平面博主的市场份额,这是毫无疑问的。”
对于颜值博主,有网友留言:“网红开美颜滤镜也接近AI长相了,那还不如直接看AI美女。”
图源:小红书
对于生活博主,Youtube博主Kyle Vorbach则进行了一个极佳的示范。最近,他利用AI技术伪造了自己一个月的生活,包括和爱犬搬进漂亮的公寓、在大街上偶遇名人、穿上万圣节服装,以及去纽约和朋友相会等。如果足不出户就能游遍世界,那生活博主还如何吸引粉丝呢?
Kyle Vorbach利用AI生成的名人合影。 图源:Youtube
最后也是最有可能的,以提供实用信息为主的博主可能被快速取代,比如穿搭博主。这些博主的核心价值是提供实用信息,粉丝也大多不在乎她们的人格。这个时候,虚拟博主的弱点不再是弱点,同时还能无限放大自己在效率上的优势。
罗锴说:“模特的工作并不需要任何和粉丝的粘性与互动,存在价值就是无情的上身展示机器,一旦解决服装素材的高效输入问题,就目前AI的仿真度而言,已经基本不需要模特拍照了。”
据媒体报道,德国的服装企业ColorDigital,已经开始组建自己的“数字模特营销团队”,希望用AI生成的完美模特为潮牌做宣传。
网红行业实际上有两条赛道:一条是内容赛道,拼的是专业运营,靠的是粉丝信任;一条是流量赛道,核心是用大量低质内容帮平台填充内容库,帮网友打发时间。前者是真正的意见领袖,后者我们暂称为量产网红。
虚拟博主当然不完美,但博主也不都是李佳琦、李子柒,大部分网红本身就是速朽的,既缺乏持续创作能力,也没有对粉丝的持久影响力。对虚拟博主来说,只要比量产网红强,就够了。
图源:微博“虎扑步行街”
虚拟博主和真人博主也不一定是非此即彼的关系。比如“AI出镜、运营幕后”,至少能让内容创作者多一种内容表现形式。刘倩雯提到:“如果是我,我希望能让AI作为搭档,和博主一起出镜。”
当然,也有人提出了不同意见。钱大暖认为,要想具备高商业化能力,虚拟博主必须具备百花齐放又特立独行的人格魅力,这非常考验背后的运营编导,而且很难规模化复制。“如果运营编导能把账号做起来,那跟虚拟博主关系也不大。”
罗锴则猜测,未来也许会出现一批技术型MCN,毕竟虚拟博主的确有更丰富的表现形式和更高的生产效率,管理成本也比真人博主要低得多。他觉得:“至少在小红书这个生态内,一些虚拟博主能靠堆照片涨粉,说明网友对AI美女还是比较感冒的。因为目前既懂技术又懂内容的人还很少,也许还会有一波红利。”
“当然,未来大家会不会对虚拟博主审美疲劳,我也不太清楚”,罗锴补充。
谈及虚拟博主的潜在风险,“勘云工造”认为首先要解决的就是版权问题。“目前业内常用的几十个模型,原始素材大多是用网络爬虫抓取的,存在版权问题。当然,如果严格限制版权,任何大数据都是搞不起来的。”
其次是社会伦理问题。技术上,生成黄图和假新闻图片并不难,生成现实生活中的真人,或者利用AI人物诈骗也不无可能,但这显然会触犯相关法律和社会道德。
Tiktok用户利用AI生成的假新闻图片
某网站展示的争议图片
曾利用AI美女引起热议的女仆之夜
去年11月,国内颁布《互联网信息服务深度合成管理规定》,对AI的使用范围进行了规定。“勘云工造”也认为:“不管在任何时代,技术必然要迎合大众喜好,如果大众抵触AI,那市场就会倾向于少用,或者不让技术成长。”
一位模型作者的声明
即使以上所有问题都解决,如果虚拟博主大规模出现,也必然要接受用户和平台的双重考验。用户很可能会对虚拟博主的内容有着完全不同的评价标准,平台也会考虑虚拟博主是否会劣化平台生态,是否能让平台多赚钱。
近日,OpenAI首席执行官Sam Altman发文称,一个“错位”的超级智能AGI可能会对世界造成严重伤害,所以应该对所有试图建立AGI的尝试进行严格审查,并在重大决策上进行公众咨询。