AI写真产品的逻辑
妙鸭相机爆火出圈后,乘着真人电影《芭比》上映的热度,这几天,一款可以生成芭比写真的小程序“45AI”走红社交媒体,圆了数万网友的芭比公主梦。
AI生成写真背后的技术原理是什么?成本有多高?爆火之后,又该如何长久地留住用户,规避风险?AI写真产品混战,谁能最终胜出?围绕这些问题,我们跟一些AI相关从业者聊了聊。
不是技术创新,而是产品创新
关于生成AI写真的技术原理,业内人士普遍推测,大概率是LoRA微调模型。
LoRA的全称为Low-Rank Adaptation of Large Language Models,可以理解Stable Diffusion(SD)的一个插件,它可以在不修改SD大模型的前提下,利用少量数据,以更快的速度训练出一个微调模型。
具体到AI写真,可以理解为用你上传的照片,为你单独训练一个LoRA微调模型,让这个模型学习你长什么样,然后通过限定模版,固化提示词,生成不同风格但像你的写真。而20张照片的数量,被认为是训练成本和生成效果的平衡点。太多,训练时长会变长,训练不充分可能就没那么像。太少,容易过拟合,生成的结果不容易产生变化。
Typekey AI的创始人Richard表示:“妙鸭并没有用什么未知的新技术,目前成熟的流程基本都能够实现类似的效果。它的走红并不是因为技术创新,而是产品创新、产品完善度高。AIGC圈子内做人像微调然后生成图片的项目很多,但把整个流程做成无门槛的大众产品的并不多。”
以妙鸭为代表的AI写真软件,通过产品化包装大大降低了使用门槛,成为国内AIGC应用商业化落地的排头兵,此前还有网友称“妙鸭可能是国内AIGC领域第一个正向出圈的C端产品”。然而,妙鸭却因霸道的用户协议和“不退款”争议被推上风口浪尖。虽然妙鸭团队及时修改了相关条款,并承诺用户上传的照片仅会用于制作数字分身,不会挪作他用,但仍有不少网友表示担忧。
对此,独立安全研究员宋宇昊认为,看一项应用是否正规,可以从两个方面来看:
一是用户上传的照片是否会被存储、存储多久、照片和用户信息在传输和存储过程中,是否存在泄露风险;如果AI写真软件被外部黑客攻击或内部不法人员泄露,那么用户的照片与相关信息可能会流入黑产,用于诈骗或者其他犯罪行为。
二是上传的照片是否会被用于AI模型训练。如果用户的照片在用户不知情的情况下,被用于模型训练,那么可能会导致用户的面部特征出现在其他AI生成的图片中,这可能是用户不希望发生的。”
有了妙鸭相机的前车之鉴,45AI在小程序上线之初就发布公告称“非常重视用户隐私和数据安全”,上线第3天即推出删除用户档案(包括上传的照片和生成的数字分身)的功能,并自称是市面上唯一支持删除用户档案的AI工具。
免费 vs 付费,AI写真背后的成本账
目前,市面上涌现的AI写真产品存在差异化的定价标准。
画颜AI小程序可以免费生成AI写真,但生成效果欠佳且等待时间较为漫长,如果想提速(或者说插队),则需要支付9.9元。
有网友称,在未付费提速的情况下,两天出了10张图,而且只选出来1张,其余9张不是换脸痕迹明显,就是面部不平整、阴暗交接。
B612咔叽、美图秀秀及旗下的美颜相机也有类似的AI写真/头像功能。我们发现,美颜相机App多款AI写真的模版价格已从6月初上线时的9.9元下调至3.9元,而美图秀秀App生成一套AI头像的价格,则因生成张数不同而拥有6.6元、9.9元、12.9元3个档位。
B612咔叽的AI写真有“标准”和“特快”两种生成套餐可选,标准套餐24小时内出片,定价5.8元;特快套餐1小时内出片,定价9.8元。
至于AI写真为什么要收费、定价有何依据,B612咔叽给出的回答较为笼统:AI写真生成成本较高。
妙鸭相机和45AI则在回应“不退款”争议时作了进一步说明:AI写真是基于算力的服务,由于算力消耗不可逆,故服务开始后不接受退款请求。除非技术问题导致服务失败,才可申请退款。
算力成本究竟多少?某AIGC产品创始人告诉“头号AI玩家”:
一般来说,大家都会包年包月去购买GPU。拿比较便宜的云厂商腾讯云来举例,如果是包年包月,一台搭载NVIDIA V100 GPU的服务器打完折后是1698元/月;如果是按量计费,大约是6元/小时。
一台机器通常只能同时进行1-2个训练任务,训练时间大概在0.5-2个小时之间,时长取决于参数的设置,参数影响模型的质量。
按每台机器最快30分钟完成一个训练任务来算,1个小时内,1台机器只能服务4个人。如果瞬间有1w用户涌入,那么大约需要2500台机器才能同时服务这1w人。相应地,包月的成本大约是424.5万元,按量计费的成本大约是15000元/小时。另外,这中间的运维成本也是相当高的。
换言之,如果没有这么多算力资源,出于控制成本和稳定服务用户的考虑,通常会采取控制并发量(每小时服务人数)的方式,这就能解释为什么妙鸭和45AI小程序排队人数那么多,等待时间那么长了。
据36氪获悉,妙鸭相机是阿里大文娱参投的一家创业公司的项目,其算力由阿里云提供。上线之初,出于成本考虑,妙鸭并未布置太多算力。但目前,妙鸭已向阿里云申请了更多算力资源,使得排队时间降至3-4个小时。 45AI则在公告中透露,用户的写真数据由字节跳动火山云引擎保护。
拼模版、拼运营是制胜关键
相比于线下拍写真动辄几百上千的费用,9.9元的低廉价格和较高的出片质量,使得网友们表现出了较强的付费意愿。
但问题是,对于大部分人来说,拍写真归根结底是一项低频需求,再加上目前AI的生成效果存在不可控性,同质化、固定化的写真模版也难以满足多元的拍摄需求,所以用户在尝鲜过后,付费意愿可能会大大降低。
而且纯工具型产品“用完即走”的特性,决定了其很难寄希望于用户长时间停留消费广告,从而获得流量收入。
所以包括妙鸭相机在内的一众AI写真软件,都选择在前端设置付费门槛以覆盖成本。有很多人因此质疑妙鸭是“一波流产品”,但一位接近妙鸭团队的投资人曾向36氪透露,妙鸭想做的并非只是简单的小程序,而是长期的App。
AI绘画设计师鱼摆摆表示:“在快速积累起用户量后,妙鸭们实际上可以探索更多商业化可能,核心是让用户高频次使用或者长时间留存。”
开发新模版和新场景或许是提高用户使用频次的可行路子。越是贴近热点潮流的模版,越能引发网友争相体验,比如多巴胺、芭比、国风、韩系证件照等。从这个角度出发,完全可以说是芭比写真这一套模版带火的45AI小程序,妙鸭相机和画颜AI也已陆续上线了多个新的写真模版。
妙鸭相机“国风千年”系列模版
值得一提的是,类似芭比这种与IP相关的写真模版,或许也存在一定侵权风险。但换个角度想,AI写真产品大可与IP进行合作,推出联名付费模版。
在用户留存方面,一位独立开发者认为:“目前To C的产品留存确实是个问题,AI写真软件或许得建立内容社区,才能更持久地留住用户。”
美图秀秀于2018年就增加了“社区”界面,用户编辑好的照片能一键分享到“MT社区”,与他人进行交流互动。在今天的美图秀秀App首页,美图配方、挑战赛和画廊界面,聚集了大量创作者,用户可以收藏、下载套用创作者的修图模版。
内容可以吸引用户长时间停留,还能激发其主动创作;社交更是一种可以提升用户活跃度、并将其留在平台上的好办法。内容+社区则是将两者结合,使之相互促进,形成独特的社区文化,小红书、知乎、豆瓣、B站都是如此。
妙鸭相机也称,未来将邀请摄影师合作测试,让他们将自己的风格化摄影作品制成写真模版,供用户使用,颇有打造内容社区的意味。
但无论是持续开发新模版和新场景,还是打造内容社区,运营能力都是关键。
在技术门槛较低、成本相对固定的前提下,如果想要避免昙花一现的宿命,AI写真产品或许应该将重心放在持续迭代模版精度、创意,以及优化产品运营上。