虚拟试穿:谷歌推出TryOnDiffusion,逼真呈现服装效果
近日,Google Research与华盛顿大学合作推出了一款名为TryOnDiffusion的大模型产品,该技术实现了虚拟试穿服装的功能。这项技术或许会让人感到疑惑,因为早在十几年前就有人宣称能够实现类似功能。然而,真正能达到"智能化"水平的技术远未达到,这里面最难的是如何合成逼真的服装细节并可视化,同时还要适配身体姿势的变化。而今,在人工智能与计算机图形学不断发展的今天,谷歌终于取得了突破,并将其应用于Google的购物平台上。
TryOnDiffusion技术如何实现?
TryOnDiffusion采用了一种新的基于扩散的AI模型方法。这个模型不使用文本作为输入,而是接受一对图像作为输入:一张包含衣服的图像和一张人像图像。
首先,每个图像都被送入自己的神经网络(U-net),然后在称为"交叉注意力"的过程中,这两个神经网络共享信息,以生成穿着该衣服的人的逼真图像。通过这种方式,TryOnDiffusion技术能够实现服装细节的合成和可视化,并且适应人物姿势的变化。这是之前方法所难以做到的,以往的方法要么只关注服装的细节呈现,无法适应人物姿势的变化,要么在人物姿势变化后,服装的细节会丢失。
TryOnDiffusion技术的优势与局限
通过TryOnDiffusion技术,用户只需提供一张自己的照片,即可展示穿上不同体型和尺寸的服装的效果图。这使用户能够更直观地了解服装的悬垂、褶皱、贴合度和伸展度等细节。
谷歌声称,TryOnDiffusion在定性和定量方面都达到了最先进的性能,并预测随着时间的推移,该工具将变得更加精确。然而,目前该技术还存在一些局限,包括:
- 目前仅支持上半身服装的试穿功能,全身试穿功能将在下一步的研发中实现。
- 偶尔可能会出现一些伪影等瑕疵,尽管出现的概率较低。
- 目前无法在复杂的背景中实现试穿效果。
虚拟试穿技术的潜在应用
对于国内传统电商而言,虚拟试穿技术提供了更大的机会。在服装时尚类销售中,传统电商在服装购物体验上已经遇到了瓶颈。许多消费者抱怨他们购买的服装与网上展示的照片不符。通过虚拟试穿技术,用户可以更真实地了解服装的效果,从而提高购物体验,并降低因尺码不合适而产生的退货率,从而提高效率并降低成本。
虚拟试穿技术还可能成为传统电商对抗现今盛行的直播电商的一种策略,并具备优势。通过直播电商,消费者可以在线上观看主播穿着展示产品,但直播中无法实现个性化试穿效果。虚拟试穿技术则可以满足用户个性化试穿的需求,从而增强传统电商的竞争力。
总的来说,虚拟试穿技术为电商行业带来了新的机遇,也有望提升用户购物体验。随着技术的不断发展,相信TryOnDiffusion这样的虚拟试穿技术将日益完善,并在电商领域发挥更重要的作用。
官方地址
https://tryondiffusion.github.io/