您现在的位置是:天际琨瑜网 > 娱乐

电商模特1元购,人图布景随意换!国产AI工具降本99%

天际琨瑜网2024-10-30 21:36:42【娱乐】0人已围观

简介原问题:电商模特1元购,人图布景随意换!国产AI工具降本99%东风 明敏 发自 凹非寺 量子位 | 公共号 QbitAI AI工具秒做电商图,一张惟独一块钱,老本直降99%!随意上传一张照片,服饰巩固

原问题 :电商模特1元购 ,电商人图布景随意换!模特国产AI工具降本99%

东风 明敏 发自 凹非寺

量子位 | 公共号 QbitAI

AI工具秒做电商图 ,元购一张惟独一块钱  ,人图老本直降99%!布景本

随意上传一张照片 ,随意服饰巩固 ,换国改头换脸:

走南闯北即可配入种种布景  ,具降光影也能做作泛起 :

小哥哥也有哦 ,电商还能自动补全扩展,模特恣意修正图片巨细 :

哪怕不真人图,元购惟独人台照,人图也可揭示上身下场:

致使可能跨次元,布景本把2次元纸片人的随意服饰酿成3D着实气焰 。

这下场,换国乍一看很难分说出是AI天生的啊 。

如斯一来,商家岂不是无需妨碍大批线下拍摄,省去换景离奇使外出拍图的步骤 ,在电脑前即可做出丰硕商品图?

啥情景,电商模特这碗饭也要端不住了 ?

1分钟做一张AI模特图

如上提到的AI工具 ,名叫小K电商图 。

如今能提供4种电商图生乐成用:

  • 给人台图填补真人模特
  • 给真人模特换脸
  • 准假发图填补真人模特
  • 给商品图天生新布景

种种下场惟独3步即可搞定 ,界面颇为深入易懂 ,操作流程约莫在1分钟摆布 。

好比选一张迪丽热巴的照片,想替换人脸以及神色,而且把布景交流成T台,同时调解图片尺寸 。

需要先上传图像,零星会自动对于图像妨碍分割  ,选中想要保存的地域   。

(假如服饰被头发遮住可能同时保存头发))

而后再设定想修正的元素,搜罗模特人脸气焰 、面部神色 、布景等。

同时可能勾选一些特殊处置 ,填补服饰。

在这里,咱们设定将原图人像换成一位欧美模特 、露齿笑 、布景为T台,并扩展了原图尺寸。

可能看到生乐成果中,很好保存了服饰以及发型,可是其余元素都妨碍了响应调解。

而且对于发丝、光影都重新做了处置 。布景也是AI重新残缺天生的,差距于传统PS抠图 。

一次天生会给出4张图,利便筛选。

天生图片布景的细节也可能处置患上很好,好比雪景布景下,人物鞋子上都市被加之雪花。

在小K电商图里,提供的AI模特规范比力多 ,差距地域 、差距年纪都有拆穿困绕。

假如对于现有模特不知足,还可逍遥定制专属模特,定制化方式有两种:

  • 用户不模特 ,再提供多少个非专用有确定稀缺度的AI的模特;
  • 用户本就有模特,凭证模特自己的样貌定制。

除了AI模特 、真人,二次元人物也可定制 。

可交流的AI布景也很丰硕。

据介绍 ,自界说布景功能、物品图天生也即将推出 。

以是 ,小K电商图是若何实现这些下场的呢?

散漫自研姿态算法

小K电商图的底层技术可能重大散漫为两部份:天生+操作。

天在行腕来自开源的Stable Diffusion  。

操作方面则引入了小K自研的一系列算法,其中以姿态算法最为突出。

要知道,AI画画很长一段光阴都无奈画大盗手 ,在可控性上展现也比力差 ,这是由于散漫模子自己的特色使然。

后续随着ControlNet泛起 ,经由给预磨炼散漫模子削减一个格外的输入,可能操作Stable Diffusion天生的细节。

这里可能是种种规范的输入  ,搜罗草图 、边缘图像、语义分割图像 、人体关键点特色、霍夫变更检测直线、深度图、人体骨骼等。

由此,Stable Diffusion加之人体姿态估量算法(Openpose)可能很好操作人物措施天生。

小K电商图的技术逻辑也是如斯,不外他们接管了功能愈加晃动的自研算法 。

基于这套算法 ,小K的另一款视频动捕产物——小K直播姬已经实现为了经由艰深RGB摄像头  、无需任何传感器 ,即可实现3D动捕 。

而且在手指细节的处置上展现很好 。

因此,对于不四肢的人台图 ,小K电商图可能做到直接识别。自动填补头部 、画手能耐提升也患上益于该算法。

在处置了姿态可控后,还需要处置面部可控。在这方面小K电商图引入了LoRA。

LoRA原本是微软钻研团队早在2021年提出的一项狂语言模子微调的技术 ,可能大猛后退微调磨炼速率。

去年底,韩国迷信技术院KAIST一位钻研员@cloneofsimo与HuggingFace相助 ,将此措施扩展到Stable Diffusion上 。

不光实现为了单块11GB显存的RTX2080Ti实现模子残缺微调,同时原始模子权重解冻 ,新磨炼进去的权重可能保存为3MB巨细的单个文件宣告。

这项技术被AI绘画喜爱者用来让模子牢靠天生一个物体 ,最盛行的便是牢靠一总体物抽象。

在CivitAI社区里,每一个微调好的权重就叫做一个Lora ,就至关于一总体物模版 ,所有人都可能利便下载运用  。

最后在布景方面,为了知足电商场景下的需要,小K也做了更强的操作 。

好比一些情景下  ,用户着实只想交流模特人脸 ,其余都不做修正。

那末在这种情景下,AI仍是会重新绘制一张新图,不外会保存95%的相似度。

假如用户想交流布景,算纪律会在光影等细节上做更多填补 ,力争图像做作、传神 。

以是,是谁带来了小K电商图 ?

从游戏到AI再到AIGC

小K电商图的打造者名叫云舶科技,主打AIGC伪造内容创作破费 。

团队建树于2017年,由降生游戏行业的梅嵩以及陈敏散漫建树 。

其中,梅嵩是原蓝港互动SVP ,《王者之剑》系列手游制作人 ,有逾越10年游戏制作履历;陈敏是原蓝港互动CTO ,中间团队有着近20年的研发履历。

凭仗对于游戏动画市场的清晰,他们从守业早期就抉择专一于AI视频动捕技术。

经由4年研发  ,基于云舶自研算法的3D伪造直播产物小K直播姬在2021年推出,收费提供给广漠VTuber运用 。

如今,小K直播姬效率主播用户超40万 ,而且是B站 、酷狗音乐等平台的民间伪造直播工具 。

建树6年以来 ,云舶科技都以及AI 、伪造内容、游戏动画等规模坚持高度分割关连  。

去年AI画画大火后,云舶也快捷跟进。散漫自己专长以及市场调研,最后判断同时增长两条道路:其一是AI游戏图规模,另一个便是AI电商图。

两条道路的底层逻辑相同  :降本增效  。

独创人兼CEO梅嵩介绍,电商行业的传统出图方式是线下实景拍摄 ,需要向模特、摄影、园地等付费,平均价钱约为一张图100元 。但假如用AI天生 ,这个数字能降到1块钱 。

为甚么先增长AI电商图这条线 ?

梅嵩给出了两个分说:

一方面,从市场角度来看 ,电商行业每一年可能会有多少亿个新货物,每一个货物都要有自己的产物图。这象征着电商市场每一年会需要多少百亿张产物图 ,市场需要重大;

另一方面 ,从技术角度来看 ,电商行业对于AI制图的需要更夸张可控,对于缔造性要求不高  ,这使患上技术开拓愈加可控。

以是 ,小K电商图更早面世。

梅嵩也坦言 ,最开始开拓时 ,模子天生的下场并不事实,研发团队不断在一再做调试。在往年年初时 ,他们也在思考,是否引入姿态算法能让下场更可控 ?

服从偏偏ControlNet进去了,帮咱们验证了想法 ,也省去了一些试错关键 。

当初小K电商图已经正式宣告,并已经有多少十家电商行业用户妨碍内测 ,1.2版本也即将上线  。

梅嵩泄露,之以是会抉择这时宣告产物,一方面是想要抢占市场先机 ,当初业内相似产物还相对于少见;另一方面也是团队对于自己的迭代速率有定夺。

以前咱们宣告小K直播姬便是凭证这样的逻辑,前面实现为了简直周更产物迭代 ,全部产物的功能也越来越丰硕  。

如今 ,研发团队也在减速增长2.0版本 ,新一代产物愿望能实现对于AI模特姿态锐敏调解,并将平铺服饰直接转换成上身下场。

与此同时,云舶科技也在张罗最新一轮融资。

作为一家独创公司,云舶的融资步骤着实有点特意——首轮天使轮融资是在公司建树三年后才实现的。

原因在于云舶抉择在建树后 ,主要搞定根基研发。

梅嵩颇为坦诚地展现  ,独创团队降生游戏行业 ,最开始对于AI的清晰并未多少,以是他们用更多急躁、光阴以及肉体来去世磕研发,终于在2020年拿出了知足的demo。

跑通底层技术后 ,从2020到2021 ,云舶的脚步清晰减速 ,先后实现A轮、A+轮融资,金额都为数百万美元 。2021年年尾 ,让云舶开始展露头角的小K直播姬也顺遂上线。

在这事上,梅嵩自己也调侃 :

哪有守业公司做一个产物要做4年的 ?

给咱们投天使轮的BVbaidu风投当时还说:此外不谈  ,你们的坚持还黑白常值患上鼓舞的。

如今随着AIGC浪潮到来 ,AI在辅助创作 、后退使命功能等方面都进一步掀开空间 ,运用层的爆发已经初见脉络。

量子位智库预料 ,到2030年我国AIGC市场规模将抵达万亿级别。

2025年估量会成为财富第一次规模爆发点 ,年复合削减率有质变性提升。在这之后2年,财富将迎来运用爆发期,大批运用层玩家涌入。

以是回到当下来看,不光是大模子公司值患上关注,既懂技术又懂运用内容的行业玩家,也会成为AIGC运用指数级爆发的主力军,迎来属于自己的新一轮增临时 。

「AIGC+垂直规模社群」

招募中 !

招待关注AIGC的过错们退出AIGC+垂直规模社群,一起砚习 、探究 、立异AIGC!

请备注您想退出的垂直规模「教育」或者「广告营销」 ,退出AIGC强人社群请备注「强人」&「姓名-公司-地位」 。

点这里👇关注我,记患上标星哦~

一键三连「分享」 、「点赞」以及「在看」

科技前沿妨碍日日相见 ~ 返回搜狐,魔难更多

责任编纂 :

很赞哦!(97374)