麻豆肛交

黑皮猪 “吉卜力风”免费版来了!豆包这款AI生图神器,不比GPT弱?_图片_SeedEdit_宫崎骏

发布日期:2025-04-07 23:11    点击次数:121

黑皮猪 “吉卜力风”免费版来了!豆包这款AI生图神器,不比GPT弱?_图片_SeedEdit_宫崎骏

最近两周黑皮猪,“吉卜力画风”片刻就火了。

事情的启动是这么的,3月26日,OpenAI推出了基于GPT-4o多模态大模子的高精度图像生到手能“4o Image Generation”,按照他们的说法,当今用户只需一句简便的翰墨描摹,就能扫尾缜密的告白或平面图的制作、欺诈界面的UI筹画、LOGO或图片立场的切换等等。

终结呢?总计互联网的东说念主,都在用它变身“赛博宫崎骏”。

不开打趣,小雷是真被这玩意给刷屏了,这两天一打开群聊,就能看到天高皇帝远的群友们在拿GPT-4o猖獗整活,有作念头像的,有作念面貌包的,甚而还有把“黄O正途东”酿成吉卜力画风的,推特上的外洋网友玩得更是乐此不疲,看得我都有点心痒痒的。

(图源:X)

幸亏,访佛的功能,国内大模子并不是莫得。

比如说字节越过的SeedEdit,雷同可以扫尾“天然语意修图”,用户只需输入简便的天然说话,便可对图像进行各种化剪辑操作。

伸开剩余91%

最热切的是,这功能可不需要你想方设法翻出去用,在字节越过的豆包官网就径直能用,况且目下豆包的“图像生成”功能是十足免费且不存在限制的,这一波甚而能把开会员的钱也给径直省下来。

话不说多,咱们这边径直开整!

豆包这款家具,让东说念主东说念主都是宫崎骏

想体验这个功能的话,其实还蛮简便的即是了。

打开豆包网页版,在输入框底下就有「图片生成」,应该就能看到上传参考图的选项了,这里即是SeedEdit模子的进口。

要作念的事情很简便,上传图片,然后输入咱们想要改革的本体。

(图源:雷科技)

话未几说,先来看图。

最初,小雷这边采取了一张来自着名音乐摄像带里的截图,让豆包和最近巨火的GPT-4o都试着“帮我换成吉卜力立场”。

这是原图:

(图源:Youtube)

这是豆包的制品:

(图源:豆包)黑皮猪

这是GPT-4o的制品:

(图源:GPT)

对比下来,GPT-4o的穿着收复度更高,手部莫得变形,仅仅莫得保管原图比例;豆包天然合座构图、配色愈加迫临原图,但是穿着有些微变化,手部有些变形,甚而多了一只执着麦克风的手。

接着试一下宇宙都心计的名东说念主,比如说马斯克:

(图源:豆包)

比喻说乔布斯:

(图源:豆包)

再给乔布斯换个迪士尼立场:

(图源:豆包)

从终结来看,豆包的调遣成果可以说是相配练习。

终末,咱们试一试影视剧集里的名时局,此次就拿《和平使臣》内部约翰·塞纳演出的克里斯多福·史姑娘的名时局作念例子:

(原图,图源:HBO Max)

(图源:豆包)

(图源:GPT)

此次差距其实愈加彰着一些,GPT-4o甚而把金属头盔保留了下来,身边的两名变装也作念到了精确的画风转制,但是图片比例有所修改,翰墨信息也莫得保留住来。

纪湘视频在线观看

动作对比,豆包则是试图在整幅画面上进行对皆,然则东说念主数一多起来,变装的服装和表情就没若干能对上的。

但是,接着我就要说但是了,豆包的成果照旧比Gemini 2.0要强上一大截的,谷歌这玩意天然守旧天然语意修图,但是既不懂吉卜力立场是啥预料,也搞不明晰何如修改图片比例。

(图源:Gemini 2.0)

可恶的谷歌,不要给我看这一堆不知所谓的东西!

其实把想路反过来,把画改成真确立场,豆包搞得也可以,我上传了一张刻在不少东说念主基因里的Meme图片,让它以此为原型,生成一张真确像片。

(图源:豆包)

嗯...只可说像是挺像的,即是没了那种冲击感。

淌若再简便调治一下的话,就能作念出底下这种成果:

(图源:豆包)

虽说脸型有点分歧,笑得亦然有点凶狠,但是这种冲突次元壁的作念法,还真就只好AI大模子能够扫尾。

豆包图片解决才能在线,但仍有较大更正空间

不外,东说念主东说念主都在用吉卜力画风,也带来了新一轮的版权问题。

毕竟早在2016年,宫崎骏评价AI动画技巧时就直言:这是对人命自己的侮辱。

宫崎骏反对用技巧代替手工创作,他以为AI生成图像短缺对人命力的敬畏,而在2025年的今天,技巧力的进步,反而让宇宙对这件事情变得更明目张胆了起来,确乎是有点讥诮的。

(图源:Youtube)

既然如斯,咱们不妨调遣一下想路,把它当成PS来用?

比如在筹画行业里滚滚而至的梗,“让大象转个身”这种要求,咱们在豆包上能不可扫尾呢?

谜底是“十足可以,削弱可以”。

可以看到,SeedEdit生成的大象后头是相配允洽逻辑的,耳朵的款式、脚部的位置、体魄的脸色都作念得至极可以,周围的环境也保持了高度的一致,很出丑出画面上有什么舛误。

不外访佛海报的成果,豆包就作念得不咋样了,和GPT-4o可以说一眼就能看出分离了。

(图源:豆包)

(图源:GPT)

只可说,豆包在审好意思这块,还真有挺多要学的地方。

终末,我也试了一下豆包杜撰进行“图片生成”的成果。

辅导词如下:

一位年青的印度女性,黑发扎着打开的马尾辫,身穿玄色夹克,站在大学校园里,直视着镜头。该图像具有1990年代立场的电影静态好意思学,在阳光明媚的日子里拍下的特写肖像。

一位年青的印度女性,黑发扎着打开的马尾辫,身穿玄色夹克,站在大学校园里,直视着镜头。该图像具有1990年代立场的电影静态好意思学,在阳光明媚的日子里拍下的特写肖像。

(图源:雷科技)

对比豆包,GPT-4o产出的图更有特写感;Midjourney V7产出的图片明朗愈加天然,东说念主物脸部的肤色也相对愈加清亮,细节愈加丰富,画面焦点愈加清亮,但总的来说,三者都没啥肉眼可见的问题。

AI修图,爆发在即

不可否定,如今AI大模子在“绘画”上足以自力荣达了。

但是在图像剪辑限制,AI大模子依然是相对逾期的,无法进行精确剪辑一直是行业的老浩劫问题。

前些年,这类需求一般可以通过Stable Diffusion的ControlNet插件来扫尾。

它可以得到很是的输入图像,通过不同的预解决器调遣为适度图,进而动作Stable Diffusion扩散的很是条目,只需使用文本辅导词,就可以在保持图像主体特征的前提下自便修改图像细节。

(图源:新浪微博,识别特征并进行再行画图)

然则土产货部署AI欺诈这事,和大部分小白是基本无缘的。

是以在干预本年后,包括GPT-4o、Gemini 2、Midjourney V7等先后上线了通过天然语意修图的功能。

个东说念主以为,这种只需给定输入图像和告诉模子要作念什么的文本描摹,然后模子就能顺从描摹指示来剪辑图像的功能,甚而可以被视为紧要突破,也曾被视为必备妙技的PS,如今似乎堕入了“可学可不学”的机密处境。

天然了,目下这类模子在生成图良晌照旧有一些问题存在的。

直到今天,豆包AI修图依然短缺东说念主像前后的一致性,也短缺图片本体的场地性,只消波及到东说念主物面部的修图,那么最终出来的图像和原图的各别会很夸张,豆包自己也很难判断你要修改的是图片里的哪个元素。

(图源:豆包)

倒是翰墨解决才能,相较以往有了一定提高,当今SeedEdit在修图时照旧不会松懈编造翰墨本体,但是图片生成时的错字气象依然需要改善。

不管何如说,豆包SeedEdit算是弥补了国产大模子在语义AI修图欺诈这块的空缺。

可以想到的是,跟着AI图像剪辑技巧的不断发展,将来手机、电脑都可能会集成这项功能,就像AI放置、AI扩图那样走进寻常匹夫家。非论是小白照旧大咖,每个东说念主都有契机削弱上手使用,让我方对好意思的涌现可以更直不雅地展现出来。

修图有手就行?好像确凿不是梦黑皮猪。

发布于:重庆市