财讯中国

英伟达脑洞突破天际实现“言出法随”:一句话实时P图自动填补涂鸦

来源:快科技 2021-11-24 11:10:48

在“一句话生成照片”这件事上,英伟达又一次突破了大伙的想象力。

他们最新的AI模型GauGAN2,不仅能根据字词生成逼真风景照,还能实时用文字P图!

输入一句“海浪击打岸边石”,立刻输出一张逼真照片:

英伟达又一次突破想象力:一句话实时P图 在线试玩

从单词到短语,这只AI全都能get!

英伟达又一次突破想象力:一句话实时P图 在线试玩

那感觉,简直是要山得山,要水得水:

英伟达又一次突破想象力:一句话实时P图 在线试玩

要是觉得哪部分你不喜欢,直接打字就能“P图”:

英伟达又一次突破想象力:一句话实时P图 在线试玩

上面这些效果,都是英伟达这个叫做“GauGAN2”的模型做出来的,而它的“完整版”功能,还远不止这些。

从草图到文字,都能生成风景照

GauGAN2的绘制模式,一共分为三种。

第一种,打字生成图片。

我们先试了一下单个词组,“阳光(sunshine)”,生成如下图片:

英伟达又一次突破想象力:一句话实时P图 在线试玩

加上限定词in the forest后,AI立刻就将场景换到了树林里,变成光洒在树林中的场景:

英伟达又一次突破想象力:一句话实时P图 在线试玩

再多来点限定词也没问题。

像“冬日树林中的阳光”,输入in winter后,眼前本来郁郁葱葱的树林立刻“全秃了”,换成了雪景下的一幕:

英伟达又一次突破想象力:一句话实时P图 在线试玩

这效果,u1s1(有一说一)确实不错。

还能输出不同style的风景图,例如输入“大山(mountain)”一词,立刻要山有山,还能给你换不同风格:

英伟达又一次突破想象力:一句话实时P图 在线试玩

当然,这些不同的风景照也都能继续生成新细节,在mountain后加上“beside a river”就能生成山水:

英伟达又一次突破想象力:一句话实时P图 在线试玩

第二种,“打字P图”,直接用文字编辑部分图像。

只需要把想替换掉的部分圈出来,输入你想要的东西,就能立刻造出各种新颖的风景图:

英伟达又一次突破想象力:一句话实时P图 在线试玩

嗯……英伟达给出的这个demo,思路也是非常清奇了,“浮在空中的城堡”:

英伟达又一次突破想象力:一句话实时P图 在线试玩

第三种,用涂鸦生成风景照。

这是上一代GauGAN2(2019年英伟达推出的GauGAN)的看家本领。

例如,要是想实现下面这样的“一片天空两个太阳”,就完全可以在通过文本生成的图像上,自己手动再加一个。

英伟达又一次突破想象力:一句话实时P图 在线试玩

这几种玩法叠加在一起,简直让网友们脑洞大开。

像外媒ZDNet就恶搞出来了一种神奇的玩法,在已有的风景上画个人头:

英伟达又一次突破想象力:一句话实时P图 在线试玩

然后让GauGAN2根据已有的画面,再重新生成图画,就会得到如下“人头海岛”的神奇景观:

英伟达又一次突破想象力:一句话实时P图 在线试玩

不过这可能也对个人画技有所要求,在我们的灵魂画风下,效果看上去就有些……不太聪明的亚子。

英伟达又一次突破想象力:一句话实时P图 在线试玩

那么,生成这一系列风景照的GauGAN2,背后究竟用了什么原理?

它与OpenAI今年发布的DALL·E和CLIP,又究竟有什么区别?

与DALL·E有什么不同?

2019年,英伟达GauGAN2的“前身”GauGAN正式开源。

当时的它,还只拥有其中一个能力,就是将涂鸦直接变成风景画,就像「神笔马良」一样,还推出了对应的软件Canvas:

英伟达又一次突破想象力:一句话实时P图 在线试玩

当然,这时GauGAN已经能随意改变画面风格了,从白天黑夜到春夏秋冬的气质都能稳稳“拿捏”:

英伟达又一次突破想象力:一句话实时P图 在线试玩

据英伟达介绍,GauGAN采用了一种基于空间适应标准化(SPADE)算法。

SPADE算法不仅使用随机的输入图像,还采用了一种被称作“分割图”的图像。在分割图中,每一个像素都会被归类,来生成更接近于真实的图像,这种模式被称作“图对图翻译”。

英伟达又一次突破想象力:一句话实时P图 在线试玩

△GauGAN的技能点(狗头)

现在,英伟达将GauGAN升级成了GauGAN2,后者一共采用了1000万张高质量的图片、在英伟达Selene超算上进行训练,这台超算在Green500排行榜上排到世界第二。

生成这些风景画的效果和“手法”,是不是感觉有点熟悉?

没错,大多数人看到GauGAN2的第一眼,可能都会觉得它和OpenAI的DALL·E+CLIP有点像。

今年年初,OpenAI用DALL·E和CLIP两个模型,做了个“图像版”GPT-3,同样能用一句话生成图片。

英伟达又一次突破想象力:一句话实时P图 在线试玩

不过,这两个模型生成的内容其实不太一样。

GauGAN2专注于生成风景照,DALL·E+CLIP则更多地生成具体的物体,例如一把椅子或者一个闹钟等。

英伟达又一次突破想象力:一句话实时P图 在线试玩

这与它们的原理差异也有关系,GauGAN2更加注重“单词与视觉效果”之间的关系,例如“冬天”这种模糊的状态词给照片带来的效果;DALL·E+CLIP则更注重“文字-图像”这种有明确对应关系的物体效果。

据英伟达介绍,GauGAN2不同于“文本-图像”和“分割图像-图像”一类的模型,它所能产生的照片种类更多,质量也会更高。

不过,偶尔也会出现点bug…

比如给出“沙滩(beach)”一词后,有些生成的画面中出现了语言无法描述的事物。

英伟达又一次突破想象力:一句话实时P图 在线试玩

对此,英伟达表示,他们在训练中“完全没有用到任何人像照片”。(所以可能是偶然?)

但这样一来,网友想要的“瑞克摇(Rick roll)”和“鬼畜视频生成”,GauGAN2大概也是没办法实现了。

英伟达又一次突破想象力:一句话实时P图 在线试玩

但是能生成仿佛梦境中才能见到的画面,也吸引了不少人来试玩。

这不,有人就晒出了自己生成的抽象画大作,并表示自己非常喜欢这个模型:

英伟达又一次突破想象力:一句话实时P图 在线试玩

还有人表示,GauGAN2给出了一些建筑设计的新idea啊。

英伟达又一次突破想象力:一句话实时P图 在线试玩

也有网友觉得这种能够自动生成景观的功能,未来Adobe可能也会用上。

或许就是下一个画手利器?

英伟达又一次突破想象力:一句话实时P图 在线试玩

最后,GauGAN2在浏览器上就能试玩,欢迎大家留言讨论自己的体验感受~

标签: 英伟达 想象力 实时P图 在线试玩 逼真风景照

相关新闻

19岁少年远程入侵25辆特斯拉汽车 称利用软件漏洞
2022-01-12 21:19:34
赴港上市前夜 美菜网被爆总部搬迁、裁员40%
2022-01-12 21:19:27
索尼推出《蜘蛛侠:英雄无归》联名款全新WALKMAN
2022-01-12 21:19:17
魅族冬季新品发布会:lipro、PANDAER、mblu 齐登场
2022-01-12 21:19:00
美国新冠住院人数突破去年峰值 福奇:奥密克戎会传到每一个美国人
2022-01-12 21:18:50
“最冷春节”即将上线 新能源车主开不回老家?
2022-01-12 21:18:42
GeForce RTX 3080 12GB上线电商平台 售价约为1万元
2022-01-12 21:18:34
韩国批准诺瓦瓦克斯新冠疫苗 辉瑞新冠口服药明日送达
2022-01-12 21:18:27
空客2021年共交付611架民用飞机
2022-01-12 21:18:19
Windows Subsystem for Android更新 开始支持GPU切换
2022-01-12 21:18:11
“假笑男孩”祝福视频450元一条:每月在中国都接到订单 量不是特别大
2022-01-12 21:18:02
微商噩梦:微信朋友圈折叠图片新功能悄然上线
2022-01-12 21:17:46
Moto G Stylus 2022最新渲染图揭示其完整外貌:三颗摄像头+打孔屏
2022-01-12 21:17:40
UNITEX推出支持USB连接的LTO-9磁带驱动器
2022-01-12 21:17:31
支持LTE Advanced的Surface Pro 8现在可以从微软官网订购
2022-01-12 18:13:39
Check Point安全报告显示去年企业受到的总体网络攻击量有明显增加
2022-01-12 18:13:33
LG新能源称凭借积压订单将很快击败宁德时代
2022-01-12 18:13:24
Intel NUC迷你机产品线调整 12代酷睿平民版被砍
2022-01-12 18:13:18
美国因感染新冠病毒住院治疗人数达到历史最高水平
2022-01-12 18:13:13
NVIDIA宣布DLDSR AI超分辨率技术:驱动集成、无需游戏优化
2022-01-12 18:13:08
5部手机同时抽中2300元“优惠券” 扫地机器人大奖背后是何套路?
2022-01-12 18:13:02
波音2021年飞机交付量大增 但仍落后于对手空客
2022-01-12 18:12:55
辉瑞疫苗合作商BioNTech:今年新冠疫苗的收入可能会减少
2022-01-12 18:12:50
加拿大研究显示因感染新冠病毒住院的儿童出现严重并发症的风险较高
2022-01-12 18:12:43
加拿大魁北克省将对拒绝接种新冠疫苗者处以高额罚款
2022-01-12 18:12:36
从27个行业标杆,看2022营销与经营风向标|巨量引擎引擎奖榜单公布 (FOR seo)
从27个行业标杆,看2022营销与经营风向标|巨量引擎引擎奖榜单公布 (FOR seo)
2022-01-12 16:50:28
入场2022,从看懂这16个案例开始|巨量引擎引擎奖榜单公布
入场2022,从看懂这16个案例开始|巨量引擎引擎奖榜单公布
2022-01-12 14:16:53
iPhone14或采用药丸形打孔屏 最全外形渲染图都在这里了
2022-01-12 13:58:39
LG发布4K 160Hz游戏显示器32GQ950
2022-01-12 13:58:33
iPhone 13 Pro DxO续航测试59小时
2022-01-12 13:58:22
联想拯救者Y90已入网:68W祖传快充
2022-01-12 13:58:16
腾讯全新游戏品牌“腾讯先锋”公布:不用下载
2022-01-12 13:58:08
苹果抛光布重新上架 145元当天发货
2022-01-12 13:46:53
10秒销售额破亿!iQOO 9今日开售战报发布
2022-01-12 13:46:48
文战元宇宙
2022-01-12 13:46:44
下月见!Redmi K50电竞版跑分曝光
2022-01-12 13:46:39
小米有责任,捐赠1000万成立体育奖学金
2022-01-12 13:46:34
配备单色OLED屏 山灵正式发布UA系列便携解码耳放UA5
2022-01-12 13:46:29
荣耀50系列荣获“2021年度经典焕新品牌”
2022-01-12 13:46:23
机构发布报告称智能手表的销量将继续强劲增长
2022-01-12 13:46:17
可选RTX 3070 Ti 150W满功耗释放 联想拯救者 Y9000P 2022将发布
2022-01-12 13:46:12
曝真我GT2 Pro春节前上市 20日举行预沟通会
2022-01-12 13:34:39
2022环境检测机构使命再升级
2022环境检测机构使命再升级
2022-01-12 09:59:21
苹果搜歌神器Shazam推出可识别播放歌曲的Chrome浏览器扩展
苹果搜歌神器Shazam推出可识别播放歌曲的Chrome浏览器扩展
2022-01-12 08:30:09
微软突然公开macOS漏洞细节!苹果发文感谢并称已确认修复
微软突然公开macOS漏洞细节!苹果发文感谢并称已确认修复
2022-01-12 08:28:09
ColorOS 12.1南德TUV A级认证出炉:可坚持36个月流畅不卡顿
ColorOS 12.1南德TUV A级认证出炉:可坚持36个月流畅不卡顿
2022-01-12 08:26:11
企业微信4.0正式发布:强化品牌直播带货并全面接入腾讯文档
企业微信4.0正式发布:强化品牌直播带货并全面接入腾讯文档
2022-01-12 08:24:25
微软为Win11版Defender设计全新界面:调整UI并重构底层界面
微软为Win11版Defender设计全新界面:调整UI并重构底层界面
2022-01-12 08:22:56
曝iPhone 14三种屏幕对比图出炉:药丸打孔屏大幅增加屏占比
曝iPhone 14三种屏幕对比图出炉:药丸打孔屏大幅增加屏占比
2022-01-12 08:21:28
iPhone14或采用药丸形打孔屏:屏占比大幅提升,最高容量2TB
iPhone14或采用药丸形打孔屏:屏占比大幅提升,最高容量2TB
2022-01-12 08:19:22
曝三星Galaxy S22系列处理器标配高通骁龙8!频率可达1300MHZ
曝三星Galaxy S22系列处理器标配高通骁龙8!频率可达1300MHZ
2022-01-12 08:15:03
NVIDIA宣布DLDSR AI超分辨率技术:可提升任意游戏性能70%
NVIDIA宣布DLDSR AI超分辨率技术:可提升任意游戏性能70%
2022-01-12 08:13:37
PCIe 6.0正式发布:允许数据双向流动,x16带宽增至256GB/s
PCIe 6.0正式发布:允许数据双向流动,x16带宽增至256GB/s
2022-01-12 08:12:23
苹果:App开发者已经挣了2600亿
2022-01-12 06:16:47
米哈游侧目!腾讯人气手游一年吸金178亿:你贡献多少
2022-01-12 06:16:42
别老拿爱优腾跟Netflix比 根本不是一码事
2022-01-12 06:16:36
Windows 11效率将更高 提高文件管理器性能
2022-01-12 06:16:28
你用多沉的哑铃?这个智能产品对着说就行
2022-01-12 06:16:21
Intel人事调整:CFO退休 新女将接任PC业务主管
2022-01-12 06:16:06
最佳开发商 Xbox可以FaceTime 通话
2022-01-12 06:15:59
全球销量破亿!任天堂Switch OLED国行版开卖 只要2599元
2022-01-12 06:15:55
曝真我GT2 Pro春节前上市 20日举行预沟通会
2022-01-12 06:05:06
从核酸检测到健康码,为什么系统总是“崩了”?
2022-01-12 00:09:00
美联社宣布进军NFT 主打新闻摄影市场
2022-01-12 00:08:55
种植牙将纳入两级医保集采 降价幅度有望达到60%-90%
2022-01-12 00:08:46
1月28日至3月13日,北京禁飞“低慢小”航空器
2022-01-12 00:08:39
邢台18岁女孩百草枯中毒 肺移植后已经可以下床活动
2022-01-12 00:08:33
全球上层海洋温度连续第六年打破纪录
2022-01-12 00:08:28
女外卖骑手的飞驰人生:成为零差评收割机 在男人堆里杀出一条活路
2022-01-12 00:08:17
iPhone 14 Pro与iPhone 13 Pro同框照曝光:新老外形对比强烈
2022-01-12 00:08:10
Rivian在2021年生产了超1000辆电动汽车 符合下调预期
2022-01-11 23:39:04
达拉斯希望成为福特下一个自动驾驶汽车工厂的所在地
2022-01-11 23:38:58
12月新能源车企销量:比亚迪9.3万辆中国第一 特斯拉破7万
2022-01-11 23:38:47
富士康印度iPhone代工厂将于本周三小规模复工
2022-01-11 23:38:39
iPhone 14 Pro与iPhone 13 Pro同框照曝光
2022-01-11 23:38:33
12 代酷睿处理器的游戏 DRM 加密兼容问题已解决
2022-01-11 23:38:26
微软发现苹果macOS“Powerdir”漏洞 苹果已修复
2022-01-11 23:38:20
谷歌高管澄清 没要求苹果在安卓上提供iMessage
2022-01-11 23:38:14
微软公开macOS漏洞“Powerdir”细节 苹果已更新修复
2022-01-11 23:38:07
消息称苹果有望在 2024 年发布采用三星屏幕的 OLED iPad
2022-01-11 23:38:01
Omdia服务提供商聚焦:BT通过Eagle-i呈现全球安全服务野心
2022-01-11 23:37:53
2023年北京市工业互联网核心产业规模将达1500亿元
2022-01-11 23:37:48
中兴通讯携手联通完成算力网络服务调度PoC验证
2022-01-11 23:32:53
腾讯Switch发布微信红包:任你花!
2022-01-11 23:32:38
已经定版 小米12 Ultra将在春节之后发布
2022-01-11 23:32:20
RGB大Logo绝了!联想拯救者Y90游戏手机入网:搭载68W超级快充
2022-01-11 23:31:52
性能全方位提升 映众RTX3080冰龙海量版首发
2022-01-11 23:31:43
技嘉发布升级版GeForce RTX 3080 12G显卡
2022-01-11 23:31:36
曝真我GT2 Pro春节前上市 20日举行预沟通会
2022-01-11 23:20:59
微软突然公开macOS漏洞细节:苹果已更新修复
2022-01-11 17:23:24
360回应弹窗广告太多:持续优化用户体验 禁止投放诈骗
2022-01-11 17:23:17
荣耀Magic V折叠屏来自京东方:屏占比95%
2022-01-11 17:23:10
一加真首发LTPO 2.0!跟友商的LTPO 2.0不一样
2022-01-11 17:23:05
惠普发布OMEN系列新款显示器 4K、144Hz旗舰规格
2022-01-11 17:22:58
LG化学拟投资4.19亿美元在韩国新建阴极材料工厂
2022-01-11 17:22:48
刘海变胶囊 iPhone 14最新外形概念图感受下
2022-01-11 17:22:43
支持五大卫星定位 续航14天! 荣耀手表GS 3发布
2022-01-11 17:22:36
荣耀Magic V折叠手机为大屏优化:微信边聊边看
2022-01-11 17:22:22
Intel解决12代酷睿兼容问题 加密游戏不再闪退
2022-01-11 17:22:18
iQOO 9等机型通过电竞移动终端硬件技术要求标准
2022-01-11 17:21:51

热门文章

热点专题