字节跳动技术团队在其官方公众号发表文章,介绍了字节跳动的一项新技术。

该模型中的生成式对抗网络(GAN),可以用于图片风格迁移、图像编辑、图片生成等场景,为画面以及视频改变风格。

举例来看,该技术可以将一匹棕色的马变成斑马,或者将莫奈的风景画变成真实的照片。依据一个 鞋子的轮廓,可以自动生成真实的鞋子图形。

字节跳动表示,图片风格迁移、图像编辑、图片生成等场景。2020 年,麻省理工学院、Adobe 和上海交通大学技术人员提出一种 GAN 压缩算法,将算力消耗成功减少到 1/21。

字节跳动技术团队推出了一项自研 GAN 压缩算法,名为“在线多粒度蒸馏技术”,简称 OMGD。

这项算法能够极大降低 CycleGAN 和 Pix2Pix 模型的算力消耗,分别降至原来的 1/40 和 1/46。不仅参数和计算量更少,图像生成效果也更好。

结果显示,OMGD 消耗的计算量仅为 1.219G,相比于原始状态的 56.8G,计算量大幅减少,生成效果也更优。