Meta 推出了一款名为 Emu Edit 的创新图像编辑工具包:它利用识别和生成任务,实现了精确的图像编辑。
Emu Edit 打开了基于指令的图像编辑的新篇章。这种技术让用户可以通过自然语言指令来进行任意图像编辑,极大地扩展了应用范围。然而,目前市面上的同类产品在准确理解和执行用户指令方面仍面临挑战。Emu Edit 的出现改变了这一现状,它是一个多任务图像编辑模型,为基于指令的图像编辑设立了新的标准。Emu Edit 的训练涵盖了广泛的任务类型,如基于区域的编辑、自由形式编辑以及计算机视觉任务等,这些都是通过生成式任务来实现的。更重要的是,为了提升 Emu Edit 在多任务学习上的能力,我们还为其配备了专门的任务嵌入技术,这有助于引导模型生成更准确的编辑类型。这两方面的创新都是 Emu Edit 出色性能的关键。
此外,Emu Edit 还展示了其在新任务上的广泛适用性,比如图像修复、超高分辨率处理以及编辑任务的组合等,即便是在仅有少量标记样本的情况下也能表现出色。这一特性在高质量样本不易获得的情景下具有重大意义。最后,为了更全面严格地评估这类可指令图像编辑模型,我们还发布了一个新的基准测试,包括七种不同的图像编辑任务,具有很强的挑战性和多功能性。
为此项目打分吧
[总分: 0 平均分: 0]