微软与北京大学联手,在 GitHub 开源了一个多模态预训练模型:「NÜWA(女娲)」,可实现文本/草图转图像、图像补全、文字/草图转视频等任务,功能异常强大。
该模型可为 8 种不同的视觉合成任务,生成新的或编辑现有的视觉数据(图像和视频),论文已发布,项目源码尚未公开。
为此项目打分吧
[总分: 0 平均分: 0]
微软与北京大学联手,在 GitHub 开源了一个多模态预训练模型:「NÜWA(女娲)」,可实现文本/草图转图像、图像补全、文字/草图转视频等任务,功能异常强大。
该模型可为 8 种不同的视觉合成任务,生成新的或编辑现有的视觉数据(图像和视频),论文已发布,项目源码尚未公开。