微软与北京大学联手,在 GitHub 开源了一个多模态预训练模型:「NÜWA(女娲)」,可实现文本/草图转图像、图像补全、文字/草图转视频等任务,功能异常强大。
GitHub:github.com/microsoft/NUWA
简而言之,该模型可为 8 种不同的视觉合成任务,生成新的或编辑现有的视觉数据(图像和视频),项目源码与论文均已发布,感兴趣的同学可以看下。
https://weibo.com/5722964389/L3gRDcwqP
每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。