发现一款功能强大的开源图像编辑模型:Step1X-Edit,提供与 GPT-4o、Gemini2 这些闭源相媲美的编辑效果,而且完全开源!
只需一句简单的指令就能完成复杂的编辑任务,能准确理解指令和参考图像,轻松完成在 PS 上需花几十分钟的各种操作。
GitHub: https://github.com/stepfun-ai/Step1X-Edit
在线体验:huggingface.co/spaces/stepfun-ai/Step1X-Edit
主要亮点:
- 通过自然语言指令精确控制图像编辑效果;
- 支持 512 至 1024 分辨率的图像处理;
- 编辑速度超快,512x512 分辨率仅需 5 秒
- 提供 ModelScope 和 HuggingFace 在线演示;
- 开源的评估基准 GEdit-Bench,基于真实用户需求;
- 各种详细的使用范例和全面的文档说明。
不过,对性能配置要求颇高,建议使用 80GB 以上显存以获得更好的生成效果。