今天我们激动地推出FLUX.1 Kontext——这是一套生成流匹配模型,可让您生成和编辑图像。与现有文生图模型不同,FLUX.1 Kontext系列实现了情境化图像生成功能,支持同时用文本和图像作为提示输入,并能无缝提取修改视觉概念,最终生成新颖且逻辑连贯的图像作品。
FLUX.1 Kontext标志着经典文本生成图像模型的重大突破,它统一了即时文本编辑图像与文本生成图像的功能。作为多模态流式模型,它融合了最先进的角色一致性、上下文理解能力与局部编辑技术,同时具备强大的文本到图像合成性能。
增强型文本生成图像能力
无论是用于创意构思、草图绘制、概念设计还是娱乐消遣,文本生成图像仍是当今图像生成的核心功能。FLUX.1 Kontext系列模型提供业界顶尖的图像生成效果,具备精准的提示跟随能力、照片级真实感渲染和出色的文字排版表现——其推理速度比当前主流模型(如GPT-Image)最高可提升8倍。
性能评估
为了验证我们的FLUX.1 Kontext模型的性能,我们进行了全面的性能评估,并将结果发布在技术报告中。以下是简要总结:我们通过汇编KontextBench(一个基于众包真实用例的文本到图像生成和图像到图像生成基准测试)来评估模型性能。该基准测试将在未来发布。
我们在六项上下文图像生成任务中展示了评估结果。FLUX.1 Kontext [pro] 在所有任务中始终名列前茅,在文本编辑和字符保留方面取得了最高分。
我们评估了图像到图像模型,包括我们的 FLUX.1 Kontext 模型在六项 KontextBench 任务中的表现。FLUX.1 Kontext [pro] 在所有任务中持续位居前列,在文本编辑和字符保留方面获得最高分(见上图),同时在推理速度方面始终优于其他最先进模型(见下图)。
FLUX.1 Kontext模型在文生图(左)和图像编辑(右)任务中,始终比同类先进模型具有更低的延迟
我们在多个质量维度上评估了FLUX.1 Kontext的文生图基准表现。FLUX.1 Kontext模型在美学质量、提示跟随、文字排版和真实性基准测试中均展现出竞争优势。
left: input image; middle: edit from input: “tilt her head towards the camera”, right: “make her laugh”
left: input image; middle: edit from input: “change the ‘YOU HAD ME AT BEER’ to ‘YOU HAD ME AT CONTEXT’”, right: “change the setting to a night club”
Failure Cases:
FLUX.1 Kontext exhibits some limitations in its current implementation. Excessive multi-turn editing sessions can introduce visual artifacts that degrade image quality. The model occasionally fails to follow instructions accurately, ignoring specific prompt requirements in rare cases. World knowledge remains limited, affecting the model’s ability to generate contextually accurate content. Additionally, the distillation process can introduce visual artifacts that impact output fidelity.
Illustration of a FLUX.1 Kontext failure case: After six iterative edits, the generation is visually degraded and contains visible artifacts.
🤗 FLUX.1 Kontext [dev] 开放私有测试版 🤗
我们坚信开放研究和权重共享是安全技术创新的基础。我们开发了开放权重的变体FLUX.1 Kontext [dev]——一个轻量级的120亿参数扩散Transformer模型,适合定制化开发,并与先前的FLUX.1 [dev]推理代码兼容。我们以私有测试版形式开放FLUX.1 Kontext [dev],供研究用途和安全测试。若您感兴趣,请联系kontext-dev@blackforestlabs.ai。正式公开后,FLUX.1 Kontext [dev]将通过我们的合作伙伴FAL、Replicate、Runware、DataCrunch、TogetherAI和HuggingFace进行分发。