​黑森林实验室推出 FLUX.1Kontext:可通过文本和参考图像对图像进行多次修改

article/2025/7/19 4:36:39

在这里插入图片描述
今天我们激动地推出FLUX.1 Kontext——这是一套生成流匹配模型,可让您生成和编辑图像。与现有文生图模型不同,FLUX.1 Kontext系列实现了情境化图像生成功能,支持同时用文本和图像作为提示输入,并能无缝提取修改视觉概念,最终生成新颖且逻辑连贯的图像作品。

在这里插入图片描述
FLUX.1 Kontext标志着经典文本生成图像模型的重大突破,它统一了即时文本编辑图像与文本生成图像的功能。作为多模态流式模型,它融合了最先进的角色一致性、上下文理解能力与局部编辑技术,同时具备强大的文本到图像合成性能。

增强型文本生成图像能力

无论是用于创意构思、草图绘制、概念设计还是娱乐消遣,文本生成图像仍是当今图像生成的核心功能。FLUX.1 Kontext系列模型提供业界顶尖的图像生成效果,具备精准的提示跟随能力、照片级真实感渲染和出色的文字排版表现——其推理速度比当前主流模型(如GPT-Image)最高可提升8倍。

性能评估

为了验证我们的FLUX.1 Kontext模型的性能,我们进行了全面的性能评估,并将结果发布在技术报告中。以下是简要总结:我们通过汇编KontextBench(一个基于众包真实用例的文本到图像生成和图像到图像生成基准测试)来评估模型性能。该基准测试将在未来发布。

在这里插入图片描述
我们在六项上下文图像生成任务中展示了评估结果。FLUX.1 Kontext [pro] 在所有任务中始终名列前茅,在文本编辑和字符保留方面取得了最高分。

我们评估了图像到图像模型,包括我们的 FLUX.1 Kontext 模型在六项 KontextBench 任务中的表现。FLUX.1 Kontext [pro] 在所有任务中持续位居前列,在文本编辑和字符保留方面获得最高分(见上图),同时在推理速度方面始终优于其他最先进模型(见下图)。

在这里插入图片描述
FLUX.1 Kontext模型在文生图(左)和图像编辑(右)任务中,始终比同类先进模型具有更低的延迟

我们在多个质量维度上评估了FLUX.1 Kontext的文生图基准表现。FLUX.1 Kontext模型在美学质量、提示跟随、文字排版和真实性基准测试中均展现出竞争优势。

在这里插入图片描述
在这里插入图片描述
left: input image; middle: edit from input: “tilt her head towards the camera”, right: “make her laugh”

在这里插入图片描述
left: input image; middle: edit from input: “change the ‘YOU HAD ME AT BEER’ to ‘YOU HAD ME AT CONTEXT’”, right: “change the setting to a night club”

Failure Cases:

FLUX.1 Kontext exhibits some limitations in its current implementation. Excessive multi-turn editing sessions can introduce visual artifacts that degrade image quality. The model occasionally fails to follow instructions accurately, ignoring specific prompt requirements in rare cases. World knowledge remains limited, affecting the model’s ability to generate contextually accurate content. Additionally, the distillation process can introduce visual artifacts that impact output fidelity.
在这里插入图片描述
Illustration of a FLUX.1 Kontext failure case: After six iterative edits, the generation is visually degraded and contains visible artifacts.

🤗 FLUX.1 Kontext [dev] 开放私有测试版 🤗

我们坚信开放研究和权重共享是安全技术创新的基础。我们开发了开放权重的变体FLUX.1 Kontext [dev]——一个轻量级的120亿参数扩散Transformer模型,适合定制化开发,并与先前的FLUX.1 [dev]推理代码兼容。我们以私有测试版形式开放FLUX.1 Kontext [dev],供研究用途和安全测试。若您感兴趣,请联系kontext-dev@blackforestlabs.ai。正式公开后,FLUX.1 Kontext [dev]将通过我们的合作伙伴FAL、Replicate、Runware、DataCrunch、TogetherAI和HuggingFace进行分发。


http://www.hkcw.cn/article/OHjTFmfRuK.shtml

相关文章

在React框架中使用Braft Editor集成Table表格的详细教程

简介:Braft Editor是一款基于draft-js开发的React富文本编辑器,支持多媒体、自定义样式和扩展功能。其表格扩展模块允许用户插入、调整表格结构,适合需要数据展示的场景(如CMS系统、报表工具)。 1.安装依赖 yarn add…

经营分析会,财务该怎么做?

目录 一、业绩洞察:从「现象描述」到「因果分析」 1.分层拆解 2.关联验证 3.根因追溯 二、预算管理:从「刚性控制」到「动态平衡」 1.分类管控 2.滚动校准 3.价值评估 三、客户与市场:从「交易记录」到「价值评估」 1.价值分层 2.…

yum安装nginx后无法通过服务方式启动

背景 在linux系统下,通过yum方式安装nginx后 通过nginx命令 nginx 可以启动nginx 但是作为测试或者生产服务器,我们需要配置开机自启动,这时候需要用服务方式启动 yum安装后的nginx 已经默认生成了服务启动方式的 nginx.service文件 按…

kuboard自带ETCD存储满了处理方案

一、前言 当运行 ETCD 日志报 Erro: mvcc database space exceeded 时,说明 ETCD 存储不足了(默认 ETCD 存储是 2G),配额会触发告警,然后 Etcd 系统将进入操作受限的维护模式。 通过下面命令可以查看 ETCD 存储使用情…

『uniapp』添加桌面长按快捷操作 shortcuts(详细图文注释)

目录 手机环境适配说明安卓效果图代码 iOS(暂未实测,没有水果开发者)总结 欢迎关注 『uniapp』 专栏,持续更新中 欢迎关注 『uniapp』 专栏,持续更新中 手机环境适配说明 个别手机系统可能需要进行特别的权限设置,否则会无法使用 桌面快捷方式: 已知的有…

【目标检测】【ICCV 2021】条件式DETR实现快速训练收敛

Conditional DETR for Fast Training Convergence 条件式DETR实现快速训练收敛 代码链接 论文链接 摘要 最近提出的DETR方法将Transformer编码器-解码器架构应用于目标检测领域,并取得了显著性能。本文针对其训练收敛速度慢这一关键问题,提出了一种条…

Java线程:线程池详解(ThreadPoolExecutor构造器七个参数、线程池处理Runnable/Callable任务)

认识线程池 什么是线程池? 线程池就是一个可以复用线程的技术 不使用线程池的问题 用户每发起一个请求,后台就需要创建一个新线程来处理,下次新任务来了肯定又要创建新线程处理的,而创建新线程的开销是很大的,并且请求…

华为OD机试真题——开放日活动/取出尽量少的球(2025A卷:200分)Java/python/JavaScript/C++/C语言/GO六种最佳实现

2025 A卷 200分 题型 本文涵盖详细的问题分析、解题思路、代码实现、代码详解、测试用例以及综合分析; 并提供Java、python、JavaScript、C++、C语言、GO六种语言的最佳实现方式! 本文收录于专栏:《2025华为OD真题目录+全流程解析/备考攻略/经验分享》 华为OD机试真题《开放…

day14 leetcode-hot100-25(链表4)

141. 环形链表 - 力扣(LeetCode) 1.哈希集合 思路 将节点一个一个加入HashSet,并用contains判断是否存在之前有存储过的节点,如果有便是环,如果没有便不是环。 具体代码 /*** Definition for singly-linked list.*…

低碳理念在道路工程中的应用-预制路面

一、引子 在上一篇文章里,给大家介绍了预制基层的应用,有人提出,既然基层能够预制,那么,道路面层能不能预制呢,有没有相关的研究成果和应用实例呢?答案是肯定的,在本篇文章中&#x…

React---day5

4、React的组件化 组件的分类: 根据组件的定义方式,可以分为:函数组件(Functional Component )和类组件(Class Component);根据组件内部是否有状态需要维护,可以分成:无状态组件(Stateless Component )和…

Muplayer——轻量级在线JavaScript 音乐播放器

简单的 JavaScript 音乐播放器 GitHub 地址:https://github.com/Wcowin/Muplayer 在线地址:https://wcowin.work/Muplayer/ 本项目是一个基于原生 JavaScript、HTML 和 CSS 实现的响应式音乐播放器,支持本地音乐添加、播放列表管理、搜索、…

毫秒断电,安全守护|维安WPB系列主动型熔断器重磅登场!

1 主动型熔断器 新能源时代的“主动保护”趋势 随着新能源汽车行业的高速发展,其相关安全事故也层出不穷。为此,工信部于2025 年3月 28 日组织制定了强制性国家标准《电动汽车用动力蓄电池安全要求》(GB38031-2025)&#xff0c…

Java—— 多线程 第二期

等待唤醒机制(生产者和消费者) 说明 之前的多线程是谁抢到CPU的执行权谁执行,而等待唤醒机制作为一种经典的多线程协作模式,可以实现线程的交替执行。 成员 实现等待唤醒机制需要三个成员:生产者、消费者、标志位 可以分别看作厨师、吃货、…

2025年最新《Python程序设计》题库(含答案)

判断题填空题选择题程序题 点击文末名片可以下载python工具和完整题库! 第 1 章 基础知识 (部分展示) 1、 Python 是一种跨平台、开源、免费的高级动态编程语言。 2、 Python 3.x 完全兼容 Python 2.x。 3、 Python 3.x 和 Python 2.x 唯…

【AI非常道】二零二五年五月,AI非常道

经常在社区看到一些非常有启发或者有收获的话语,但是,往往看过就成为过眼云烟,有时再想去找又找不到。索性,今年开始,看到好的言语,就记录下来,一月一发布,亦供大家参考。 前面的记…

Linux入门(十一)进程管理

Linux 中每个执行的程序都称为一个进程,每个进程都分配一个ID号(PID) 每个进程都可能以两种方式存在,前台(屏幕上可以操作的)和后台(屏幕上无法看到的),一般系统的服务都…

晨控CK-UR12与西门子PLC配置Modbus TCP通讯连接操作手册

晨控CK-UR12与西门子PLC配置Modbus TCP通讯连接操作手册 晨控CK-UR12系列作为晨控智能工业级别RFID读写器,支持大部分工业协议如RS232、RS485、以太网。支持工业协议Modbus RTU、Modbus TCP、Profinet、EtherNet/lP、EtherCat以及自由协议TCP/IP等。 本期主题:围绕…

Python使用

Python学习,从安装,到简单应用 前言 Python作为胶水语言在web开发,数据分析,网络爬虫等方向有着广泛的应用 一、Python入门 相关基础语法直接使用相关测试代码 Python编译器版本使用3以后,安装参考其他教程&#xf…

高德地图应用OceanBase单元化构建下一代在线地图服务

IEEE International Conference on Data Engineering (ICDE) 是数据库和数据工程领域的顶级学术会议之一(与SIGMOD、VLDB并成为数据库三大顶会),自1984年首次举办以来,每年举办一次。ICDE涵盖广泛的主题,包括数据库系统…