【技术追踪】InverseSR:使用潜在扩散模型进行三维脑部 MRI 超分辨率重建(MICCAI-2023)

article/2025/7/20 10:41:49

  LDM 实现三维超分辨率~


论文:InverseSR: 3D Brain MRI Super-Resolution Using a Latent Diffusion Model
代码:https://github.com/BioMedAI-UCSC/InverseSR


0、摘要

  从研究级医疗机构获得的高分辨率(HR)MRI 扫描能够提供关于成像组织的精确信息。然而,常规临床 MRI 扫描通常为低分辨率(LR),并且由于扫描参数根据医疗机构的本地需求进行调整,其对比度和空间分辨率存在很大差异。(提出实际问题

  针对 MRI 超分辨率(SR)的端到端深度学习方法已经有所提出,但这些方法在输入分布发生变化时,每次都需要重新训练。(当前研究不足

  为解决这一问题,本文提出了一种新颖的方法,该方法利用了最先进的三维脑部生成模型——潜在扩散模型(LDM),该模型基于 UK BioBank 数据集进行训练,用于提升临床 MRI 扫描的分辨率。(本文研究目的

  LDM 作为生成先验,能够捕捉三维 T1 加权脑部 MRI 的先验分布。基于脑部 LDM 的架构,本文发现不同的 MRI SR 场景适合不同的方法,因此提出了两种新策略:
  (1)对于稀疏性较高的 SR,通过 LDM 的解码器 D \mathcal D D 以及确定性去噪扩散隐式模型(DDIM)进行逆向操作,这种方法称为 InverseSR(LDM);
  (2)对于稀疏性较低的 SR,仅通过 LDM 解码器 D \mathcal D D 进行逆向操作,这种方法称为 InverseSR(Decoder);

  这两种方法在 LDM 模型中搜索不同的潜在空间,以找到将给定的低分辨率 MRI 映射到高分辨率的最佳潜在编码。生成模型的训练过程与 MRI 欠采样过程无关,确保了本文的方法能够广泛应用于具有不同输入测量的多种 MRI 超分辨率问题。

  本文在来自 IXI 数据集的 100 多个脑部 T1 加权 MRI 上验证了该方法。实验结果表明,LDM 提供的强大先验可用于 MRI 重建。


1、引言

1.1、当前局限

  (1)基于 CNN 的监督训练需要配对图像,这导致每次输入分布发生变化时都需要重新训练,在 MRI 超分辨率中,获取能够涵盖不同机构临床脑 MRI 扫描协议和分辨率变化的配对训练数据具有挑战性;
  (2)通过生成模型构建图像先验最近成为图像超分辨率领域的一种流行方法,但目前仅限于 2D 切片;

1.2、本文贡献

  (1)提出了一种解决 MRI 超分辨率问题的方法,通过 LDM 构建强大的三维原生图像先验;
  (2)通过在预训练生成模型的潜在空间中找到最优潜在编码 z 来解决逆问题,这可以利用已知的退化函数 f f f 恢复给定的低分辨率 MRI 图像 I I I ;(云里雾里的…
  (3)提出了两种新策略:Inverse(LDM),它通过确定性的 DDIM 模型进一步逆转输入图像,以及 InverseSR(Decoder),它通过 LDM 模型的解码器 D \mathcal D D 和退化函数 f f f 逆转输入图像;


2、方法

2.1、3D 脑 LDM

  利用最先进的 LDM 为 3D 脑部 MRI 创建高质量的先验。LDM 包含两个组成部分:自编码器和扩散模型。编码器 E \mathcal E E 将每个高分辨率 T1w 脑 MRI x ∼ p d a t a ( x ) x∼p_{data}(x) xpdata(x) 映射到大小为 20×28×20 的潜在向量 z 0 = E ( x ) z_0 = \mathcal E(x) z0=E(x)。解码器 D \mathcal D D 被训练成将潜在向量 z 0 z_0 z0 映射回 MRI 图像域 x x x

  使用 L1 损失感知损失基于 patch 的对抗性损失潜在空间中的 KL 正则化项的损失组合,在 UK Biobank 上的 31740 个 T1w MRI 上对自编码器进行训练。自编码器在经过预处理的 MRI 图像上使用 UniRes 进行训练,这些图像被转换到一个具有 1mm³ 体素大小的共同 MNI 空间中,并且在 LDM 训练过程中保持不变。

  使用 T1w 脑部 MRI 的潜在表示来训练 LDM,通过以下目标训练条件 U-Net ϵ θ ϵ_θ ϵθ 以预测噪声:
在这里插入图片描述
  DDIM 已被用于脑部 LDM,以在推理过程中替代去噪扩散概率模型(DDPM),从而减少反向步骤的数量,同时将性能损失降至最低。

  网络 ϵ θ ϵ_θ ϵθ 是基于四个条件变量 C \mathcal C C 进行条件化的:年龄、性别、脑室体积和脑体积,这些都是通过交叉注意力层引入 LDM。性别是一个二元变量,而其他协变量则缩放至 [ 0 , 1 ] [0,1] [0,1]。最后,预训练的解码器将潜在向量映射到高分辨率 MRI x ~ = D ( z 0 ) \widetilde x= \mathcal D(z_0) x =D(z0)。大脑 LDM 的架构如 图1 所示。

  
Figure 1 | 训练过程与 MRI SR 两种处理方法:(左)Brain LDM 有两阶段的训练过程;首先,自编码器被预训练,用于将 T1 加权脑部 MRI 映射到一个潜在编码 z 0 = E ( x ) z_0 = \mathcal E(x) z0=E(x),随后,扩散模型在潜空间中学习生成 z 0 z_0 z0,在推理过程中,DDIM 被用于减少采样步骤,同时保证性能下降很小。(右)基于脑部 LDM 的架构提出了两种处理 MRI SR 不同场景的方法:1) InverseSR(LDM):对于高稀疏度的 SR,使用确定性的 DDIM 和解码器 D \mathcal D D 优化潜在编码 z T ∗ z_T^∗ zT 及其相关的条件变量 C ∗ \mathcal C^* C,将潜在编码映射到脑部 MRI;2) InverseSR(Decoder):对于低稀疏度的 SR,仅使用解码器 D \mathcal D D 优化 z 0 ∗ z_0^∗ z0,将潜在编码映射到脑部 MRI;

在这里插入图片描述

2.2、确定性 DDIM 采样

  为了获得能够将给定的噪声样本重建为高分辨率图像的潜在表示 z T z_T zT,采用确定性的 DDIM 采样:
在这里插入图片描述
  其中 α 1 : T ∈ ( 0 , 1 ] T α_{1:T}∈(0,1]^T α1:T(0,1]T 是一个随时间递减的序列,右边第一项表示 “预测的 x 0 x_0 x0”,第二项可以理解为“指向 x t x_t xt 的方向”。

2.3、退化函数 f f f

  假设存在一个已知的退化函数 f f f,它被应用于从生成模型中获得的高分辨率图像 x ~ \widetilde x x ,并基于退化后的图像 f ∘ x ~ f∘\widetilde x fx 和给定的低分辨率输入图像 I I I 来计算损失函数。

  在临床实践中,一种常见的获取 MRI 的方法是优先考虑高平面内分辨率,同时牺牲平面外分辨率,以加快成像过程并减少运动伪影。为了应对这一过程,本文引入了一个退化函数,该函数为未采集的切片生成掩模,从而使得本文的方法能够对缺失的切片进行填充。例如,在 1×1×4 mm³ 的欠采样体积中,本文在生成的高分辨率 1×1×1 mm³ 体积中,每四个切片中为三个切片创建掩模。

2.4、InverseSR(LDM)

  在高稀疏性 MRI SR 的情况下,优化噪声潜在编码 z T ∗ z_T^∗ zT 及其相关条件变量 C ∗ \mathcal C^* C,以使用以下优化方法从给定的 LR 输入图像 I I I 中恢复 HR 图像:
在这里插入图片描述
  其中 DDIM ( z T , C , T ) (z_T,C,T) (zT,C,T) 表示在 公式2 中对潜在编码 z 0 z_0 z0 进行的 T T T 个确定性 DDIM 采样步骤。遵循脑 LDM 模型,使用感知损失 L p e r c L_{perc} Lperc L 1 L1 L1 像素级损失。损失函数是在生成模型和给定LR输入生成的被破坏图像上计算的,该方法的详细伪代码描述见 算法1。

在这里插入图片描述

2.5、InverseSR(Decoder)

  对于低稀疏性 MRI SR,直接使用解码器 D \mathcal D D 找到最优的潜在编码 z T ∗ z_T^∗ zT
在这里插入图片描述


3、实验与结果

3.1、验证数据集

  (1)IXI 数据集:100 个 HR T1 MRI来验证本文的方法;

3.2、实施细节

  (1)条件变量均初始化为 0.5,所有输入体积中的体素均归一化为 [0,1];
  (2)DDIM 采样, T = 46 T = 46 T=46;(这个设置挺神奇
  (3)InverseSR(LDM), z T z_T zT 用随机高斯噪声初始化;
  (4)InverseSR(Decoder),从正态分布 N ( 0 , I ) \mathcal N(0,I) N(0,I) 中采样 S=10,000 个 z T i z_T^i zTi 样本,然后将它们通过 DDIM 模型,计算平均潜在编码 z ˉ 0 \bar z_0 zˉ0
  (5)在 InverseSR(LDM) 中使用了 600 步梯度下降,以确保收敛,InverseSR(Decoder) 中也使用了 600 步优化;
  (6)使用 Adam 优化器, α = 0.07 α = 0.07 α=0.07 β 1 = 0.9 β_1 = 0.9 β1=0.9 β 2 = 0.999 β_2 = 0.999 β2=0.999

3.3、实验结果

  
Figure 2 | InverseSR 和 Cubic 、 UniRes 基线在厚度为 4 mm 和 8 mm 的扫描上的定性结果:

在这里插入图片描述

  
Table 1 | InverseSR 以及两个基线方法在 1 毫米扫描图像及其对应的超分辨率(SR)图像(分别从 4毫米 和 8毫米 轴向扫描图像生成)上的定量评估结果(均值 ± 标准误差):

在这里插入图片描述


  Brain LDM 是之前的研究预训练好的,计算的损失是真实 LR 图像与 LDM 出来的 SR 经过退化后的 LR 图像,优化的是输入 LDM 的 z z z 以及条件 C C C

  不太理解的是,高稀疏性就是层厚更厚么(⊙o⊙)


http://www.hkcw.cn/article/WuJEEbByme.shtml

相关文章

美科罗拉多州恐袭嫌疑人曝光 FBI定性恐袭

当地时间6月1日,美国科罗拉多州博尔德市一名男子向人群投掷燃烧瓶,造成6人烧伤。受害者年龄在67至88岁之间,均已送医。嫌疑人确认是45岁的穆罕默德苏莱曼,案发后亦因伤入院。FBI局长卡什帕特尔称该事件为“有针对性的恐怖袭击”,并指出FBI已将此案按恐袭处理。副局长丹邦吉…

成都90后小伙让刀剑重获新生 十年磨一剑

在成都邛崃郊外的一间工作室里,一把锈迹斑斑的古刀静静地躺在工作台上。王一凯戴上手套,拿起磨石,开始了又一个漫长的工作日。磨石与刀身接触,发出“嗤嗤”的摩擦声。褐色锈层缓缓剥落,千年前的钢铁本色渐渐显露。这把沉睡已久的古刀,在他手中慢慢苏醒。1991年出生的王一…

白俄罗斯媒体:卢卡申科将访华 深化双边合作

白俄罗斯总统卢卡申科计划于本月2日至4日访问中国。此前,卢卡申科曾表示,白中关系是互利共赢的典范。白方将坚定恪守一个中国原则,并愿与中方共同推进“一带一路”重大项目,发展新质生产力,助力各自的发展振兴。责任编辑:zhangxiaohua

气象部门回应西藏现红色精灵闪电 罕见现象揭秘

5月31日至6月1日,中国摄影师在西藏山南拍到红色精灵闪电。精灵闪电形成于大气中间层,是雷击产生电磁波的结果。据中国天气科普,它在空中存在几十分之一秒,如鬼魅一般难以捉摸。责任编辑:zhangxiaohua

吴恩达MCP课程(4):connect_server_mcp_chatbot

目录 完整代码代码解释1. 导入和初始化2. 类型定义3. MCP_ChatBot 类初始化4. 查询处理 (process_query)5. 服务器连接管理6. 核心特性总结 示例 完整代码 原课程代码是用Anthropic写的,下面代码是用OpenAI改写的,模型则用阿里巴巴的模型做测试 .env 文…

网页前端开发(基础进阶1--盒子模型)

颜色表示方法3种: 1.关键字: color:green; gray red yellow 2.rgb表示法:红,绿,蓝三原色。rgb(r,g,b),r表示红色,g表示绿…

中国造船是如何取代韩国霸主地位的 14年激战成就全球王者

在全球造船业的百年激荡中,主导权的更迭总是伴随着技术、规模与国家意志的碰撞。从19世纪的英国,到战后的日本,再到20世纪末的韩国,造船业王冠几度易主。如今,中国以雷霆万钧之势终结了韩国长达20年的霸主地位。2024年,中国造船业以74.7%的新船订单份额,全面改写全球造船…

加沙城四分之三水井被以军摧毁 缺水危机加剧

加沙城政府部门6月1日发布消息称,由于以军摧毁了当地约75%的水井,且剩余水井缺乏正常运行所需燃料,加沙城正面临严重的缺水问题和灾难性危机。该部门警告称,如果国际社会和相关机构不尽快介入,可能会引发严重的健康和环境危机。责任编辑:zhangxiaohua

马克龙接见巴黎圣日耳曼全队 谴责暴力事件

巴黎圣日耳曼队在5月31日晚赢得了欧冠联赛冠军奖杯,法国多地的球迷彻夜庆祝。然而,庆祝活动期间发生了多起暴力事件。据法国内政部消息,狂欢夜有559人因滋事被捕,并发生了两起命案。法国总统马克龙6月1日在爱丽舍宫接见球队时,严厉谴责了这些暴力事件,称其“不可接受”。…

C++实现汉诺塔游戏自动完成

目录 一、汉诺塔的规则二、数学递归推导式三、步骤实现(一)汉诺塔模型(二)递归实现(三)显示1.命令行显示2.SDL图形显示 四、处理用户输入及SDL环境配置五、总结六、源码下载 一、汉诺塔的规则 游戏由3根柱子和若干大小不一的圆盘组成,初始状态下,所有的…

抖音评论数据采集解决方案推荐

内容概要 在当今数字化营销的背景下,抖音作为一款广受欢迎的短视频平台,吸引了众多用户和企业的关注。为了更好地理解用户反馈和优化营销策略,评论数据的采集显得尤为重要。本文将为读者提供一系列系统化的解决方案,涵盖多款高效…

若依框架-代码生成器的使用

1.服务启动 注意一定要启动Gen\GateWay\System 2.创建表 注意一定要写上字段的注释和表的注释。 1.注意主键的命名 2.注意驼峰命名法 3.代码生成 3.1 按照以下箭头步骤,选择生成的表,点击确定 3.2 核对生成表的结构 3.3 编辑生成表的基础信息 3.4 点…

河南46岁卡车司机已下葬 卡友团队千里送别

近日,46岁的河南卡车司机常志荣在青藏高原离世,卡友团队一同将其骨灰接回老家。6月1日,常志荣已经在老家安葬。他去世后留下了重组家庭的6个孩子,其中5个孩子还在上学。车友任先生透露,常志荣出发前同行曾建议他至少携带两罐氧气,但他为了省下30元费用,最终只购买了一罐…

交警回应豪车车主赖停车费被举报酒驾 代驾小哥报警揭发真相

近日,浙江宁波一名兰博基尼车主酒后请代驾将车开到小区,随后自己开车进车库。因不愿支付代驾小哥垫付的5元停车费,被对方举报酒驾。经检测,该车主血液中的酒精含量达59mg/100ml,达到酒驾标准,其驾驶证被扣12分,暂扣6个月,并被处以2000元以下罚款。代驾小哥石先生表示,…

Nat. Commun|借助深度学习分层方法,量化胎盘组织学全切片图像中细胞和显微解剖组织结构的变异性

小罗碎碎念 这篇文章提出了用于胎盘组织学全切片图像分析的深度学习框架HAPPY,其核心是通过三阶段流水线实现从细胞到组织结构的层次化建模。 首先利用RetinaNet定位细胞核。 再通过ResNet-50分类11种细胞类型 最后基于ClusterGCN图神经网络将细胞聚合成9类显微组织…

融智学道函数智慧系统研习(图文并茂)

融智学道函数智慧系统研习(图文并茂) 融智学创立者邹晓辉亲自设计和审订并规划布局人机互助制作全过程 摘要:本文呈现邹晓辉融智学理论的核心架构,包含四大公式可视化系统:1)道函数(f_Tao0&am…

小米YU7将推出5款全新车身颜色 更多经典配色即将揭晓

6月1日的消息显示,在5月22日的发布会上,小米YU7公布了四款颜色:钛金属色、宝石绿、熔岩橙和寒武岩灰。官方透露,除了已发布的四款颜色外,还有五款新颜色即将发布。回顾小米SU7刚推出时,提供了9种颜色选择,分为跑车色系、时尚色系、豪华色系和经典色系。基础款中的海湾蓝…

国足出征印尼25人大名单 刘若钒因伤落选

北京时间6月2日,中国男足公布了出征印度尼西亚雅加达的25人名单。刘若钒因伤落选,他在国足上海集训期间受到伤病困扰,缺席了数次合练。尽管恢复了有球训练,但最终未能进入出征印尼的名单。谢文能和林良铭将在对阵印度尼西亚的比赛里停赛。不过,两人还是会随队前往雅加达,…

国防大学副校长香会发言释放何信号 坚定维护亚太和平稳定

今年在新加坡举行的香格里拉对话会上,最重要的发言来自中国国防大学代表团团长、国防大学副校长兼教育长胡钢锋少将。他提出了“三个坚持三个反对”的倡议,这不仅反映了中国对亚太地区海上安全合作的看法,也展示了中国维护和平与稳定的决心。当地时间5月31日下午,胡钢锋在香…

尾号0000000的手机号拍出61.2万元 司法拍卖市场火热

端午节期间,司法拍卖市场异常活跃。6月1日,一个尾号为七个零的手机号码使用权以25万元起拍,吸引了13人报名参与竞拍。经过激烈竞争,该号码最终以61.2万元成交。据竞买公告显示,截至2025年4月23日,该手机号码无欠费,余额约9.14元。套餐为4G全国流量王8元套餐,未绑定宽带…