清华大学发Nature!光学工程+神经网络创新结合

article/2025/8/2 13:51:00

2025深度学习发论文&模型涨点之——光学工程+神经网络

清华大学的一项开创性研究成果在《Nature》上发表,为光学神经网络的发展注入了强劲动力。该研究团队巧妙地提出了一种全前向模式(Fully Forward Mode,FFM)的训练方法,这一方法在物理光学系统中直接执行训练过程,彻底摆脱了传统依赖数字计算机模拟的诸多限制。

清华大学的一项开创性研究成果在《Nature》上发表,为光学神经网络的发展注入了强劲动力。该研究团队巧妙地提出了一种全前向模式(Fully Forward Mode,FFM)的训练方法,这一方法在物理光学系统中直接执行训练过程,彻底摆脱了传统依赖数字计算机模拟的诸多限制。

我整理了一些光学神经网络【论文+代码】合集,需要的同学公众号【AI创新工场】发525自取。

论文精选

论文1:

[Nature] Fully forward mode training for optical neural networks

全前向模式训练光学神经网络

方法

全前向模式(FFM)学习:通过在物理系统上实施计算密集型训练过程,利用空间对称性和洛伦兹互易性,消除了梯度下降训练中对反向传播的需求。

光学系统映射:将光学系统映射到参数化的现场神经网络,通过测量输出光场来计算梯度,并使用梯度下降算法更新参数。

实验验证:在自由空间和集成光子学中展示了该方法在深度光学神经网络训练中的有效性。

图片

创新点

无需离线建模:首次提出了一种完全在光学系统上进行训练的方法,无需数字计算机进行离线建模。

性能提升:在自由空间和集成光子学中展示了该方法在深度光学神经网络训练中的有效性,实现了与理想模型相当的准确率。

能效提升:通过利用光学系统的并行性,实现了高分辨率散射成像和动态非视距成像,提高了系统的能效和性能。

图片

论文2:

Spike-FlowNet Event-based Optical Flow Estimation with Energy-Efficient Hybrid Neural Networks

Spike-FlowNet:基于事件的光流估计与能效混合神经网络

方法

混合神经网络架构:提出了一种深度混合神经网络架构,将脉冲神经网络(SNN)和模拟神经网络(ANN)集成在一起,用于从稀疏的事件相机输出中高效估计光流。

自监督学习:通过自监督学习在多车辆立体事件相机(MVSEC)数据集上进行端到端训练。

输入表示:提出了一种新的输入表示方法,能够高效地编码事件相机的稀疏输出序列,保留事件的时空特性。

图片

创新点

性能提升:在MVSEC数据集上,Spike-FlowNet在平均端点误差(AEE)方面优于EV-FlowNet,显示出更高的光流估计精度。

能效提升:通过结合SNN和ANN的优势,解决了深度SNN中脉冲消失的问题,同时保持了网络性能,显著提高了计算效率。

首次应用:首次在事件相机的光流估计任务中实现了与全ANN架构相当的性能,同时显著提高了计算效率。

图片

论文3:

FatNet High Resolution Kernels for Classification Using Fully Convolutional Optical Neural Networks

FatNet:使用全卷积光学神经网络进行分类的高分辨率核

方法

全卷积网络架构:提出了一种全卷积光学神经网络架构,通过减少通道数量和增加分辨率,充分利用了4f系统的并行性。

高分辨率核:在4f自由空间系统中使用高分辨率特征图和核,提高了神经网络的推理速度。

光学模拟:通过模拟4f系统的光传播,验证了FatNet在光学设备中的有效性。

图片

创新点

性能提升:与ResNet-18相比,FatNet减少了8.2倍的卷积操作,仅损失了6%的准确率。

能效提升:通过减少光学-电子转换的次数,提高了训练过程的能效,特别是在大批次大小下,FatNet在光学设备中的推理速度显著快于GPU。

首次应用:首次提出了一种适用于4f自由空间系统的全卷积网络架构,为未来光学计算时代的深度学习训练提供了一种新的方向。

图片


http://www.hkcw.cn/article/OHPTQDNijh.shtml

相关文章

PHP学习笔记(十一)

类常量 可以把在类中始终保持不变的值定义为常量,类常量的默认可见性是public。 接口中也可以定义常量。 可以用一个变量来动态调用类,但该变量的值不能为关键字 需要注意的是类常量只为每个类分配一次,而不是为每个类的实例分配。 特殊的…

NodeMediaEdge快速上手

NodeMediaEdge快速上手 简介 NodeMediaEdge是一款部署在监控摄像机网络前端中,拉取Onvif或者rtsp/rtmp/http视频流并使用rtmp/kmp推送到公网流媒体服务器的工具。 通过云平台协议注册到NodeMediaServer后,可以同NodeMediaServer结合使用。使用图形化的…

强化学习的前世今生(五)— SAC算法

书接前四篇 强化学习的前世今生(一) 强化学习的前世今生(二) 强化学习的前世今生(三)— PPO算法 强化学习的前世今生(四)— DDPG算法 本文为大家介绍SAC算法 7 SAC 7.1 最大熵强化…

优质电子实验记录本如何确保数据不泄密?

实验数据是企业和科研机构的核心资产,承载着创新成果与竞争优势,选择合适的实验记录载体至关重要。本文从传统纸质记录的安全性优劣势出发,对比分析普通电子实验记录本存在的安全问题,详细阐述优质电子实验记录本如何构建数据防护…

RFID 助力钢铁钢帘线生产效率质量双提升

RFID 助力钢铁钢帘线生产效率质量双提升 应用背景 钢铁钢帘线广泛应用于建筑、公路、桥梁、隧道、海洋工程等领域。,其质量和生产效率直接影响性能与安全性。在钢铁钢帘线的生产过程中,面临着诸多挑战。传统生产模式下,各生产环节信息传递不…

4.5V~100V, 3.8A 峰值电流限, 非同步, 降压转换器,LA1823完美替换MP9487方案

一:综述 LA1823 是一款易用的非同步,降压转换器。 该模块集成了 500mΩ 低导通阻抗的高侧 MOSFET。LA1823 使用 COT 控制技术。此种控制方式有利于快速动态响应,同时简化了反馈环路的设计。LA1823 可以提供最大 2A 的持续负载电流。LA1823有150kHz/240kH…

多杆合一驱动城市空间治理智慧化

引言:城市“杆林困境”与智慧化破局 走在现代城市的街道上,路灯、监控、交通信号灯、5G基站等杆体林立,不仅侵占公共空间,更暴露了城市治理的碎片化问题。如何让这些“沉默的钢铁”升级为城市的“智慧神经元”?答案在…

ElasticSearch迁移至openGauss

Elasticsearch 作为一种高效的全文搜索引擎,广泛应用于实时搜索、日志分析等场景。而 openGauss,作为一款企业级关系型数据库,强调事务处理与数据一致性。那么,当这两者的应用场景和技术架构发生交集时,如何实现它们之…

搭建 Select 三级联动架构-东方仙盟插件开发 JavaScript ——仙盟创梦IDE

三级级联开卡必要性 在 “东方仙盟” 相关插件开发中,使用原生 HTML 和 JavaScript 实现三级联动选择(如村庄 - 建筑 - 单元的选择)有以下好处和意义,学校管理: 对游戏体验的提升 增强交互性:玩家能够通…

SpringBoot+vue+SSE+Nginx实现消息实时推送

一、背景 项目中消息推送,简单的有短轮询、长轮询,还有SSE(Server-Sent Events)、以及最强大复杂的WebSocket。 至于技术选型,SSE和WebSocket区别,网上有很多,我也不整理了,大佬的链…

软件测试的分类

为什么要软件测试分类呢? 软件测试是软件生命周期中的一个重要的环节,基本伴随着软件整个生命周期,对软件测试分类后,我们可以根据软件生命不同阶段,进行对应的测试,这样就有助于我们条理分明,…

<PLC><socket><西门子>基于西门子S7-1200PLC,实现手机与PLC通讯(通过websocket转接)

前言 本系列是关于PLC相关的博文,包括PLC编程、PLC与上位机通讯、PLC与下位驱动、仪器仪表等通讯、PLC指令解析等相关内容。 PLC品牌包括但不限于西门子、三菱等国外品牌,汇川、信捷等国内品牌。 除了PLC为主要内容外,PLC相关元器件如触摸屏(HMI)、交换机等工控产品,如…

实现一个免费可用的文生图的MCP Server

概述 文生图模型为使用 Cloudflare Worker AI 部署 Flux 模型,是参照视频https://www.bilibili.com/video/BV1UbkcYcE24/?spm_id_from333.337.search-card.all.click&vd_source9ca2da6b1848bc903db417c336f9cb6b的复现Cursor MCP Server实现是参照文章https:/…

Windows安装Miniconda

Windows安装miniconda 下载安装常用命令配置powershellVSCode配置虚拟环境 下载 进入官网 https://www.anaconda.com/download/success 下载windows版本的miniconda Miniconda3-latest-Windows-x86_64.exe 安装 一直点击下一步,可以选择安装路径 配置环境变量…

华为OD机试真题——二叉树中序遍历(2025A卷:200分)Java/python/JavaScript/C++/C语言/GO六种最佳实现

2025 A卷 200分 题型 本文涵盖详细的问题分析、解题思路、代码实现、代码详解、测试用例以及综合分析; 并提供Java、python、JavaScript、C++、C语言、GO六种语言的最佳实现方式! 2025华为OD真题目录+全流程解析/备考攻略/经验分享 华为OD机试真题《二叉树中序遍历》: 目录 …

现代密码学 | 高级加密标准(AES)

接下来我们将讨论目前大多数计算机和硬件基础设施所使用的最重要的加密算法,例如高级加密标准(AES)、里弗斯特-沙米尔-阿德曼算法(RSA)、椭圆曲线加密(ECC)、基于格的加密、(环&…

cocos creator资源管理器,资源动态加载和释放

cocos 2.4.11版本 cocos 动态加载的资源需要自己增加引用和减少引用计数 cc.Asset.addRef 和 cc.Asset.decRef 注意: 1.使用当前代码管理资源,要区分项目中的静态资源和动态资源,静态资源就是预制体或者场景中的资源,代码中动态…

认识scratch,scratch是什么,如何使用

scratch是图形编程,将编程简化为积木的堆叠和嵌套,无需手写代码,只需清晰的逻辑即可完成自己的代码设计。通过它可以制作简单的小游戏等。 如图所示,这个就是scratch打开的界面,整个界面分为左中右三个部分&#xff0c…

HarmonyOS实战:腾讯IM之聊天详情页面搭建(二)

前言 鸿蒙版本腾讯 IM 的聊天功能十分复杂,需要开发者手动实现整个聊天对话的业务代码,这对开发者来说是个不小的挑战。本篇文章先从最基础的聊天对话列表开始教你一步一步实现完整的聊天功能,建议点赞收藏! 实现效果 先看本文…

IM系统的负载均衡

1.IM场景的负载均衡 2.方案总览 SDK层想要连接一个TCP网关或者WebSocket网关的方案 SDK单地址:在SDK中写死某个网关的IP或者域名,缺点是更换地址需要重新打包SDK SDK多地址:防止某一个地址嗝屁了写上多个地址用足保持高可用 暴露接口给客户端:SDK层访问接口动态获得地址 注…