YOLO12改进-模块-引入AFE模块 增强模型对复杂场景(如杂乱背景、小目标、半透明物体)的特征提取能力

article/2025/8/18 17:36:06

        在语义分割任务中,复杂场景(如杂乱背景、半透明物体)下的语义线索捕捉是难点。现有方法(如基于 CNN 和 Transformer 的模型)存在以下局限:
        CNN:受限于局部感受野,难以建模长距离上下文和多尺度变化。
        Transformer:依赖全局自注意力,计算成本高且忽视局部细节,在杂乱背景中分割精度不足。
        混合模型:虽结合卷积和注意力,但对复杂场景下的语义信息提取仍不充分,尤其对半透明物体边界和多尺度目标处理能力有限。

上面是原模型,下面是改进模型

1.  AEF介绍 

AFE(自适应特征增强模块)的设计灵感来源于图像增强技术(如图像锐化和对比度增强),核心理论包括:

        空间上下文建模:通过大内核卷积(如 7×7)扩大感受野,捕捉多尺度空间上下文,解决目标尺度变化问题。

        特征频率分离高频细节:通过原图与平滑图的差值突出边缘和细节(类似图像锐化)。低频区域:通过原图与平滑图的逐元素相乘强化整体结构和语义区域(类似对比度增强)。

        并行特征融合:通过并行分支分别处理空间上下文和语义特征,再融合两者信息,实现从粗到细的特征增强。

AFE 模块由四个关键组件组成:

        卷积嵌入(CE):通过 1×1 卷积压缩通道数(如减半),降低计算量并促进特征混合。

        空间上下文模块(SCM):采用大内核分组卷积(如 7×7),扩大感受野以捕获多尺度空间信息。

        特征 refinement 模块(FRM)高频分支:通过深度卷积下采样 - 上采样生成平滑特征,与输入特征相减得到高频细节。低频分支:输入特征与平滑特征逐元素相乘,提取低频语义区域。融合:高频和低频特征经深度卷积后拼接,通过投影层输出增强特征。

        卷积多层感知机(ConvMLP):通过 1×1 卷积和多层感知机进一步增强特征表示。

  

 2. YOLOv12与AFE的结合      

        将 AFE 模块插入 YOLO12 的主干网络中,可增强模型对复杂场景(如杂乱背景、小目标、半透明物体)的特征提取能力:

         多尺度上下文建模:通过 SCM 的大内核卷积扩大感受野,提升对不同尺度目标的鲁棒性。

         语义细节增强:FRM 分离并融合高低频特征,既保留目标边缘细节,又强化整体语义结构,改善 YOLO12 在复杂场景下的检测和分割精度,尤其适用于工业检测、医疗影像等细粒度任务。    

3. AFE代码部分

YOLOv8_improve/YOLOV12.md at master · tgf123/YOLOv8_improve · GitHub

YOLO12模型改进方法,快速发论文,总有适合你的改进,还不改进上车_哔哩哔哩_bilibili

 4. 将AFE引入到YOLOv12中

第一: 先新建一个change_model,将下面的核心代码复制到下面这个路径当中,如下图如所示。YOLOv12\ultralytics\change_model。

            ​​​​​​     

第二:在task.py中导入

 ​​​       ​​​​​​​       

第三:在task.py中的模型配置部分下面代码

        ​​​​​​​​​​​​​​ ​​​​​​​​​​​​​​​​​​​​​   

第四:将模型配置文件复制到YOLOV12.YAMY文件中

  

     ​​​​​​​ ​​​​​​​​​​​​​​ ​​​​​​​ ​​​​​​​​​​​​​第五:运行代码


from ultralytics.models import NAS, RTDETR, SAM, YOLO, FastSAM, YOLOWorldif __name__=="__main__":# 使用自己的YOLOv12.yamy文件搭建模型并加载预训练权重训练模型model = YOLO(r"E:\Part_time_job_orders\YOLO_NEW\YOLOv12_all\ultralytics\cfg\models\12\yolo12_AEE_Block.yaml")# .load(r'E:\Part_time_job_orders\YOLO_NEW\YOLOv12\yolo12n.pt')  # build from YAML and transfer weightsresults = model.train(data=r'E:\Part_time_job_orders\YOLO\YOLOv12\ultralytics\cfg\datasets\VOC_my.yaml',epochs=300,imgsz=640,batch=64,# cache = False,# single_cls = False,  # 是否是单类别检测# workers = 0,# resume=r'D:/model/yolov8/runs/detect/train/weights/last.pt',amp = True)

http://www.hkcw.cn/article/sRWDNBEtNy.shtml

相关文章

华为OD机试真题——字母组合过滤组合字符串(2025A卷:100分)Java/python/JavaScript/C/C++/GO最佳实现

2025 A卷 100分 题型 本专栏内全部题目均提供Java、python、JavaScript、C、C++、GO六种语言的最佳实现方式; 并且每种语言均涵盖详细的问题分析、解题思路、代码实现、代码详解、3个测试用例以及综合分析; 本文收录于专栏:《2025华为OD真题目录+全流程解析+备考攻略+经验分…

男子深夜爬泰山崩溃痛哭:大喊要回家找媳妇

男子深夜爬泰山崩溃痛哭。全网疯传!夜爬泰山避坑指南:为何有人登顶后痛哭?这些细节能救命!泰山景区数据显示,夜爬游客受伤率同比激增,其中78%因未携带照明设备跌落台阶。最近曝光的"大学生夜爬冻伤事件",正是轻视了泰山顶与山脚高达15℃的温差。正值暑期夜爬高…

网友在摩洛哥偶遇成都“洋中医”狂飙四川话

网友在摩洛哥偶遇成都“洋中医”。首位外籍中医博士迪亚拉在摩洛哥被偶遇与成都“老乡”狂飙四川话5月26日,有网友发布视频称在摩洛哥偶遇首位外籍中医博士迪亚拉,两人狂飙四川话,还约在成都吃火锅。迪亚拉,1984年获奖学金到中国学习,于1997年获得成都中医药大学博士学位,…

端午假期首都博物馆延长开放时间 六月活动精彩纷呈

端午假期首都博物馆延长开放时间!为了满足广大观众的参观需求,首都博物馆2025年6月将进行部分场次的延时开放活动。端午假期及6月份延时开放相关事宜如下:2025年5月31日(端午节、周六)至6月2日(周一)正常开放。延时开放场次为5月31日(端午节、周六)、6月7日(周六)、…

老人骑电动车捎人遇车祸后被判赔14万 好心搭载惹争议

老人骑电动车捎人遇车祸后被判赔14万 好心搭载惹争议!2023年8月15日清晨,浙江省东阳市六石街道徐庄村的卢某芳老人骑电动车前往镇上参加领鸡蛋的促销活动。在现场,她遇到了隔壁村的老友吕某,在返程时捎带吕某一同回家,尽管这需要绕路。不幸的是,在返程途中,电动车与一辆…

辣目洋子回母校重大讲座分享 勇敢追梦不惧质疑

5月29日,李嘉琦回到母校重庆大学,参加新闻学院“优秀校友回母校”系列讲座。她以“梦想?梦幻?人生也是一部电视剧”为主题,与学弟学妹们分享了自己在母校时的学习生活和进入娱乐圈的经历。李嘉琦从小有一个当演员的梦想,但不知道如何实现。高考时,她从内蒙古考入重庆大学…

济南5元快餐店老板回应是否亏钱 意外走红后生意更旺

山东济南市天桥区一家名为“小孟5元自助快餐”的小店,因一条关于“菜量少并且贵”的差评意外走红网络。许多网友在该店外卖及美食点评平台的评论区跟帖“玩梗”,晒出波龙、帝王蟹等海鲜美食图片,替店老板发声鸣不平。这家备受热捧的小店位于巷子里,面积约10平方米。厨房和打…

数据库 | timescaledb性能初步测试

数据库docker限制资源:CPU 4核,内存 8G。数据库版本:2.15.1-pg16 表结构和索引如下: CREATE TABLE dm_tag_value (id BIGINT NOT NULL DEFAULT 0,ds_id BIGINT DEFAULT NULL,tag_name VARCHAR(200) DEFAULT NULL,tag_value VARCH…

CVE-2019-0193源码分析与漏洞复现

漏洞概述 漏洞名称:Apache Solr DataImportHandler 远程代码执行漏洞 漏洞编号:CVE-2019-0193 CVSS 评分:9.8 影响版本:Apache Solr 1.3 - 8.2.0 修复版本:Apache Solr ≥ 8.2.0 漏洞类型:输入验证缺陷导致…

圣杯布局和双飞翼布局的实现方法

目录 一、圣杯布局 1.传统布局floatmargin 2.使用flex布局 3.使用grid网格布局 二、双飞翼布局 一、圣杯布局 1.传统布局floatmargin 使用传统的float浮动和相对定位来实现 <div class"main-container"><div class"main"></div><div …

第4讲、Odoo 18 模块系统源码全解与架构深度剖析【modules】

引言 Odoo 是一款强大的开源企业资源规划&#xff08;ERP&#xff09;与客户关系管理&#xff08;CRM&#xff09;系统&#xff0c;其核心竞争力之一在于高度模块化的架构设计。模块系统不仅是 Odoo 框架的基石&#xff0c;更是实现功能灵活扩展与定制的关键。本文将结合 Odoo…

一台笔记本实现基因表达敲除?!scTenifoldKnk 单细胞基因模拟敲除教程

生信碱移 单细胞基因模拟敲除 scTenifoldKnk 是一种基于单细胞RNA测序数据进行虚拟基因敲除分析的方法&#xff0c;能够用于预测特定基因在某一细胞群体中敲低后的整体基因表达谱变化&#xff0c;也可以扩展到多细胞群体的敲除分析。 基因扰动实验是研究特定基因功能作用的强大…

高架疑车道减少致车辆高坠人员伤亡 死者家属称正商量赔偿

据澎湃新闻报道,有网友反映,5月19日,其侄儿驾车经过广东东莞环莞快速路虎门段,由于四车道变三车道,车辆从高架冲出路面后高坠,车内人员出现伤亡。5月29日,极目新闻记者致电东莞市应急管理局询问事故处置情况,接线人员表示,公安机关在负责处理此事。虎门交警工作人员也…

76岁男子长期吸烟被确诊为肺癌晚期 放射性粒子植入治疗成功实施

5月29日,上海交通大学医学院附属第九人民医院呼吸与危重症医学科戈霞晖主任医师团队成功为一名76岁的小细胞肺癌晚期患者实施了放射性碘125粒子植入治疗,实现了肿瘤的“定点爆破”。这种植入术能够持续释放低剂量γ射线,最大程度破坏肿瘤组织,并有效保护周围正常组织。这名…

成都27岁女子在家门口被害 凶手父亲抱怨因此事有家难回

女儿被杀已属最大不幸,还要承受凶手父亲的抱怨,这让人情何以堪?成都27岁女子王某雅在家门口被杀,凶手的父亲竟称:“就这事害我们有家不能回,花钱在外面住宾馆。”被害的王某雅,海归硕士,喜欢跳舞,平时在家线上办公。她是人们口中“别人家的孩子”,是母亲王女士的骄傲…

1.什么是node.js、npm、vue

一、Node.js 是什么&#xff1f; &#x1f63a; 定义&#xff1a; Node.js 是一个基于 Chrome V8 引擎的 JavaScript 运行时环境&#xff0c;让你可以在浏览器之外运行 JavaScript 代码&#xff0c;主要用于服务端开发。 &#x1f63a;从计算机底层说&#xff1a;什么是“运…

续肉不停!广东潮汕菜市场的猪脚饭要蹲着吃

广东潮汕菜市场的猪脚饭要蹲着吃,在广东潮汕地区,猪脚分为两大门派,一派是隆江,一派为东里,与隆江猪脚一整只卤制不同,东里猪脚要对半分开,切断骨头,是为了让骨髓融入卤汁,令猪脚更易入味。经过炖煮的猪脚和肉,吸足了卤汁,皮胶肉烂,油光水滑,酥香软糯得入口即化,…

库存翻番,赠送股东!五芳斋粽子,卖不动了?BUG:股东申领热情高

五芳斋近日宣布向股东赠送粽子礼盒,引发广泛关注。根据公告,截至4月28日交易结束,在中国证券登记结算有限责任公司上海分公司登记在册的持有公司股份1000股(含)以上的股东,每位可以申领“丰年五芳”粽子礼盒一盒,申领时间为2025年5月28日至6月8日。然而,市场对此反应冷…

男子杀害摊主潜逃27年落网 乡音暴露身份密码

27年前,21岁的外省小伙阿亮在当地与一猪肉摊摊主发生口角,一时冲动持刀将其杀害后隐姓埋名潜逃。当时的技术条件有限,警方追凶工作一度陷入瓶颈。27年后,阿亮辗转逃至扬州仪征。仪征警方凭借一句乡音破解了他的“身份密码”,成功将其抓获归案,这起尘封多年的命案积案终于…

郑大一附院世界最大的医院原院长阚全程被查

“宇宙第一大医院”郑大一附院原院长阚全程被查,医疗圈人称其“阚十亿”。责任编辑:zx0002