顶会新热门:机器学习可解释性

article/2025/7/27 15:28:36

 

🧀机器学习模型的可解释性一直是研究的热点和挑战之一,同样也是近两年各大顶会的投稿热门。

🧀这是因为模型的决策过程不仅需要高准确性,还需要能被我们理解,不然我们很难将它迁移到其它的问题中,也很难进行算法的debug。

🧀更重要的是,提高机器学习可解释性可以帮助我们提高模型的透明度和用户信任度,还能引导模型的开发和优化过程,有效识别和防止潜在的偏差问题,这对金融、医疗等领域至关重要。

🧀目前这方向有四种主流方法:局部解释性方法、全局解释性方法、基于规则的解释性方法和机制性解释性方法。为了方便大家找idea,我根据这四种方法整理好了15篇最新的论文,开源代码已附,想发论文的朋友别错过。

有需要的小伙伴可以关注人人人人公众号(AI科技探寻)免费领取

我还整理出了相关的论文+开源代码,以下是精选部分论文

 

论文1

标题:

Further Insights: Balancing Privacy, Explainability, and Utility in Machine Learning-based Tabular Data Analysis

进一步见解:平衡基于机器学习的表格数据分析中的隐私性、可解释性和效用性

法:

    • 隐私保护机制:采用(𝜖,𝛿)-差分隐私与生成对抗网络(GAN)相结合的方法,通过向数据中添加噪声来保护隐私。

    • 效用评估:通过比较模型在原始数据集和匿名化数据集上的准确率来量化数据效用损失。

    • 可解释性评估:使用多种模型解释方法,如模型性能评估、变量重要性分析、部分依赖曲线(PD)和累积局部依赖(AL)曲线,来评估模型的可解释性。

    • 优化方法:定义了一个综合的权衡标准,通过线性优化方法和兼容性矩阵,系统地探索不同的隐私参数配置,以找到最优的隐私增益和可解释性相似度,同时最小化效用损失。

    创新点:

    • 隐私与效用的平衡:通过优化方法,成功地在保护隐私的同时,最小化了数据效用的损失。例如,在使用Logistic回归分类器时,当隐私参数𝜎=1时,隐私增益达到最大,同时效用损失保持在较低水平。

    • 可解释性的提升:通过引入多种解释方法,显著提高了模型的可解释性。例如,对于Gaussian NB分类器,使用变量重要性解释方法时,可解释性相似度在𝜎=0.8时达到0.58,表明模型在隐私保护下仍能提供高质量的解释。

    • 综合权衡标准:提出了一个综合的权衡标准,能够同时考虑隐私、效用和可解释性,为实际应用中平衡这些因素提供了有效的工具。通过兼容性矩阵,能够为不同的分类器和数据集找到最优的配置,确保在隐私保护和模型解释性之间达到最佳平衡。

     

    论文2

    标题:

    Investigating Adversarial Attacks in Software Analytics via Machine Learning Explainability

    通过机器学习可解释性研究软件分析中的对抗性攻击

    法:

    • 对抗性攻击方法:提出了一种基于机器学习可解释性的对抗性攻击方法,通过修改模型解释技术识别的前𝑘个重要特征来生成对抗性样本。

    • 特征重要性评估:使用SHAP、LIME和PyExplainer等可解释性技术来识别对模型决策影响最大的特征。

    • 攻击效果评估:通过攻击成功率(ASR)指标来评估对抗性攻击的效果,同时考虑了攻击的不可感知性(ℓ0扰动)。

    • 多目标优化:采用多目标优化方法,同时最大化ASR和最小化需要修改的特征数量,以实现攻击效果和不可感知性之间的平衡。

    创新点:

    • 攻击成功率的显著提升:通过修改仅前3个重要特征,攻击成功率(ASR)最高可达86.6%,显著高于现有方法。例如,在使用SHAP解释方法时,对Postgres数据集的攻击成功率达到了80.3%。

    • 不可感知性的优化:在保持高攻击成功率的同时,通过最小化ℓ0扰动,确保了攻击的不可感知性。与现有方法相比,该方法在不可感知性方面表现更优,例如在对CLCDSA数据集的攻击中,仅需修改1个特征即可达到61.4%的ASR。

    • 对多种模型和数据集的普适性:该方法不仅适用于单一模型或数据集,而且在多种机器学习模型和软件分析任务数据集上均表现出色,具有广泛的适用性。

     

    论文3

    标题:

    Regulating Explainability in Machine Learning Applications – Observations from a Policy Design Experiment

    监管机器学习应用中的可解释性——政策设计实验的观察

    方法:

    • 跨学科合作:通过跨学科团队(包括AI和政策背景的研究人员)的持续合作,进行为期十周的实验研究,共同设计可解释性政策。

    • 迭代政策设计:采用迭代方法,每周进行政策草案的制定、尝试遵守和评估,逐步改进政策内容。

    • 证据评估:讨论和评估不同类型的证据(如技术解释、用户研究等)在证明政策合规性中的作用。

    • 案例研究:基于医疗和金融领域的实际案例,评估政策在不同场景下的适用性和有效性

    创新点:

      • 政策设计的可行性验证:通过实验验证了跨学科团队在短时间内设计出可行的可解释性政策的可能性,为政策制定提供了新的思路和方法。

      • 政策内容的改进:通过迭代过程,显著改进了政策内容,使其更加具体、可操作和可执行。例如,在第七周的政策草案中,详细规定了对最终用户和受影响用户的解释要求。

      • 证据评估的重要性:强调了在政策设计过程中讨论证据的重要性,特别是用户研究在评估解释有效性中的关键作用。这一发现为政策制定提供了新的视角,确保政策不仅在技术上可行,而且在实际应用中有效。

       

      论文4

      标题:

      The efficacy of machine learning models in lung cancer risk prediction with explainability

      机器学习模型在肺癌风险预测中的效能与可解释性

      法:

      • 数据集分析:使用包含22个肺癌相关特征的公开数据集,分析特征之间的关系和分布。

      • 模型选择与训练:选择并训练了四种机器学习模型(SVM、KNN、DT、RF),通过网格搜索算法进行超参数调优,以提高模型性能。

      • 模型解释方法:使用决策边界、LIME和决策树提取等方法对模型的预测结果进行解释,提高模型的可解释性。

      • 性能评估:通过交叉验证和测试集评估模型的准确率、精确率、召回率和F1分数,同时分析学习曲线以评估模型的训练效果。

      创新点:

        • 模型性能的显著提升:通过超参数调优,四种模型的准确率均达到了99%以上,其中SVM和KNN的准确率从95%和92%分别提升到100%和99%,显著提高了模型的预测性能。

        • 可解释性的增强:通过多种解释方法,为非技术用户提供了模型决策的逻辑解释,增强了用户对模型的信任。例如,使用LIME方法解释KNN模型时,能够清晰地展示影响预测结果的关键特征及其值范围。

        • 实际应用的可行性:研究结果表明,这些机器学习模型不仅在性能上表现出色,而且在实际应用中具有高度的可行性和可解释性,为肺癌风险预测提供了有力的工具。

         

         

         

         


        http://www.hkcw.cn/article/ZdPnrGuTuF.shtml

        相关文章

        MicroPython+L298N+ESP32控制电机转速

        要使用MicroPython控制L298N电机驱动板来控制电机的转速,你可以通过PWM(脉冲宽度调制)信号来调节电机速度。L298N是一个双H桥驱动器,可以同时控制两个电机的正反转和速度。 硬件准备: 1. L298N 电机控制板 2. ESP32…

        Chainlink:连接 Web2 与 Web3 的去中心化桥梁

        区块链技术通过智能合约实现了去中心化的自动执行,但智能合约无法直接访问链下数据,限制了其在现实世界的应用。Chainlink 作为去中心化预言机网络,以信任最小化的方式解决了这一问题,成为连接传统互联网(Web2&#xf…

        杨传辉:构建 Data × AI 能力,打造 AI 时代的一体化数据底座|OceanBase 开发者大会实录

        5 月 17 日,OceanBase 在广州举办第三届开发者大会。主论坛环节,OceanBase CTO 杨传辉系统阐述了 Data AI 战略,并正式推出三大产品:PowerRAG、共享存储 及OceanBase桌面版。 杨传辉指出,数据与AI模型的一体化融合&a…

        AU6825集成音频DSP的2x32W数字型ClaSSD音频功率放大器(替代TAS5825)

        1.特性 ● 输出配置 - 立体声 2.0: 2 x 32W (8Ω,24V,THD N 10%) - 立体声 2.0: 2 x 26W (8Ω,21V,THD N 1%) ● 供电电压范围 - PVDD:4.5V -26.4V - DVDD: 1.8V 或者 3.3V ● 静态功耗 - 37mA at PVDD12V ● 音频性能指标 - THDN ≤ 0.02% at 1W,1kHz - SNR ≥ 107dB (A-wei…

        关于ADS分辨率问题

        笔记本上使用ADS(Advanced Design System )默认的界面挺大的,图标和字体都大,界面清新,给人一种呆呆易上手的感觉。 整个屏幕的截图 直到我打开了这个OPTIM的选项卡,它太长了,由于缩放太大&am…

        海外DeepLink方案复杂?用openinstall一站式链接世界

        App出海难免水土不服,商业模型、用户画像、增长方向没有一样是省心的,国内标配的DeepLink(深度链接)方案如果照搬出海同样无法达到最佳体验。 要知道国内外移动端生态是截然不同的,除了主流的URL Scheme和iOS Univers…

        Ollama(1)知识点配置篇

        ollama已经成功安装成功后,通常大家会对模型的下载位置和访问权限进行配置 1.模型下载位置修改 都是修改系统环境变量。 (1)默认下载位置 macOS: ~/.ollama/modelsLinux: /usr/share/ollama/.ollama/modelsWindows: C:\Users\你的电脑用户…

        C# SolidWorks二次开发-实战1,找文件名不同实体相同的零件。

        今天这篇文章话题来源于群里的聊天,在讨论有些插件功能的开发原理。 如标题,今天讲的是如何查找零件文件名不一样,但实际可能是同一个东西的办法。 - 题外话 熟悉Solidworks的人都知道,Solidworks有一个比较零件或者特征不同点的…

        ES5时代的残党(被ES6淘汰的JS写法)

        近年来,JavaScript语言经历了翻天覆地的变化。ES6(ECMAScript 2015)的发布标志着JavaScript进入了现代化时代,带来了大量新特性和更优雅的写法。但时至今日,许多开发者仍然固守着ES5时代的老旧模式,这不仅使代码显得过时&#xff…

        【Python】4.字典和文件

        文章目录 一、字典1、字典是什么?2、创建字典3、查找 key4、新增/修改元素5、删除元素6、遍历字典元素7、取出所有 key 和 value8、合法的 key 类型小结 二、文件1、文件是什么?2、文件路径3、文件操作1)打开文件2)关闭文件3&…

        物流项目第十一期(智能调度之分配快递员)

        本项目专栏: 物流项目_Auc23的博客-CSDN博客 整体核心业务流程 关键流程说明: 用户下单后,会产生取件任务,该任务也是由调度中心进行调度的订单转运单后,会发送消息到调度中心,在调度中心中对相同节点的运…

        React 项目中封装 Excel 导入导出组件:技术分享与实践

        文章目录 前言一、为什么需要封装 Excel 组件?二、技术选型三、核心实现1. 安装依赖2. 封装Excel导出3. 封装导入组件 (UploadExcel) 总结 前言 在 React 项目中,处理 Excel 文件的导入和导出是常见的业务需求。无论是导出报表数…

        用calibredrv提取版图中指定类型cell,保留位置信息并输出新的gds

        我正在「拾陆楼」和朋友们讨论有趣的话题,你⼀起来吧? 拾陆楼知识星球入口 现在有一个gds,其中的bump位置信息是我们需要的,如何从现有的gds中提取我们需要的部分呢? 需要用到工具calibredrv,如果数量少,可以用图形界面操作,方法如下: 01 打开gds calibredrv -m inp…

        iOS 使用CocoaPods 添加Alamofire 提示错误的问题

        Sandbox: rsync(59817) deny(1) file-write-create /Users/aaa/Library/Developer/Xcode/DerivedData/myApp-bpwnzikesjzmbadkbokxllvexrrl/Build/Products/Debug-iphoneos/myApp.app/Frameworks/Alamofire.framework/Alamofire.bundle把这个改成 no 2 设置配置文件

        Python基本运算符

        White graces:个人主页 🐹今日诗词:相恨不如潮有信,相思始觉海非深🐹 ⛳️点赞 ☀️收藏⭐️关注💬卑微小博主🙏 ⛳️点赞 ☀️收藏⭐️关注💬卑微小博主🙏 目录 🧮 Pyt…

        nginx: [emerg] bind() to 0.0.0.0:80 failed (10013: 80端口被占用

        Nginx启动报错:nginx: [emerg] bind() to 0.0.0.0:80 failed (10013: An attempt was made to access a socket in a way forbidden by its access permissions) 这个报错代表80端口被占用 先查看占用80的端口 netstat -aon | findstr :80 把它杀掉,强…

        vscode命令行debug

        vscode命令行debug 一般命令行debug会在远程连服务器的时候用上,命令行debug的本质是在执行时暴露一个监听端口,通过进入这个端口,像本地调试一样进行。 这里提供两种方式: 直接在命令行中添加debugpy,适用于python…

        (笔记+作业)第五期书生大模型实战营---L1G2000 OpenCompass 评测书生大模型实践

        学员闯关手册:https://aicarrier.feishu.cn/wiki/QdhEwaIINietCak3Y1dcdbLJn3e 课程视频:https://www.bilibili.com/video/BV13U1VYmEUr/ 课程文档:https://github.com/InternLM/Tutorial/tree/camp4/docs/L0/Python 关卡作业:htt…

        激光雷达的强度像和距离像误差与噪声分析(1)2025.5.30

        激光雷达的强度像和距离像在测量过程中可能受到多种误差和噪声的影响,这些因素既包括硬件本身的物理特性,也涉及环境条件和算法处理等外部因素。以下是主要误差类型、噪声来源及其关键影响因素的综合分析: 一、强度像的误差与噪声 能量信号…

        uboot移植之IOMUX介绍

        本章节主要讲,如何将NXP官方i.MX6ULL EVK评估板的uboot源码移植适配到ELF 1开发板。本身uboot的作用就是启动内核,只要能成功启动内核,uboot使命便已完成。但是从开发调试的角度来讲,有时候我们需要在uboot阶段使用一些外设接口方…