逻辑回归知识点

article/2025/8/26 7:18:42

一、逻辑回归概念

逻辑回归(Logistic Regression)是一种广泛应用于分类问题的统计方法,尤其适用于二分类问题。

注意: 尽管名称中有"回归"二字,但它实际上是一种分类算法。

解决二分类的问题

API:sklearn.linear_model.LogisticRegression

二、核心函数

Sigmoid函数:\sigma \left ( z \right )=\frac{1}{1+e^{-z}}

其中z=w^{T}+b,w是权重向量,x是特征向量,b是偏置项。

三、逻辑回归原理和优化手段

1.原理:(核心思想)逻辑回归通过将线性回归的输出映射到(0,1)区间,使用Sigmoid函数将连续值转换为概率值,然后根据概率值进行分类预测。

2.优化手段:极大似然估计和最小化交叉熵。

极大似然估计:(MLE,即 Maximum Likelihood Estimation)

        是一种统计方法,用于从观测数据中估计概率分布的参数。核心思想是“在已知观测数据的情况下,选择使得这些数据出现概率最大的参数值。”

        二分类公式:

L\left ( p \right )=\prod_{i=1}^{n}p^{y_{i}}\left ( 1-p \right )^{1-y_{i}}

其中y_{i}表示第i个样本的真实标签,取值为0或1(1表示成功,0表示失败),p是模型预测的“成功”概率(即P\left ( y_{i}=1 \right )),是带估计的参数。

最小化交叉熵:交叉熵损失函数(Cross-Entropy Loss),也称为对数损失(Log Loss)

        交叉熵是衡量两个概率分布(真实分布 y和预测分布 p)差异的指标

        二分类公式:

Loss\left ( L \right )=-\sum_{i=1}^{m}\left ( y_{i}ln\left ( p_{i} \right )+\left ( 1-y_{i} \right )ln\left ( 1-p_{i} \right ) \right )

其中y_{i}表示第i个样本的真实标签,通常取值0或1(二分类问题),p_{i}表示模型预测的第i个样本属于类别1的概率(即P\left ( y_{i}=1|x_{i} \right )
 

关系:先用伯努利分布的似然函数,然后对其取负对数,直接得到交叉熵损失,然后不断的梯度下降迭代更新找到最优参数!(把最大化问题将其变为最小化问题,把连乘问题将其变为连加问题)

四、混淆矩阵

1.概念

        混淆矩阵是机器学习中用于评估分类模型性能的表格。它展示了模型的预测结果与实际标签的对比情况。

2.图解

3.作用

          直观显示模型的分类错误类型(如误诊、漏检),计算关键指标:准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1分数等。

五、分类结果评价指标

1.准确率(Accuracy_score)

准确率 = 预测正确的样本数 / 总样本数        其中预测正确指的是预测结果 = 真实结果(包含正例以及反例)

Accuracy=\frac{TP+TN}{TP+TN+FP+FN}

2.精确率(Precision_score) 

精确率 是 真实结果中正例的个数 除以 预测结果中正例的个数

P=\frac{TP}{TP+FP}

3.召回率(Recall_score)

召回率 是 预测结果中正例的个数 除以 真实结果中正例的个数

P=\frac{TP}{TP+FN}

4.F1-score

对模型的精确率和召回率都有要求,希望知道模型在这两个评估方向的综合预测能力

P=\frac{2*Precision*Recall}{Precision+Recall}

5.ROC曲线

概念:ROC曲线以模型的真正率为纵轴,假正率为横轴,它将模型在不同阈值下的表现以曲线的形式展现出来。

真正率: 正样本中被预测为正样本的概率TPR (True Positive Rate)

假正率: 负样本中被预测为正样本的概率FPR (False Positive Rate)

6.AUC面积

ROC曲线下方的面积,AUC越大,代表分类器越好


http://www.hkcw.cn/article/qSpMXxPiIf.shtml

相关文章

【excel宏基础】“在第一格按下ctrl+下箭头跳到最后一格的过程没有被记录在代码中,导致录入信息的时,不能实现自动找到最后一格录入信息”问题解决方法之一

一、问题描述 需求:在“信息录入”表中输入姓名、部门、身份证,点击“确认”,使信息自动录入到信息汇总的“引用表”中。 问题:录制宏时,按照三的视频教程,在第一格按下ctrl下箭头跳到最后一格的过程没有…

《智能医学》征稿通知:7天可见刊,专科及以上可发表

香港科学出版社(Hong Kong Scientific Publishers Journals)是一家全球独立高质量的学术出版机构,遵循国际开放获取的出版(OA)原则。现已与科检易学术携手共同征集高质量文章。目前可出版来自高等学校、科研院所和企业的先进科技成果。包括理、工、农、医、经、管、…

2025.05.29【Network】多组学分析:网络互作图绘制

Customization Explore all the parameters offered by the igraph package to customize chart appearance. Layout algorithm Several layout algorithm are offered by the igraph package. Learn how to use them and what are the possibilities. 文章目录 Customizatio…

如何选择适合团队的项目管理工具

选择适合团队的项目管理工具需综合考虑团队规模、项目类型、使用便捷性、功能丰富性、成本预算等因素,其中团队规模的匹配度尤为重要,不同规模团队适用的项目管理工具也不尽相同,合适的工具能够有效提高团队协作效率。 一、团队规模与工具匹配…

基于ubuntu安装hadoop

前言 提起大数据,就会觉得很厉害,将众多的数据整合在一起,在有条理的呈现在屏幕前的我们。有时候可能会想到底是什么在支撑着大数据,大数据的出现,方便了我们日常生活中的方方面面。那这些海量的数据计算机是怎么存储和…

如何在线免费将音乐伴奏提取

一键分离人声与伴奏!让音乐创作再无边界!有时我们想要学习某首歌曲,需要将人声和伴奏进行分离,如何将音乐人声提取出来呢。 音乐分离工具:在线音乐人声提取 - 分离音频人声与伴奏 - iLoveOFD在线 在线音乐人声提取工…

使用SCSS实现随机大小的方块在页面滚动

目录 一、scss中的插值语法 二、方块在界面上滚动的动画 一、scss中的插值语法 插值语法 #{}‌ 是一种动态注入变量或表达式到选择器、属性名、属性值等位置的机制 .类名:nth-child(n) 表示需同时满足为父元素的第n个元素且类名为给定条件 效果图&#xff1a; <div class…

超高频 RFID 读写器(三格电子)

一、 功能概述 本文档是 SG-UHF80 系列超高频 RFID 读写器产品说明书&#xff0c;包含 SG-UHF80-485、 SG-UHF80-TCP &#xff0c;共两个产品。使用框图如下图所示。 1.1 产品功能 本系列产品用来读写超高频 RFID 标签&#xff0c;支持 Modbus_RTU/ModbusTCP 从站功能。 可实…

Java 微服务架构设计:服务拆分与服务发现的策略

Java 微服务架构设计&#xff1a;服务拆分与服务发现的策略 微服务架构作为一种热门的软件架构风格&#xff0c;在 Java 领域有着广泛的应用。它通过将系统拆分为一组小型服务来实现更灵活、可扩展的系统设计。在微服务架构中&#xff0c;服务拆分和服务发现是两个关键环节。本…

信号量的应用:利用信号量实现进程互斥

设置互斥信号量 下面进行详细解释 1. 信号量定义与初始化 semaphore mutex; mutex 1; // 初始化为1信号量定义&#xff1a;semaphore 是定义信号量的类型 &#xff0c;这里定义了一个名为 mutex 的信号量。信号量是一种用于实现进程同步与互斥的机制&#xff0c;本质上是一个…

多模态大模型:开启智能决策的新时代

想要掌握如何将大模型的力量发挥到极致吗&#xff1f;叶梓老师带您深入了解 Llama Factory —— 一款革命性的大模型微调工具。 1小时实战课程&#xff0c;您将学习到如何轻松上手并有效利用 Llama Factory 来微调您的模型&#xff0c;以发挥其最大潜力。 CSDN教学平台录播地址…

python模块和包

模块 Python模块(Module) 是一个Python文件&#xff0c;以.py结尾&#xff0c;模块能定义函数、类和变量&#xff0c;模块里也能包含可执行的的代码 每一个模块都能帮助我们快速的实现一些功能&#xff0c;比如实现和时间相关的功能就可以使用time模块&#xff0c;我们可以认…

《仿盒马》app开发技术分享-- 订单列表页(端云一体)

开发准备 上一节我们实现了订单详情的展示&#xff0c;但是我们的确认订单页面只在下单成功后才会出现供用户查看&#xff0c;现在我们要有一个常驻的入口让用户去随时查看自己的订单以及订单状态&#xff0c;订单状态分为多个&#xff0c;还需要给用户提供切换的功能 功能分…

【第3章 文本】3.3 文本的定位

文章目录 水平与垂直定位示例textAligntextBaseline 将文本居中文本的度量绘制坐标轴旁边的文本标签在圆弧周围绘制文本 水平与垂直定位 在canvas中使用 strokeText() 或 fillText() 绘制文本时&#xff0c;需要指定所绘文本的 X 和 Y 的坐标&#xff0c;然而&#xff0c;浏览…

C++哈希

一.哈希概念 哈希又叫做散列。本质就是通过哈希函数把关键字key和存储位置建立映射关系&#xff0c;查找时通过这个哈希函数计算出key存储的位置&#xff0c;进行快速查找。 上述概念可能不那么好懂&#xff0c;下面的例子可以辅助我们理解。 无论是数组还是链表&#xff0c;查…

Java中的设计模式实战:单例、工厂、策略模式的最佳实践

Java中的设计模式实战&#xff1a;单例、工厂、策略模式的最佳实践 在Java开发中&#xff0c;设计模式是构建高效、可维护、可扩展应用程序的关键。本文将深入探讨三种常见且实用的设计模式&#xff1a;单例模式、工厂模式和策略模式&#xff0c;并通过详细代码实例&#xff0…

QT6搭建和使用MQTT

QT6搭建和使用MQTT 1.搭建MQTT环境1.下载源码2.CMake 编译 Qt MQTT 模块3.添加QT MQTT模块4.验证测试 2.MQTT的使用 1.搭建MQTT环境 1.下载源码 1.在GitHub下载对应qt版本的源码 git clone git://code.qt.io/qt/qtmqtt.git -b 6.5.3 这里以6.5.3版本的为例。 这里使用的是VS…

深入了解 C# 异步编程库 AsyncEx

在现代应用程序开发中&#xff0c;异步编程已经成为提升性能和响应能力的关键&#xff0c;尤其在处理网络请求、I/O 操作和其他耗时任务时&#xff0c;异步编程可以有效避免阻塞主线程&#xff0c;提升程序的响应速度和并发处理能力。C# 提供了内建的异步编程支持&#xff08;通…

使用 Azure DevOps 管道部署到本地服务器

Azure DevOps 是一个帮助改进 SDLC(软件开发生命周期)的平台。 在本文中,我们将使用 Azure Pipelines 创建自动化部署。 Azure DevOps 团队将 Azure Pipelines 定义为“使用 CI/CD 构建、测试和部署,适用于任何语言、平台和云平台”。 在这里,我将解释如何在 Azure Dev…

NSSCTF-[青海民族大学 2025 新生赛]wenshilou

下载附件得到jpeg图片 放到kali里面用binwalk命令进行分离 分离之后得到文件 点击zip文件里面有个flag&#xff0c;打开得到base64编码 直接放到随波逐流里面解码 得到flag NSSCTF{welcometoQinhaiminzudaxue}