机器学习与深度学习01--线性回归

article/2025/7/15 15:46:26

目录

      • 1.什么是线性回归
      • 2.如何用数学方式描述简单线性回归模型
      • 3.什么是最小二乘法,他有什么作用

1.什么是线性回归

线性回归是⼀种⼴泛⽤于统计学和机器学习中的回归分析⽅法,⽤于建⽴⾃变量(特征)与因变量(⽬标)之间的线性关系模型。线性回归的基本原理是寻找⼀条直线(或者在多维情况下是⼀个超平⾯),以最佳地拟合训练数据,使得模型的预测与真实观测值之间的误差最⼩化。下⾯我们来详细解释线性回归的基本原理和假设。
简单线性回归模型:
多元线性回归模型:在这里插入图片描述
其中:
y是因变量(需要预测的值)
x1,x2,…xp是自变量(特征值),可以是一个或者多个。
b0是截距(模型在⾃变量都为0时的预测值)。
b1,b2,…bp是回归系数,表示⾃变量对因变量的影响程度。

线性回归的⽬标是找到合适的回归系数b1,b2,…bp ,以最小化模型的预测误差。通常采⽤最小⼆乘法来估计这些系数,即使得观测值与模型预测值之间的残差平⽅和最小。
线性回归模型的有效性基于以下⼀些关键假设:
1、线性关系假设:线性回归假设因变量和⾃变量之间存在线性关系。这意味着模型试图用⼀条直线(或超平⾯)来拟合数据,以描述⾃变量与因变量之间的关系。
2、独⽴性假设:线性回归假设每个观测值之间是相互独⽴的。这意味着⼀个观测值的误差不受其他观测值的影响。
3、常数方差假设:线性回归假设在⾃变量的每个取值点上,观测值的误差方差都是常数。这被称为同方差性或等⽅差性。
4、正态性假设:线性回归假设观测值的误差服从正态分布。这意味着在不同⾃变量取值点上的误差应该接近正态分布。
如果这些假设不满足,线性回归模型的结果可能不可靠。

2.如何用数学方式描述简单线性回归模型

简单线性回归模型是⼀种⽤于建⽴⾃变量和因变量之间线性关系的统计模型。以下是如何⽤数学方式描述简单线性回归模型的基本元素:
1、自变量(Independent Variable):在简单线性回归中,自变量通常表示为x。它是⼀个特征或输⼊,是我们用来预测因变量的变量。自变量是独⽴于其他变量的,也就是我们不对其做任何改变,而是观察它的取值。
2、因变量(Dependent Variable):在简单线性回归中,因变量通常表示为y 。它是我们希望预测或解释的变
量。因变量的取值依赖于⾃变量的取值,我们的⽬标是建⽴⼀个模型,通过自变量的取值来预测因变量的取值。
3、线性关系:简单线性回归模型假设⾃变量 和因变量 之间存在线性关系。这个线性关系可以⽤以下⽅程表示:在这里插入图片描述
其中, y是因变量,x 是⾃变量, β0是截距(模型在⾃变量为0时的预测值), β1是斜率(⾃变量x对因变量
y的影响程度)。这两个参数β0和 β1是线性回归模型的参数,也称为回归系数或权重。
4、误差项(Error Term):线性回归模型还包括⼀个误差项,通常表示为 。误差项表示了模型⽆法完美拟合真实数据的部分,它包括了所有未被模型考虑的因素,如测量误差、未知变量等。因此,完整的模型⽅程可以写成:在这里插入图片描述我们的⽬标是通过最小化误差项来估计参数β0和 β1,使得模型的预测值与真实观测值尽可能接近。
简单线性回归模型是⼀个描述⾃变量和因变量之间线性关系的数学模型,通过最小化误差项来估计模型的参数β0和 β1,从而可以用自变量的取值来预测因变量的取值。
这是⼀种非常实⽤且务实的⼯具,用于理解和预测变量之间的关系,例如预测销售量与⼴告支出之间的关系或温度与冰淇淋销售量之间的关系等等。

3.什么是最小二乘法,他有什么作用

最小二乘法(OLS,Ordinary Least Squares)是⼀种用于估计线性回归模型参数的常用统计方法。
主要作用是通过最小化观测值与模型预测值之间的残差平方和来确定最佳拟合线性回归模型的参数。
最小二乘法的原理在线性回归中,我们假设自变量和因变量之间存在线性关系,可以用以下模型表示:
在这里插入图片描述
其中:
y是因变量(需要预测的值)。
x是⾃变量(特征)。
β0是截距(模型在自变量为0时的预测值)。
β1是斜率(自变量对因变量的影响程度)。
ε是误差项,表示模型⽆法完美拟合真实数据的部分。
最小二乘法的目标是找到最佳的β0和 β1,使得观测值yi和对应的模型预测值yî之间的残差(差值)的平方和
最小化:在这里插入图片描述其中, n是样本数量,yî是根据模型预测的值。
最⼩⼆乘法可以通过以下公式来估计参数β0和 β1:在这里插入图片描述
其中, x拔和y拔分别是⾃变量x和因变量y的均值。
最小二乘法的原理被内部自动应用,从⽽估计出最佳的回归系数β0和 β1。这些系数将用于构建最佳拟合线性模型,以最小化观测值和模型预测值之间的残差平方和。


http://www.hkcw.cn/article/hLhyliHHKy.shtml

相关文章

004时装购物系统技术解析:构建智能时尚消费平台

时装购物系统技术解析:构建智能时尚消费平台 在电商行业蓬勃发展的当下,时装购物系统凭借其便捷性与多样性,成为消费者选购时尚单品的重要渠道。该系统通过商品信息、订单管理等核心模块,结合前台展示与后台录入功能,…

无线通信模块简介

QuecPython 是运行在无线通信模块上的开发框架。对于首次接触物联网开发的用户而言,无线通信模块可能是一个相对陌生的概念。本文主要针对无线通信和蜂窝网络本身,以及模块的概念、特性和开发方式进行简要的介绍。 无线通信和蜂窝网络 物联网对无线通信…

从认识AI开始-----解密门控循环单元(GRU):对LSTM的再优化

前言 在此之前,我已经详细介绍了RNN和LSTM,RNN虽然在处理序列数据中发挥了重要的作用,但它在实际使用中存在长期依赖问题,处理不了长序列,因为RNN对信息的保存只依赖一个隐藏状态,当序列过长,隐…

历年西北工业大学计算机保研上机真题

2025西北工业大学计算机保研上机真题 2024西北工业大学计算机保研上机真题 2023西北工业大学计算机保研上机真题 在线测评链接:https://pgcode.cn/school 计算整数乘积 题目描述 给定 n n n 组数,每组两个整数,输出这两个整数的乘积。 …

ansible-playbook 进阶 接上一章内容

1.异常中断 做法1:强制正常 编写 nginx 的 playbook 文件 01-zuofa .yml - hosts : web remote_user : root tasks : - name : create new user user : name nginx-test system yes uid 82 shell / sbin / nologin - name : test new user shell : gete…

基于cornerstone3D的dicom影像浏览器 第二十七章 设置vr相机,复位视图

文章目录 前言一、VR视图设置相机位置1. 相机位置参数2. 修改mprvr.js3. 调用流程1) 修改Toolbar3D.vue2) 修改View3d.vue3) 修改DisplayerArea3D.vue 二、所有视图复位1.复位流程说明2. 调用流程1) Toolbar3D中添加"复位"按钮,发送reset事件2) View3d.vu…

以色列防长:哈马斯要么接受美方提案 要么面临毁灭

当地时间5月30日,以色列国防部长卡茨通过其个人社交媒体账号发表声明称,在以军强大的军事压力之下,巴勒斯坦伊斯兰抵抗运动(哈马斯)将被迫接受选择:接受美方提出加沙停火提案,或者被以色列消灭。△以色列国防部长卡茨(资料图)卡茨在声明中表示,当前以军正全力在加沙地…

古巴外交部召见美国临时代办 抗议其无礼行为

△古巴哈瓦那(资料图)当时间5月30日,古巴外交部召见了美国驻古巴临时代办迈克哈默(Mike Hammer)并表示,迈克哈默自2024年11月抵达古巴以来,对古巴表现出的不友好行为,既不符合他外交官的身份,也表现了对古巴人民的不尊重。古巴外交部美国双边事务总司主任加西亚向迈克…

Java处理动态的属性:字段不固定、需要动态扩展的 JSON 数据结构

引言 应用场景: 签名测试接口、表单配置项、参数列表、插件信息等。技术实现:JSONObject 接收、使用json格式的字符串,或者@JsonAnySetter/@JsonAnyGetter注解方法来处理动态的属性。I JSONObject 接收和返回 例子:表单配置 接口对应的表单配置信息 JSONObject 接收和返回…

leetcode1201. 丑数 III -medium

1 题目:1201. 丑数 III. 官方标定难度:中 丑数是可以被 a 或 b 或 c 整除的 正整数 。 给你四个整数:n 、a 、b 、c ,请你设计一个算法来找出第 n 个丑数。 示例 1: 输入:n 3, a 2, b 3, c 5 输出…

【Oracle】DML语言

个人主页:Guiat 归属专栏:Oracle 文章目录 1. DML概述1.1 什么是DML?1.2 DML的核心功能 2. INSERT语句详解2.1 基础插入操作2.2 子查询插入2.3 多表插入2.4 批量插入优化 3. UPDATE语句详解3.1 基础更新操作3.2 关联更新3.3 批量更新优化 4. …

安装启动Mosquitto以及问题error: cjson/cJSON.h: No such file or directory解决

安装Mosquitto 在官方下载地址:https://mosquitto.org/files/source/ 选择版本下载 安装环境是linux centos7,上传 mosquitto-2.0.18.tar.gz 文件到 /mqtt 文件夹下 tar -xvf mosquitto-2.0.18.tar.gz #解压 cd mosquitto-2.0.18/ #切换到解压目录下…

附件上传唯一性校验

1. Overridepublic String uploadFile(MultipartFile file, String id, String funNo, String ctType) {//TODO 附件重复判断// 计算文件哈希值// 将MultipartFile转换为临时File对象String fileHash "";try {File tempFile convertMultipartFileToFile(file);// …

正点原子AU15开发板!板载40G QSFP、PCIe3.0x8和FMC LPC等接口,性能强悍!

正点原子AU15开发板!板载40G QSFP、PCIe3.0x8和FMC LPC等接口,性能强悍! 正点原子AU15开发板搭载Xilinx Artix UltraScale 系列FPGA,核心板主控芯片的型号是XCAU15P-FFVB676-2I。开发板由核心板+底板组成,外…

Attention-> flashAttention材料参考

1、 一文看懂 Attention(本质原理3大优点5大类型)_attention结构-CSDN博客2​​​​​​​2https://blog.csdn.net/haima1998/article/details/107845549 2、 一文看懂 NLP 里的模型框架 Encoder-Decoder 和 Seq2Seq (easyai.tech) 3、 详解深度学习…

MySQL高可用集群

https://dev.mysql.com/doc/mysql-shell/8.4/en/mysql-innodb-cluster.html 1 什么是MySQL高可用集群 MySQL高可用集群:MySQL InnoDB ClusterInnoDB Cluster是MySQL官方实现高可用读写分离的架构方案,包含以下组件 MySQL Group Replication:简…

山洪灾害声光电监测预警解决方案

一、方案背景 我国是一个多山的国家,山丘区面积约占国土面积的三分之二。每年汛期,受暴雨等因素影响,极易引发山洪和泥石流。山洪、泥石流地质灾害具有突发性、流速快、流量大、物质容量大和破坏力强等特点,一旦发生,将…

2025年最新工程项目管理系统应该具备哪些模块?

随着数字化转型浪潮席卷工程行业,工程项目管理系统的作用愈发凸显。2025年,工程项目管理系统的核心目标不仅是提升项目效率,更在于通过智能化、集成化技术实现全生命周期的精细化管理。基于行业趋势和企业实际需求,结合金众诚工程…

unity入门:同一文本不同颜色显示

unity入门:同一文本不同颜色显示 同一文本不同颜色显示#RRGGBBAA(带透明度)用法 同一文本不同颜色显示 在Unity中,如果想让文本中的某一部分显示不同的颜色,可以使用富文本(Rich Text)标记,在字符串中插入…

128、STM32H723ZGT6实现串口IAP

Bootloader程序通过串口接收*.bin文件数据,写入到内部flash区域,然后跳转APP应用程序 flash读写数据参考我的博客:127、stm32h743XI内部flash 注意:H723系列flash必须32字节写入,并且擦除时别重启|断电,不然…