lesson04-简单回归案例实战(理论+代码)

article/2025/8/20 14:40:52

理解线性回归及梯度下降优化

引言

在机器学习的基础课程中,我们经常遇到的一个重要概念就是线性回归。今天,我们将深入探讨这一主题,并通过具体的例子来了解如何利用梯度下降方法对模型进行优化。

线性回归简介

线性回归是一种统计方法,用于确定两个变量之间的关系。简单来说,如果我们有一个自变量 XX 和因变量 YY,线性回归可以帮助我们找到一条最佳拟合直线,这条直线可以用公式 Y=WX+bY=WX+b 来表示,其中 WW 是权重,bb 是偏置。

损失函数

为了评估模型的好坏,我们需要定义一个损失函数。对于线性回归而言,通常使用平方误差作为损失函数,即 loss=(WX+b−y)2loss=(WX+b−y)2。

梯度下降优化

梯度下降是一种迭代优化算法,用来最小化损失函数。每次迭代过程中,我们会更新参数 WW 的值,具体更新规则为 w′=w−lr×∇loss/∇ww′=w−lr×∇loss/∇w,这里的 lrlr 表示学习率,控制着每一步调整的幅度。

迭代优化

通过不断调整 WW 和 bb 的值,使得损失函数逐渐减小,直到达到局部或全局最小值点。这个过程需要多次迭代计算,直至满足预设的停止条件为止。

下一课时预告

接下来的一课时,我们将一起探索著名的MNIST手写数字识别任务,敬请期待!

结语

感谢大家的关注与支持,希望今天的分享能够加深您对线性回归以及梯度下降算法的理解。让我们共同期待下一节课的到来吧!

实战代码

import numpy as np# y = wx + b
def compute_error_for_line_given_points(b, w, points):totalError = 0for i in range(0, len(points)):x = points[i, 0]y = points[i, 1]totalError += (y - (w * x + b)) ** 2return totalError / float(len(points))def step_gradient(b_current, w_current, points, learningRate):b_gradient = 0w_gradient = 0N = float(len(points))for i in range(0, len(points)):x = points[i, 0]y = points[i, 1]b_gradient += -(2/N) * (y - ((w_current * x) + b_current))w_gradient += -(2/N) * x * (y - ((w_current * x) + b_current))new_b = b_current - (learningRate * b_gradient)new_m = w_current - (learningRate * w_gradient)return [new_b, new_m]def gradient_descent_runner(points, starting_b, starting_m, learning_rate, num_iterations):b = starting_bm = starting_mfor i in range(num_iterations):b, m = step_gradient(b, m, np.array(points), learning_rate)return [b, m]def run():points = np.genfromtxt("data.csv", delimiter=",")learning_rate = 0.0001initial_b = 0 # initial y-intercept guessinitial_m = 0 # initial slope guessnum_iterations = 1000print("Starting gradient descent at b = {0}, m = {1}, error = {2}".format(initial_b, initial_m,compute_error_for_line_given_points(initial_b, initial_m, points)))print("Running...")[b, m] = gradient_descent_runner(points, initial_b, initial_m, learning_rate, num_iterations)print("After {0} iterations b = {1}, m = {2}, error = {3}".format(num_iterations, b, m,compute_error_for_line_given_points(b, m, points)))if __name__ == '__main__':run()

🧠 一、代码概述

这段代码的主要目的是:

  • 使用一个简单的线性模型:y = mx + b
  • 给定一个二维数据集 data.csv,其中每行有两个值:x 和 y
  • 使用梯度下降算法迭代地更新 m 和 b,使得预测的 y 尽可能接近真实值
  • 最终输出经过多次迭代后的最优 m 和 b 值,并计算最终误差

📁 二、文件结构说明

  1. 导入库

    import numpy as np
    • 引入 NumPy 库,用于高效的数值计算和数组操作。
  2. 函数定义

    • compute_error_for_line_given_points(b, w, points)
      计算当前直线的平均平方误差(MSE)
    • step_gradient(b_current, w_current, points, learningRate)
      执行一次梯度下降步骤,返回更新后的 b 和 m
    • gradient_descent_runner(points, starting_b, starting_m, learning_rate, num_iterations)
      迭代运行梯度下降过程
    • run()
      主函数,加载数据、调用训练函数、打印结果
  3. 主程序入口

if __name__ == '__main__':run()

 

📌 三、函数详解

1. compute_error_for_line_given_points(b, w, points)

功能:

计算当前模型参数下的均方误差(Mean Squared Error, MSE)

公式:

MSE=1N∑i=1N(yi−(wxi+b))2MSE=N1​i=1∑N​(yi​−(wxi​+b))2

参数:
  • b: 当前截距(bias / y-intercept)
  • w: 当前斜率(weight / slope)
  • points: 数据点集合,是一个二维数组,每行表示一个 (x, y) 点
返回值:
  • 平均误差值(越小越好)

2. step_gradient(b_current, w_current, points, learningRate)

功能:

执行一次梯度下降步骤,根据当前的 bm 更新它们的值。

核心公式(梯度下降更新规则):

b′=b−η⋅∂MSE∂bb′=b−η⋅∂b∂MSE​

m′=m−η⋅∂MSE∂mm′=m−η⋅∂m∂MSE​

其中:

  • ηη 是学习率(learning rate)
  • 梯度是通过对损失函数分别对 b 和 m 求导得到的
导数推导:

∂MSE∂b=2N∑i=1N(yi−(mxi+b))⋅(−1)∂b∂MSE​=N2​i=1∑N​(yi​−(mxi​+b))⋅(−1)

∂MSE∂m=2N∑i=1N(yi−(mxi+b))⋅(−xi)∂m∂MSE​=N2​i=1∑N​(yi​−(mxi​+b))⋅(−xi​)

你在代码中实现了这两个梯度的累加。

返回值:
  • [new_b, new_m]:更新后的模型参数

3. gradient_descent_runner(...)

功能:

循环执行 step_gradient 多次,完成完整的梯度下降过程。

参数:
  • points: 数据集
  • starting_bstarting_m: 初始参数
  • learning_rate: 学习率
  • num_iterations: 迭代次数
输出:
  • 最终的 b 和 m

4. run()

功能:
  • 加载 CSV 数据文件
  • 设置初始参数
  • 调用梯度下降函数进行训练
  • 打印训练前后误差和参数变化

输出结果展示

这表明经过 1000 次迭代后,模型已经基本收敛。


http://www.hkcw.cn/article/oskEyQSBHP.shtml

相关文章

孙颖莎被邱贻可踩脚当场告状 师徒情深趣事多

孙颖莎被邱贻可踩脚当场告状 师徒情深趣事多!昨天,央视体育发布了《体坛零距离》预告片,其中展示了孙颖莎和她的教练邱贻可在巴黎奥运会女单决赛失利后的艰难心路历程。邱贻可提到那时看到乒乓球都会感到不适。在谈到未来是否继续追梦时,孙颖莎坚定表示:“必须的!感谢邱指…

女子称按摩时遭医生猥亵 警方调查

长沙的刘女士因为腰部不舒服,前几天,她找到了位于雨花区城南路附近的高飞林中医诊所进行正骨按摩,可是,接下来发生的事情让她情绪差点崩溃。“5月20号的时候,我去长沙高飞林诊所,因为我的腰椎盘突出,去进行正骨检查,但是医生以腰椎盘突出压迫神经为由,他需要对我进行盆…

leetcode hot100刷题日记——27.对称二叉树

方法一:递归法 class Solution { public:bool check(TreeNode *left,TreeNode *right){//左子树和右子树的节点同时是空的是对称的if(leftnullptr&&rightnullptr){return true;}if(leftnullptr||rightnullptr){return false;}//检查左右子树的值相不相等&a…

接口自动化测试(六)

一、pytest参数化 pytest: pytest.mark.parametrize(argnames,argvalues) 参数化DDT:把对应的数据去进行提取出来进行统一维护 ---- 多组数据pytest.mark.parametrize(argnames,argvalues) pytest.mark.parametrize("参数名",参数数据) 参数数据格式&…

LangChain【1】之认识框架和简单体验

文章目录 参考文章LangChain框架概述LangChain分层结构LangChain环境配置简单案例体验方式1:Api key单独文件配置方法2:直接设置Api KeyLangSmith的添加和使用 参考文章 通过类比, 十分钟快速掌握LangChain的架构LangChain入门教程,基本案例…

ESP8266-12S配置信息保存到文件SPIFFS示例

一、前言 利用SPIFFS保存参数(加载,读取,修改) vscodePlatformIO 二、代码片段 头文件引用 定义结构体 读取、保存、修改配置文件 初始化setup(),利用配置文件中的账号密码连接WIFI 循环体loop(),读取串口…

90后作家刘楚昕获奖后追忆病故女友 未竟的承诺

近日,90后作家刘楚昕的小说《泥潭》荣获第二届漓江文学奖虚构类奖。颁奖现场上,作家余华公布了这个好消息。而获奖者刘楚昕的感言因格外催泪动人在朋友圈里刷了屏。2017年,刘楚昕在武汉大学读博期间遇到了他的初恋女友。当时,他正朝着自己的文学梦马不停蹄地赶路。“每次我…

WPS 免登录解锁编辑

遇到 WPS 需要登录才能启用编辑功能? 如何免登录使用编辑功能? 方法一 解锁方法 1、关闭 WPS; 2、桌面右键→ “新建”→“文本文档”,粘贴以下内容(见最下面);编码保持默认(ANSI …

破局传统采购!采购文件编制审核系统为烟草行业数智化加速

在烟草行业错综复杂的商业生态系统中,采购环节扮演着至关重要的战略枢纽角色。它如同驱动精密机械运转的核心齿轮,其每一次高效的“啮合”都深刻影响着整条价值链的协同运作。卓越的采购效能不仅是提升企业整体运营效率的基石,更是实现精细化…

65常用控件_QListWidget的使用

目录 代码示例:使用ListWidget List Widget 使⽤ QListWidget 能够显⽰⼀个纵向的列表. 形如: 每个选项都可以被选中. 列表中的每个元素/每一项就称为是一个Item 更具体的说,通过QListWidgetItem类表示的~~ 核⼼属性 属性说明currentRow当前被选中的是第几行cou…

c++数据结构8——二叉树的性质

一、二叉树的基本性质 示图1: 性质1:层节点数上限 在一棵二叉树中,第i层至多有2^{i-1}个节点(首层是第1层) 这个性质可以通过数学归纳法证明: 第1层:2^{1-1}2^01个节点(根节点&am…

搭建frp内网穿透

前言 内网穿透的原理我就不多说了哈,既然会看到我这篇文章,想必都知道内网穿透是做什么的吧 frp分为服务端和客户端,服务端一般是搭在公网服务器中,客户端一般搭在本地或者局域网,需要提前在服务端搭好ftp server&am…

阿里云服务器ECS详细购买流程【新手购买手册】

1、打开云服务器ECS官方页面 打开阿里云服务器ECS页面 点击进入阿里云服务器 2、付费类型选择 阿里云服务器付费类型 3、地域节点 阿里云服务器全球28个地域,中国大陆地域如华北2(北京)、华东1(杭州)、华南1&#x…

广东虎门通报小车坠桥5人死亡 事故引发广泛关注

广东虎门通报小车坠桥5人死亡 事故引发广泛关注。近日,广东东莞环莞快速路虎门段发生了一起交通事故,引起了广泛关注。5月29日晚,虎门镇“519”事故工作专班发布了情况通报。广东虎门通报小车坠桥5人死亡 事故引发广泛关注。责任编辑:0882

SpringBoot:统一功能处理、拦截器、适配器模式

文章目录 拦截器什么是拦截器?为什么要使用拦截器?拦截器的使用拦截路径执行流程典型应用场景DispatcherServlet源码分析 适配器模式适配器模式定义适配器模式角色适配器模式的实现适配器模式应用场景 统⼀数据返回格式优点 统一处理异常总结 拦截器 什…

Spring Boot 3.5.0中文文档上线

Spring Boot 3.5.0 中文文档翻译完成,需要的可收藏 传送门:Spring Boot 3.5.0 中文文档

67常用控件_QTreeWidget的使用

目录 代码⽰例: 使⽤ QTreeWidget 使⽤ QTreeWidget 表⽰⼀个树形控件. ⾥⾯的每个元素, 都是⼀个 QTreeWidgetItem , 每个 QTreeWidgetItem 可以包含多个⽂本和图标, 每个⽂本/图标为⼀个 列. 可以给 QTreeWidget 设置顶层节点(顶层节点可以有多个), 然后再给顶层节点…

气象大模型如何影响端午节旅行?精准预报助力安全出行

端午节假期(5月31日至6月2日)即将到来,全国天气形势复杂多样,北方晴热多风,南方暴雨频繁,华南则面临高温闷热。在这一背景下,气象大模型(如中央气象台的“疾风模型”等)凭借其强大的数据分析和预测能力,为公众出行提供了更精准的天气参考,直接影响着旅行决策和安全保…

德约连续20年晋级法网32强 连胜纪录延续

北京时间5月30日,在2025年法国网球公开赛男单第二轮比赛中,6号种子德约科维奇以6-3、6-2、7-6(1)战胜本土选手穆泰,成功晋级32强。比赛持续了3小时5分钟,第三盘中德约科维奇一度因左脚不适申请医疗暂停,该盘耗时超过80分钟。这场胜利使德约科维奇在罗兰加洛斯的连胜纪录达…

马图伊迪希望大巴黎欧冠夺冠 加油巴黎!

巴黎圣日耳曼旧将马图伊迪在社交媒体上表达了对母队夺得欧冠冠军的期待。北京时间6月1日凌晨3点,巴黎圣日耳曼将与国际米兰争夺本赛季的欧冠冠军。马图伊迪表示,本周六巴黎圣日耳曼带着历史使命踏上赛场,相信整个法国都会支持球队,因为他们有机会成就一些特别的事情。他提到…