第100+41步 ChatGPT学习:R语言实现误判病例分析

article/2025/7/31 2:35:30

本期是《第33步 机器学习分类实战:误判病例分析》的R版本。

尝试使用Deepseek-R1来试试写代码,效果还不错。

下面上R语言代码,以Xgboost为例:

# 加载必要的库
library(caret)
library(pROC)
library(ggplot2)
library(xgboost)# 假设 'data' 是包含数据的数据框
# 设置随机种子以确保结果可重复
set.seed(123)# 将数据分为训练集和验证集(80% 训练集,20% 验证集)
trainIndex <- createDataPartition(data$X, p = 0.8, list = FALSE)
trainData <- data[trainIndex, ]
validData <- data[-trainIndex, ]# 为 XGBoost 准备数据矩阵
dtrain <- xgb.DMatrix(data = as.matrix(trainData[, -which(names(trainData) == "X")]), label = trainData$X)
dvalid <- xgb.DMatrix(data = as.matrix(validData[, -which(names(validData) == "X")]), label = validData$X)# 定义 XGBoost 的参数
params <- list(booster = "gbtree", objective = "binary:logistic", eta = 0.1, gamma = 0, max_depth = 6, min_child_weight = 1, subsample = 0.5, colsample_bytree = 0.9,lambda = 10,alpha = 5,eval_metric = "logloss")  # 使用 logloss 作为评估指标# 训练 XGBoost 模型,并加入早停法
model <- xgb.train(params = params, data = dtrain, nrounds = 250, watchlist = list(train = dtrain, eval = dvalid),  # 监控训练集和验证集early_stopping_rounds = 10,  # 如果验证集性能在 10 轮内没有提升,则停止训练verbose = 1)# 对训练集和验证集进行预测
trainPredict <- predict(model, dtrain)
validPredict <- predict(model, dvalid)# 将概率值转换为二分类预测结果(默认阈值为 0.5)
trainPredictBinary <- ifelse(trainPredict > 0.5, 1, 0)
validPredictBinary <- ifelse(validPredict > 0.5, 1, 0)# 提取正常分类和误判样本
# 训练集
trainResults <- trainData
trainResults$Predicted <- trainPredictBinary  # 添加预测结果列
trainResults$Actual <- trainData$X  # 添加真实标签列
trainResults$Status <- ifelse(trainResults$Predicted == trainResults$Actual, "Correct", "Misclassified")  # 添加分类状态列# 验证集
validResults <- validData
validResults$Predicted <- validPredictBinary  # 添加预测结果列
validResults$Actual <- validData$X  # 添加真实标签列
validResults$Status <- ifelse(validResults$Predicted == validResults$Actual, "Correct", "Misclassified")  # 添加分类状态列# 分离正常分类和误判样本
trainCorrect <- trainResults[trainResults$Status == "Correct", ]
trainMisclassified <- trainResults[trainResults$Status == "Misclassified", ]validCorrect <- validResults[validResults$Status == "Correct", ]
validMisclassified <- validResults[validResults$Status == "Misclassified", ]# 输出正常分类和误判样本
print("训练集中的正常分类样本:")
print(trainCorrect)print("训练集中的误判样本:")
print(trainMisclassified)print("验证集中的正常分类样本:")
print(validCorrect)print("验证集中的误判样本:")
print(validMisclassified)# 将结果保存到文件(可选)
write.csv(trainCorrect, file = "train_correct.csv", row.names = FALSE)
write.csv(trainMisclassified, file = "train_misclassified.csv", row.names = FALSE)
write.csv(validCorrect, file = "valid_correct.csv", row.names = FALSE)
write.csv(validMisclassified, file = "valid_misclassified.csv", row.names = FALSE)

简单解说:

(A)最终结果输出成excel查看,输出地址就是你的工作路径,不懂的话可以使用代码getwd()展示出来。

(B)打开工作路径,可以发现四个文件,分别对应混淆矩阵的四个数字:

(C)题外话:Deepseek-R1-0528 改改代码感觉可以跟GPT类似了,平替的好手。


http://www.hkcw.cn/article/kebmmlfRxi.shtml

相关文章

实验设计与分析(第6版,Montgomery)第5章析因设计引导5.7节思考题5.8 R语言解题

本文是实验设计与分析&#xff08;第6版&#xff0c;Montgomery著&#xff0c;傅珏生译) 第5章析因设计引导5.7节思考题5.8 R语言解题。主要涉及方差分析&#xff0c;正态假设检验&#xff0c;残差分析&#xff0c;交互作用图。 (a) dataframe<-data.frame( Lightc(580,568…

OptiStruct实例:消声器前盖ERP分析(2)RADSND基础理论

13.2 Radiated Sound Output Analysis( RADSND ) RADSND 方法通过瑞利积分来求解结构对外的辐射噪声。其基本思路是分为两个阶段&#xff0c;如图 13-12 所示。 图13-12 结构辐射噪声计算示意图 第一阶段采用有限元方法&#xff0c;通过频响分析(模态叠加法、直接法)工况计算结…

安装RHEL9.x操作系统

本案例需要的设备和软件 1.1台安装有Windows操作系统的计算机 2.RHEL 9的ISO映像文件一套 3.VMware Workstation 17.5 Pro软件一套 4.相关软件及镜像下载链接 VMware17.5&#xff0c;链接&#xff1a;https://pan.quark.cn/s/6208d19dbd48 提取码&#xff1a;22Wk rhel-9…

API:解锁网络世界的无限可能

“在数字化时代&#xff0c;互联网已成为我们生活、工作和学习中不可或缺的一部分。然而随着网络环境的日益复杂&#xff0c;访问限制、数据追踪、IP封锁等问题也随之而来。为了应对这些挑战&#xff0c;代理IP API应运而生&#xff0c;它不仅为我们提供了一种绕过限制、保护隐…

js 动画库、2048核心逻辑、面试题add[1][2][3]+4

1、js 动画库 web animation api &#xff08;1&#xff09;初始化代码 hmtl、css 部分 初始化全局背景黑色初始化黄色小球 js 部分 监听全局点击事件创建并添加元素 class"pointer" 的 div 标签 设置 left、top 位置监听动画结束事件&#xff0c;移除该元素 定位小…

Linux:Shell脚本基础

一、变量的命名规则 变量名称中只能包含数字、大小写字母以及下划线 二、变量的调用方法 三、字符的转义及引用 批量转义用“” 双引号是弱引用&#xff0c;单引号是强引用 四、用命令的执行结果定义变量 $1 $2 $3代表脚本后的第几个字节 $* $表示的是所有字节&#xff0c;但…

【Linux】深入解析:云服务器连接 XShell、Linux 目录结构和常用命令

XShell 使用阿里云服务器连接 XShell 使用Xshell连接阿里云服务器&#xff08;超详细截图版&#xff09;-CSDN博客 连接成功后 xshell 页面&#xff1a; 清空页面内容&#xff0c;直接输入 clear 即可&#xff1a; 关于 XShell 下的复制粘贴 复制&#xff1a;Ctrl Insert&…

掌握Java Runtime类的核心用法

Runtime 类的基本概念 Java 的 Runtime 类位于 java.lang 包中&#xff0c;用于与 Java 运行时环境&#xff08;JVM&#xff09;交互。每个 Java 应用程序都有一个 Runtime 实例&#xff0c;可以通过静态方法 Runtime.getRuntime() 获取。Runtime 类提供了与系统资源交互、执行…

如何设计自动化测试框架?

&#x1f345; 点击文末小卡片&#xff0c;免费获取软件测试全套资料&#xff0c;资料在手&#xff0c;涨薪更快 关于测试框架的好处&#xff0c;比如快速回归提高测试效率&#xff0c;提高测试覆盖率等这里就不讨论了。这里主要讨论自动化框架包含哪些内容&#xff0c;以及如…

历年西安交通大学计算机保研上机真题

2025西安交通大学计算机保研上机真题 2024西安交通大学计算机保研上机真题 2023西安交通大学计算机保研上机真题 在线测评链接&#xff1a;https://pgcode.cn/school 计算圆周率近似值 题目描述 根据公式 π / 4 1 − 1 / 3 1 / 5 − 1 / 7 … \pi / 4 1 - 1/3 1/5 - …

历年武汉大学计算机保研上机真题

2025武汉大学计算机保研上机真题 2024武汉大学计算机保研上机真题 2023武汉大学计算机保研上机真题 在线测评链接&#xff1a;https://pgcode.cn/school 分段函数计算 题目描述 写程序计算如下分段函数&#xff1a; 当 x > 0 x > 0 x>0 时&#xff0c; f ( x ) …

LearnOpenGL-笔记-其十

今天我们要进入高级光照的环节了&#xff1a; Advanced Lighting 之前的学习中&#xff0c;我们的光照模型采用的是比较简单的phong光照模型&#xff0c;也就是光照强度由环境光加上漫反射光加上镜面反射组成。 用一张图足以解释&#xff1a; 就这么简单&#xff0c;针对夹…

大话软工笔记—分离原理

1. 基本概念 1.1 定义 分离原理&#xff0c;将研究对象中符合相同设计方法的同类项进行分离、归集。 1.2 作用 分离原理的主要作用是&#xff1a; &#xff08;1&#xff09;降低了需求分析与软件设计的复杂程度。 &#xff08;2&#xff09;提出了对企业构成内容按照设计…

扫地机器人苦寻新引擎,大疆们却已攻入腹地

原创 科技新知 前沿科技组 作者丨江篱 编辑丨樱木、九黎 竞争激烈的扫地机器人赛道&#xff0c;迎来了新玩家。 据近日相关报道&#xff0c;大疆扫地机器人产品已开始量产&#xff0c;预计将于6月份发布。消息称大疆研发扫地机器人已超过四年&#xff0c;即将上市的产品是扫…

【Docker管理工具】部署Docker管理面板DweebUI

【Docker管理工具】部署Docker管理面板DweebUI 一、DweebUI介绍1.1 DweebUI 简介1.2 主要特点1.3 使用场景 二、本次实践规划2.1 本地环境规划2.2 本次实践介绍 三、本地环境检查3.1 检查Docker服务状态3.2 检查Docker版本3.3 检查docker compose 版本 四、下载DweebUI镜像五、…

《系统集成项目管理工程师(第三版)》高效学习方法

文章目录 一、学习周期规划(总时长:3-4个月)二、每日学习时间分配表三、重难点突破策略1. 五星必考重点(占分60%+)2. 高频易错点四、高效记忆法(附实例)1. 口诀记忆法2. 联想记忆法3. 对比记忆法五、阶段目标检测六、十大管理高频整理一、十大管理ITTO高频考点表🔥 必…

新松机械臂 2001端口服务的客户端例程

初级代码游戏的专栏介绍与文章目录-CSDN博客 我的github&#xff1a;codetoys&#xff0c;所有代码都将会位于ctfc库中。已经放入库中我会指出在库中的位置。 这些代码大部分以Linux为目标但部分代码是纯C的&#xff0c;可以在任何平台上使用。 源码指引&#xff1a;github源…

HarmonyOS-ArkUI固定样式弹窗(1)

固定样式弹窗指的就是ArkUI中为我们提供的一些具备界面模板性质的弹窗。样式是固定的,我们可以决定在这些模板里输入什么样的内容。常见的有,警告弹窗, 列表选择弹窗, 选择器弹窗,对话框,操作菜单。 下图是本文中要讲到的基类固定样式弹窗,其中选择器弹窗没有包含在内,…

Dify运行本地和在线模型

1、运行本地模型 1.1、下载Ollama 官网下载&#xff1a;Ollama 1.2、安装LLM大模型 Ollama官网搜索模型&#xff0c;复制命令&#xff1a; 在终端中粘贴下载&#xff0c;下载完成后可以输入对话&#xff0c;表示安装成功。 使用命令&#xff1a;ollama list 可以列出已经安装…

manus对比ChatGPT-Deep reaserch进行研究类论文数据分析!谁更胜一筹?

目录 没有账号&#xff0c;只能挑选一个案例 1、manus的效果 Step-1&#xff1a;直接看结果 Step-2&#xff1a;看看其他文件的细节 Step-3&#xff1a;看最终报告 2、Deep reaserch 3、Deep reaserch进行行业分析 总结一下&#xff1a; 大家好这里是学术Anan&#xff…