2024年数维杯国际大学生数学建模挑战赛B题空间变量协同估计方法研究解题全过程论文及程序

article/2025/7/30 0:40:13

2024年数维杯国际大学生数学建模挑战赛

B题 空间变量协同估计方法研究

原题再现:

  在数理统计学中,简单采样通常假设来自相同总体的采样点彼此独立。与数理统计相反,空间统计假设空间变量的采样点是相依的,并在其值中表现出某些趋势。因此,空间变量的值及其趋势可以用于估计其在未采样位置的值。空间估计最常见的方法是克里格算法。
  在实际工程中,可以使用不同的方法测量相同的空间变量。尽管这些方法测量相同的物理量,但测量原理的差异导致测量值的差异。然而,这些值仍然表现出显著的空间相关性。此外,一些空间变量可能具有不同的物理意义,但显示出一定的相关性和相似性。这些空间相关变量可以具有相同或不同的测量单位。
  一些空间变量成本高,难以测量。尽管它们的精度很高,但在实际工作中仅获得有限数量的样本。另一方面,一些空间变量易于测量且价格低廉,导致在大面积上进行广泛采样。
  在工程研究中,当研究采样不足的空间变量的空间变化模式时,研究人员经常参考与目标变量强相关的其他空间变量,并使用协作估计。在地质和采矿研究中,解决这些问题的主要方法是共克里金方法。虽然在理论上很好地理解Co-Kriging算法,但由于计算空间变量之间的互协方差或互变异函数的挑战,它的实现很困难,这使得该算法难以在实践中应用。
随着人工智能和机器学习方法的发展,这些技术已经成功地应用于许多行业。提供的问题提供了两个数据集,附件1和附件2,其中包含来自同一区域的四个空间属性的测量,目标变量具有更高的测量成本。该问题要求参与者研究适当的方法来协同估计附件中给出的空间属性数据:
  问题1:使用附件1中的数据研究其中一个空间变量(F1_目标变量)的变化模式。
  (1) 随机均匀地对目标变量重新采样,并使用重新采样的值估计未采样位置处的空间变量值。将结果显示为等高线贴图。
  (2) 改变样本量,探索样本量与估计误差之间的关系。
问题2:使用附件1中的数据研究目标变量和协作变量之间的相关性。选择两个协作变量作为目标变量的估计协作变量。
  问题3:使用附件1中的数据和问题2的结果,选择一个或两个协作变量,并研究空间变量(F1_目标变量)的变化模式。
  (1) 随机一致地对目标和协作变量重新采样,并使用重新采样的值估计未采样位置的空间变量值。将结果显示为等高线贴图。
  (2) 改变样本量,探索样本量与估计误差之间的关系。
  (3) 至少选择两种方法并进行比较。
  问题4:附件2中的目标变量(F2_target变量)采样数据不足。从问题3中选择最佳方法来估计目标变量的趋势,并将结果显示为等高线图。
  数据描述:
  1.附件中的数据从矩形区域采样。矩形结构如下:
(1) X坐标范围:柱跨度范围为51250.000米至64500.0000米;(2)Y坐标范围:行跨度范围为78750.0000米至92000.0000米;(3)研究区划分为50米×50米的小网格,共266×266个网格点。在这些网格点处提供空间变量的采样值。
  2.附件2中的文件“F2_target_variable_sampling.txt”包含从研究区域内的网格点均匀采样的1000个采样点。出于研究目的,可以根据需要按顺序提取样本。例如,要选择100个采样点,请从数据中提取前100个点;对于200个采样点,提取前200个点,依此类推。

整体求解过程概述(摘要)

  在研究空间变量的空间变异性时,协克里金协同估计方法表现出良好的局部细节捕捉能力和空间相关性优势。针对协方差计算问题,建立了基于FMM优化的协同Kriging模型,并对空间变量的变化模式进行了深入研究。
  对于问题1,在对附件1数据进行归一化和二维网格划分后,采用随机均匀重采样保证公平性和随机性,然后构造线性插值和Kriging插值模型。利用三维和等高线图验证了模型的拟合性,分析了F1\u目标的全局层次性、局部峰值特征和空间相关性。其次,针对第二个问题,利用python对所建立的RMSE误差分析模型进行求解,得出结论:Kriging插值的RMSE误差随着样本量的增加迅速减小并趋于稳定,而线性插值的RMSE误差减小缓慢且难以收敛。
  对于问题2,研究变量之间的相关性,综合选择两个合作变量。首先通过散点图和密度直方图绘制变量的初始趋势,然后结合Jarque-Bera检验确定数据的非正态分布。采用Spearman相关系数分析,用SPSS软件计算目标变量与协变量的相关性。结果表明,在99%的病例中,协变量1和协变量4与目标变量有很强的相关性。因此,选择Collaborative1和Collaborative4作为协变量。
  对于问题3,在问题2 Kriging模型的基础上,引入快速多极子法建立FMM优化协同Kriging模型,并通过二维等值线图揭示F1\u目标空间变量的各向异性。其次,在第一个问题的基础上,第二个问题建立了优化的RMSE、R²和MAPE模型,并通过python可视化模型得到了线图。结果表明,随着样本量的增加,误差迅速减小,收敛速度加快,在高样本量下,全局和局部预测精度都有显著提高。同时,通过比较随机森林模型,并结合多指标雷达图和局部高值热图对两种模型的性能进行量化,验证了协克里金模型在空间相关性和插值精度方面的优势。结论:优化模型在捕捉空间相关性、平衡全局和局部波动、提高精度方面具有显著优势,适用于F1\U目标空间变量。
  对于问题4,必须确保以最佳方式估计目标变量(F2\u目标)的趋势。基于附件2的数据,本文进行了Jarque-Bera正态分布检验和Spearman相关系数求解,并选取最优协变量。在问题3模型的基础上,建立了基于FMM优化的协同Kriging模型,对未采样点进行插值,揭示目标变量(F2\u目标)的变化趋势。

模型假设:

  1.目标变量和协变量在空间上逐渐变化。
  2.平均值在区域上是恒定的,协方差仅取决于点距离。
  3.预测误差在空间上是独立的,由样本大小和模型特征驱动。

问题分析:

  问题一分析
  根据问题1,需要综合分析F1_目标的空间分布特征和影响因素。对于问题1的第一部分,在数据归一化和二维网格划分的基础上,采用随机均匀重采样来保证空间点的公平性和随机性,建立了线性插值和克里格插值模型,并绘制了三维地图和等高线图来分析两种模型的适应性,直观地给出了F1_目标的空间变化模式。第二部分在插值模型的基础上建立了RMSE误差分析模型,并通过调整样本大小来研究其对预测误差的影响。
  问题二的分析
  为了分析F1_目标与协变量之间的相关性,我们首先绘制散点图,直观地分析目标变量与协变量(Collaborative1、2、3和4)之间的关系,然后获得目标变量与每个协变量之间相关性的趋势。然后绘制密度直方图,拟合正态分布曲线。在初步判断数据的正态趋势后,通过Jarque-Bera检验对变量的正态性进行了定量分析。最后利用Spearman相关系数分析目标变量与协变量之间的相关性,并绘制热图来表示,通过视觉分析和统计检验来识别两个协变量。
  问题三分析
  基于问题二的模型,我们需要选择与目标变量相关性最强的合作变量,并进一步研究目标变量F1_目标的空间变化模式。由于协方差难以用协克里金算法计算,采用快速多极子方法计算协方差函数,建立了基于FMM优化的协克里金模型,以提高插值精度,并绘制了二维等值线图来表示空间变化。样本量与估计误差之间的关系由MRSE、R²和MAPE线图表示。同时,建立了随机森林模型作为比较,并利用多指标雷达图和局部高值热图对两种模型的全局预测性能进行了量化。
  问题四分析
  问题4是前三个问题的综合,需要选择最佳方法来估计目标变量(F2_target)的趋势。在估计之前,还考虑了协变量对目标变量的协同效应,进行了正态分布检验并求解了相关系数,找到了Spearman相关系数最强的变量作为协变量。在问题3的基础上,建立了基于FMM优化的协同克里格模型,并对剩余的未采样点进行插值,以估计目标变量的趋势。

模型的建立与求解整体论文缩略图

在这里插入图片描述
在这里插入图片描述

全部论文及程序请见下方“ 只会建模 QQ名片” 点击QQ名片即可

部分程序代码:

import pandas as pd 
import numpy as np 
import matplotlib.pyplot as plt 
from mpl_toolkits.mplot3d import Axes3D 
# File paths and names 
file_paths = [] 
# Load data from Excel files 
data_sets = [(pd.read_excel(path, header=None).values, name) for path, name in 
file_paths] 
# Define grid coordinates
grid_size = (266, 266) 
x = np.linspace(51250.0, 64500.0, grid_size[1])  # X-coordinate range 
y = np.linspace(78750.0, 92000.0, grid_size[0])  # Y-coordinate range 
X, Y = np.meshgrid(x, y) # Plot 3D surface for each dataset 
for data, name in data_sets: fig = plt.figure(figsize=(12, 8)) ax = fig.add_subplot(111, projection='3d') # Create a 3D surface plot surf = ax.plot_surface(X, Y, data, cmap='viridis', edgecolor='none', 
alpha=0.8) fig.colorbar(surf, ax=ax, label='Value') # Set title and axis labels ax.set_title(f'Three-Dimensional Surface Plot for {name}') ax.set_xlabel('X Coordinate') ax.set_ylabel('Y Coordinate') ax.set_zlabel('Value') plt.show()
import numpy as np 
import pandas as pd # Define the target grid size 
grid_size = (266, 266) # File path 
file_path = "" # List to store the data 
data = [] # Open the file and extract numerical data 
with open(file_path, 'r') as file: for line in file: try: # Convert each line into a list of floating-point numbers row = list(map(float, line.split())) if row:  # If the line is not empty data.extend(row) except ValueError: # Skip non-numerical lines continue # Convert the data to a numpy array 
data = np.array(data) # Check if the data size matches the target grid size 
if data.size != grid_size[0] * grid_size[1]: raise ValueError(f"Data size {data.size} does not match the target grid size 
{grid_size}!") # Reshape the data into a 266 x 266 2D array 
reshaped_data = data.reshape(grid_size) # Output the result for verification 
print("Data has been successfully reshaped to 266 x 266 format!") # Save the reshaped data to an Excel file 
output_file = "reshaped_data.xlsx" 
pd.DataFrame(reshaped_data).to_excel(output_file, index=False, header=False) 
print(f"Data has been successfully saved as an Excel file: {output_file}")
全部论文及程序请见下方“ 只会建模 QQ名片” 点击QQ名片即可

http://www.hkcw.cn/article/qfNuLOUKCl.shtml

相关文章

SPA-RL:通过Stepwise Progress Attribution训练LLM智能体

SPA-RL:通过Stepwise Progress Attribution训练LLM智能体 在大语言模型(LLM)驱动智能体发展的浪潮中,强化学习(RL)面临着延迟奖励这一关键挑战。本文提出的SPA-RL框架,通过创新的分步进度归因机…

基于 Zynq 平台的 EtherCAT 主站的软硬件协同设计

摘要: 针对工业自动化对控制能力和强实时性的需求,提出了一种基于 FPGA 的改进型 EtherCAT 硬件主站方案 。 该方案利用 Zynq-7000 平台,在 PL 端实现 FPGA 协议栈,以保证核心功能的高效执 行 。 基于 AXI4 总线设计…

【IC】BSIM-CMG:用于高级电路设计的标准FinFET紧凑型模型

摘要 这项工作提出了新的紧凑型模型,这些模型捕捉了工业FinFET中呈现的高级物理效应。所提出的模型被引入到行业标准紧凑型模型BSIM-CMG中。核心模型被更新为新的统一FinFET模型,该模型计算具有复杂鳍片横截面的晶体管的电荷和电流。此外,来…

BFD工作原理(双向转发检测)

BFD的工作原理 BFD 会在两台网络设备之间建立会话,并通过周期性地交换 BFD 控制报文来检测路径的连通性。如果在检测时间内没有收到对方的报文,则视为链路故障,是依赖于路由协议来发现邻居的 故障检测 故障检测时间 协同接收间隔 * 检测倍数…

【JNI】JNI环境搭建

1 前言 JNI (Java Native Interface) 是 JDK 提供的一种机制,用于实现 Java 代码与其他语言(主要是 C 和 C)编写的本地代码之间的交互。 JNI 接口详见 JDK 安装目录中的 include/jni.h 文件,Android NDK 对 JDK 的 JNI 进行了扩展…

利用IEEE 802.15.4z-IR UWB系统进行手势检测

本文介绍了一种符合 IEEE 802.15.4z 标准的脉冲无线电超宽带 (IR-UWB) 手势检测雷达系统。该系统可检测车辆乘客座椅上的人员是否执行了 12 个预定义手势中的某一个。这些预定义手势包括各种手部动作,例如左右滑动或顺时针旋转手掌。为了进行手势检测,我…

STM标准库-GPIO输入

文章目录 一、GPIO输入按键简介传感器模块简介硬件电路 二、C语言C语言数据类型C语言宏定义C语言typedefC语言结构体C语言枚举 三、练习3.1按键控制LED3.1.1接线图3.1.2代码效果: 3.2光敏电阻控制蜂鸣器3.2.1接线图3.2.2代码效果: 一、GPIO输入 STM32 的…

HackMyVM-Jabita

信息搜集 主机发现 ┌──(kali㉿kali)-[~] └─$ nmap -sn 192.168.43.0/24 Starting Nmap 7.95 ( https://nmap.org ) at 2025-06-01 05:20 EDT Nmap scan report for 192.168.43.1 Host is up (0.020s latency). MAC Address: C6:45:66:05:91:88 (Unknown) Nmap scan repo…

桑托斯0-1博塔弗戈 内马尔染红 阿图尔制胜球

北京时间6月2日,巴西足球甲级联赛第11轮,桑托斯主场对阵博塔弗戈。比赛中,桑托斯的内马尔因累计两张黄牌被罚出场。博塔弗戈凭借雅伊尔-库尼亚的助攻,由阿图尔打入制胜一球,最终以1-0战胜桑托斯。比赛开始前,双方队长进行了挑边仪式。第5分钟,内马尔在禁区内投诉被对手拉…

英国军事战略转向全面“备战”

△英国首相府(资料图)当地时间6月1日,总台记者从英国首相府获得信息,英国政府将在2日发布新一轮《战略国防评估报告》的同时,宣布大幅扩建其核动力攻击型潜艇舰队,并加速推进军工产业现代化。此举被外界普遍解读为英国在地缘安全压力加剧背景下,全面进入“备战状态”。新…

Java虚拟机内存区域划分

Java虚拟机内存区域划分 Java虚拟机(JVM)的内存区域划分主要分为五个部分: 程序计数器:程序计数寄存器,给CPU使用本地方法栈:为JVM使用到的Native方法服务方法区:存储的是编译后的.class文件堆…

cursor升级至0.505,运行统计视频中的人数

帮助--检查更新,升级。 升级后,新建文本,另存选python格式保存后,右下角提示选择编译器,选择python后,自动安装ms python 3.11.9 一.查看pthon安装在哪, winr,输入cmd后, ctrlshiftenter三个…

《Pytorch深度学习实践》ch2-梯度下降算法

------B站《刘二大人》 1.Gradient Decent 局部最优,全局最优,非凸函数: 梯度下降算法公式: 2.Implementation import matplotlib.pyplot as plt# 数据集 x_data [1.0, 2.0, 3.0] y_data [2.0, 4.0, 6.0]# 权重 w 1.0# 模型…

LabVIEW多按键自动化检测系统

LabVIEW开发一套高精度按键力与行程自动化检测系统,针对传统检测设备自动化程度低、定位误差大等痛点,实现多按键产品的全流程自动化测试。系统集成 6 轴工业机器人、高精度传感器及实时数据处理模块,满足汽车电子、消费电子等领域对按键手感…

Chorme如何对于youtube视频进行画中画背景播放?

画中画可以让你小窗播放,然后浏览器放后台还可以做点别的事情。 B站直接可以选择小窗播放,游览器最小化就可以,但是youtube的小窗播放游览器一切换就不显示了。 其实是因为youtube的小窗播放不是真的小窗播放。要想真的实现需要在youtube视…

JDBC连不上mysql:Unable to load authentication plugin ‘caching_sha2_password‘.

最近为一个spring-boot项目下了mysql-9.3.0,结果因为mysql版本太新一直报错连不上。 错误如下: 2025-06-01 16:19:43.516 ERROR 22088 --- [http-nio-8080-exec-2] o.a.c.c.C.[.[.[/].[dispatcherServlet] : Servlet.service() for servlet [dispat…

C/C++ 面试复习笔记(3)

一.valgrind工具 参考: 内存检查工具valgrind介绍、安装与使用-CSDN博客https://blog.csdn.net/mijichui2153/article/details/85240349 二.C语言中如何实现一个线程池? 答案: 线程池是通过预先创建固定数量的线程来处理多个任务&#xf…

Spring框架核心知识深度解析

Spring框架核心知识深度解析 最近正在复习Java八股,所以会将一些热门的八股问题,结合ai与自身理解写成博客便于记忆 今天将对spring常见问题做出解析 一、IOC与AOP核心原理 1. IOC(控制反转)详解 核心思想:将对象…

【第四十七周】HippoRAG 2 复现与分析(一):环境部署与代码分析

目录 摘要Abstract安装依赖试运行HippoRAG 初始化文档索引QA运行脚本 总结 摘要 本周对HippoRAG 2系统进行核心功能测试,通过构建小型结构化文档库(如人物职业、童话事件、地理关系),验证其索引构建、动态增删、多轮检索问答及评…

【js逆向_AES】全国二手房指数数据爬取

目标:请求参数signcode,请求结果data。 网址:aHR0cDovL3d3dy5jY2hpbmRleC5jb20vSG9tZS9pbmRleA 查看载荷 查看响应数据 点击xhr,发现所有请求参数都是一个signCode,还是加密后的结果,对应结果中数据data也…