2024年认证杯SPSSPRO杯数学建模D题(第二阶段)AI绘画带来的挑战解题全过程文档及程序

article/2025/6/7 13:35:29

2024年认证杯SPSSPRO杯数学建模

D题 AI绘画带来的挑战

原题再现:

  2023 年开年,ChatGPT 作为一款聊天型AI工具,成为了超越疫情的热门词条;而在AI的另一个分支——绘图领域,一款名为Midjourney(MJ)的软件,热度完全不亚于ChatGPT。AI绘画技术可以模仿设计师的风格和技巧,自动生成类似于人类设计师的设计作品。AI绘画技术可以应用于各种领域,包括绘画、插画、平面设计等,具有较高的效率和精度,能够大大提高创作效率和创作质量。然而,AI绘画技术也带来了一些挑战和风险。比如对于一些传统的美术设计类赛事组织方来说,AI绘画技术就带来了评奖公平性的挑战,由于一些设计作品很难快速判断出究竟是由AI设计的,还是由人类设计师设计的,所以赛事评奖工作变得异常复杂,当参赛作品较多的时候,很难保证最终的结果公平性,附图就是几幅由MJ软件设计的建筑图片,即使业内人士也不能保证做出准确的判断。请你和你的团队建立合理的数学模型以解答如下问题。
  第二阶段问题:
  1. 我们可以利用MJ软件来生成大量的AI设计图来作为识别AI设计的样本数据集,如果这种思路可行,你认为需要构建一个多大的数据集才能保证识别率超过80%?
  2. 如果在今后的设计比赛中,使用AI进行设计辅助已经是不可避免,那么人的参与频次、参与深度、人与AI的信息交互内容等指标将成为打分的关键依据,请你结合第一阶段的模型,构建一个打分系统,通过一定的问卷调研数据来对设计作品进行评价。

整体求解过程概述(摘要)

  本文详细分析了AI绘画带来的挑战。这一挑战主要涉及如何准确地从数学和技术角度区分AI和人类设计的作品,以及如何建立一个公正的评分系统来评估由AI辅助的设计作品。
  随着AI工具如ChatGPT和Midjourney在设计领域的广泛应用,其高效、精准的模仿能力虽然提高了创作效率,但同时也给设计赛事的公平性评判带来了挑战。尤其是在判断作品的真实创作来源——是AI还是人类设计师——这一问题上,确保评奖的公正性显得尤为重要。
  针对问题一,文章详细描述了如何确定构建一个足够大的样本数据集以确保超过80%的AI 与人类作品识别准确率。通过深入研究现有文献,采用图像特征提取技术(包括颜色分布、纹理分析、几何形状识别)和深度学习方法,开发了一个基于CNN的多输入判别模型。该模型通过多次交叉验证和使用不同的正则化技术来避免过拟合,并通过数据集大小的学习曲线来拟合所需的样本量,最终确定需要14745个样本来达到所需的识别准确率。
  针对问题二:为了评估AI辅助设计作品的质量,我们构建了一个综合评分系统,涵盖设计质量评分(Qd)、人工与AI的交互频次(Fa)、人工参与的深度(Da)、交互内容质量(Cq)和综合技术指标(Tq)五个维度,使用加权平均法确定各指标的权重。通过设计问卷,专业评委对Qd和Tq进行评分,设计者对Fa、Da和Cq进行自评,然后我们自行设计了三幅建筑设计作品,控制不同的AI交互频次和人工参与深度,并结合所有评分数据,计算每幅作品的综合评分。结果表明,合理平衡AI与人工的作用,确保适当的交互频次和参与深度,可以有效提升设计作品的整体质量。
  总体而言,文章为解决AI在设计领域带来的挑战提供了一个结构化和科学的方法,不仅增强了识别AI与人类设计作品的能力,还建立了一个公正的评分系统来评估AI 辅助的设计作品。这些方法不仅提高了评估的准确性,也确保了设计比赛的公平性和透明度。

问题分析:

  问题一分析
  在解决问题一,即确定构建多大的数据集以确保识别准确率超过80%的情况下,我们采取了多方面的分析和实验步骤。首先,通过研究相关文献并参考现有的资料,我们设计并实现了一系列用于判断AI绘图的模块。这些模块基于图像特征的提取,例如颜色分布、纹理分析和几何形状,是构建有效判别模型的基础。此外,我们还引入了基于深度学习的特征提取,如预训练神经网络的中间层输出,以捕获更复杂的图像特征。
  接下来,我们在不同规模的数据集上训练了基于CNN的多输入判别模型。模型的训练和验证过程中,我们使用了交叉验证方法来确保评估结果的可靠性和模型的泛化能力。为了防止过拟合,我们还引入了dropout和L2正则化技术。通过这些模型,我们绘制了学习曲线,观察模型性能随数据集大小的变化。通过这些数据集的准确率绘制了模型的学习曲线图,然后通过三种方法(线性外推,三次多项式拟合,集成学习)预估了数据集的大小。
  最终,通过综合考虑三种预估方法得优缺点以及多个机器学习模型的学习曲线,构建了数据集预估算法,得到当准确率达到80%时,所需要的数据集大小为14745
  问题二的分析
  随着人工智能(AI)技术在设计领域的广泛应用,设计比赛中使用AI进行设计辅助已成为不可避免的趋势。然而,如何公平地评估这些AI辅助设计作品,成为新的挑战。为了全面、公正地评价这些设计作品,本文结合5个维度的指标:
  1. 设计质量评分(Qd):由专业评委对作品的美学质量、创新性、实用性和细节处理进行评分。
  2. 人工与AI的交互频次(𝐹a):衡量设计者在设计过程中与AI交互的次数。
  3. 人工参与的深度(𝐷a):量化设计者在设计过程中的参与深度。
  4. 交互内容质量(𝐶q):评估设计者在与AI交互过程中内容的有效性和创造性。
  5. 综合技术指标(Tq):包括纹理一致性、光影处理、透视准确性和色彩一致性。 然后通过加权平均法确定各指标的权重,最终建立一个综合评分公式:
在这里插入图片描述
  该综合评分系统能够科学、公正地评估 AI 辅助设计的作品,确保评分过程的公平性和准确性。然后再针对设计质量评分(Qd),综合技术指标(Tq)这2个部分设计一份问卷给专业评委打分,其中综合技术的部分指标结合第一阶段确定的特征提取的方法进行打分,人工与AI的交互频次(𝐹a),人工参与的深度(𝐷a),交互内容质量(𝐶q)则设计问卷给设计者自评。

模型假设:

  特征差异性假设:
  假设AI和人类设计师生成的作品在几何一致性、纹理细节、色彩搭配、透视准确性以及风格特征上存在可识别的差异。这些差异可以通过适当的图像处理技术和特征提取算法捕捉到。
  独立同分布假设:
  假设训练数据和将要预测的数据是独立同分布的。这意味着训练集中的数据分布与实际应用中遇到的数据分布相同,保证模型在实际应用中的有效性。
  评价系统公正性假设:
  在对AI辅助设计作品进行评分时,假设评价标准公正、客观,能够真实反映作品的设计质量和技术水平。此外,假设评分过程中人的主观判断与AI分析结果的结合是合理的,可以准确评估作品的质量。

完整论文缩略图

在这里插入图片描述

全部论文请见下方“ 只会建模 QQ名片” 点击QQ名片即可

部分程序代码:

import cv2 
import numpy as np 
def extract_geometric_features(image_path): 
image = cv2.imread(image_path, cv2.IMREAD_COLOR) 
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) 
edges = cv2.Canny(gray, 50, 150, apertureSize=3) 
# 使用霍夫变换检测线条 
lines = cv2.HoughLinesP(edges, 1, np.pi/180, threshold=50, 
minLineLength=100, maxLineGap=10) 
if lines is not None: 
for line in lines: 
x1, y1, x2, y2 = line[0] 
cv2.line(image, (x1, y1), (x2, y2), (255, 0, 0), 2) 
return image 
# 使用函数 
result_image = extract_geometric_features('path_to_your_image.jpg') 
cv2.imshow('Geometric Features', result_image) 
cv2.waitKey(0) 
cv2.destroyAllWindows() 
def analyze_light_shadow_features(image_path): 
image = cv2.imread(image_path) 
hsv = cv2.cvtColor(image, cv2.COLOR_BGR2HSV) 
lightness = hsv[:, :, 2].mean()  # 获取亮度通道的平均值 
contrast = image.std()           # 计算标准差以评估对比度 
return lightness, contrast 
def color_histogram_features(image_path): 
image = cv2.imread(image_path) 
hist = cv2.calcHist([image], [0, 1, 2], None, [256, 256, 256], [0, 256, 
0, 256, 0, 256]) 
cv2.normalize(hist, hist) 
return hist.flatten() 
from tensorflow.keras.applications.vgg19 import VGG19, preprocess_input 
from tensorflow.keras.preprocessing import image 
from tensorflow.keras.models import Model 
def extract_texture_features(image_path): 
model = VGG19(weights='imagenet', include_top=False) 
model = Model(inputs=model.inputs, 
outputs=model.get_layer('block5_conv4').output) 
img = image.load_img(image_path, target_size=(224, 224)) 
img_array = image.img_to_array(img) 
img_array = np.expand_dims(img_array, axis=0) 
img_array = preprocess_input(img_array) 
features = model.predict(img_array) 
return features.mean(axis=(0, 1, 2)) 
# 继续使用 VGG19 模型进行风格特征的提取 
def extract_style_features(image_path): 
# 同上使用 VGG19 的某层输出进行风格特征分析 
return extract_texture_features(image_path)  # 使用相同的方法,目标层可能有所不同 
import cv2 
import numpy as np 
from tensorflow.keras.models import load_model 
def extract_structure_and_proportion_features(image_path): 
# 加载预训练的模型(此处假设模型已加载) 
model = load_model('path_to_your_pretrained_model.h5') 
image = cv2.imread(image_path) 
image_resized = cv2.resize(image, (224, 224)) 
# 对图像进行预处理并进行预测 
img_array = np.expand_dims(image_resized, axis=0) 
detections = model.predict(img_array) 
# 解析检测结果,提取结构和比例特征 
features = [] 
for detection in detections: 
# 假设detection 包括边界框和类别标签 
x, y, width, height, label = detection 
features.append((label, x, y, width, height)) 
return features 
from tensorflow.keras.applications.vgg19 import VGG19, preprocess_input 
from tensorflow.keras.preprocessing import image 
from tensorflow.keras.models import Model 
def extract_layout_features(image_path): 
model = VGG19(weights='imagenet', include_top=False) 
model = Model(inputs=model.inputs, 
outputs=model.get_layer('block5_pool').output) 
img = image.load_img(image_path, target_size=(224, 224)) 
img_array = image.img_to_array(img) 
img_array = np.expand_dims(img_array, axis=0) 
img_array = preprocess_input(img_array) 
# 这将给出图像的高级特征,可以用于理解图像布局 
features = model.predict(img_array) 
layout_features = features.mean(axis=(0, 1, 2)) 
return layout_features 
from tensorflow.keras.applications import VGG16 
from tensorflow.keras.layers import Dense, Flatten, Dropout 
from tensorflow.keras.models import Model 
from tensorflow.keras.optimizers import Adam 
# 加载预训练的VGG16模型,不包括顶层 
base_model = VGG16(weights='imagenet', include_top=False, input_shape=(224, 
224, 3)) 
# 冻结基模型的所有层,这些层不会在训练中更新 
for layer in base_model.layers: 
layer.trainable = False 
# 添加新的顶层 
x = Flatten()(base_model.output) 
x = Dense(1024, activation='relu')(x) 
x = Dropout(0.5)(x) 
predictions = Dense(1, activation='sigmoid')(x) 
# 构建整个模型 
model = Model(inputs=base_model.input, outputs=predictions) 
# 编译模型 
model.compile(optimizer=Adam(lr=0.0001), loss='binary_crossentropy', 
metrics=['accuracy']) 
history = model.fit( 
train_generator, 
epochs=10, 
validation_data=validation_generator 
) 
model.save('path_to_save_model.h5') 
from tensorflow.keras.layers import Input, Dense, concatenate 
from tensorflow.keras.models import Model 
# 假设特征维度 
input_geom = Input(shape=(geom_feature_size,)) 
input_color = Input(shape=(color_feature_size,)) 
input_texture = Input(shape=(texture_feature_size,))
# 可以为每种特征单独添加处理层 
x_geom = Dense(64, activation='relu')(input_geom) 
x_color = Dense(64, activation='relu')(input_color) 
x_texture = Dense(64, activation='relu')(input_texture) 
# 合并特征 
combined_features = concatenate([x_geom, x_color, x_texture]) 
# 添加更多层 
x = Dense(128, activation='relu')(combined_features) 
output = Dense(1, activation='sigmoid')(x) 
# 创建模型 
model = Model(inputs=[input_geom, input_color, input_texture], 
outputs=output) 
model.fit( 
[train_geom_features, train_color_features, train_texture_features], 
train_labels, 
validation_data=([val_geom_features, val_color_features, 
val_texture_features], val_labels), 
epochs=10, 
batch_size=32 
) 
from tensorflow.keras.layers import Input, Dense, concatenate, Dropout 
from tensorflow.keras.models import Model 
全部论文请见下方“ 只会建模 QQ名片” 点击QQ名片即可

http://www.hkcw.cn/article/YsQnTbOqqx.shtml

相关文章

6.3 计算机网络面试题

网络OSI模型和TCP/IP模型分别介绍一下 OSI 应用层:http htps DNS 为应用程序提供统一的接口表示层:将数据转换为兼容另一个系统能识别的格式会话层: 建立管理终止表示层实体之间的通信会话传输层: tcp udp 负责端到端的数据传输网络层: ip …

LeetCode 高频 SQL 50 题(基础版) 之 【高级查询和连接】· 下

上部分链接:LeetCode 高频 SQL 50 题(基础版) 之 【高级查询和连接】 上 题目:1164. 指定日期的产品价格 题解: select product_id,10 price from Products group by product_id having min(change_date) > 201…

ssm学习笔记day04

RequestMapping 首先添加依赖 Maven的配置 测试 在controller创建HelloController,如果只加RequestMapping,默认跳转到新页面 如果要是加上ResponseBody就把数据封装在包(JSON),标签RestController是前后分离的注解(因为默认用…

Spine工具入门教程4之网格与权重

1、概念 网格的定义: 启用网格,可以在图片内设置多边形,操纵多边形的顶点可以让图片变形。 权重的定义: 图解网格和权重的操作方法: 2、调整网格/权重 (1)设置网格 目前调整小臂骨骼对图片不…

吉他入门个人学习笔记

目录 一.一二期 1. 十二平均律 2.调音 3.弦数-音名-唱名 三.第三期 1.43231323训练 2.c大调二十四品常用音阶图 四.第四期 1.小星星 2.爬格子训练 五.第五期 六.第六期——大三和弦 和弦总览 1.C和弦 2.D和弦 3.E和弦 4.G和弦 5.A和弦 第七期.小三和弦 五百…

队列的讲解:C++队列的使用

一.队列的介绍: 队列是C/C中最基础的数据结构之一,队列本质上是一种线性表。它遵循着先进先出(fifo)的特点,在队列中一般在队尾插入,队头出队。这就相当于排队一样,刚入队的人需要排在队尾(rear),每次出队…

使用Process Explorer、System Informer(Process Hacker)和Windbg工具排查软件高CPU占用问题

目录 1、问题现象 2、使用Process Explorer和System Informer(该工具原先叫Process Hacker)查看占用CPU高的线程 3、使用System Informer工具时发现了一个关键细节 4、将Windbg附加到软件进程上,根据System Informer中显示的线程id到Wind…

华为云Flexus+DeepSeek征文|DeepSeek-V3/R1 商用服务开通全流程与本地部署搭建

华为云FlexusDeepSeek征文|DeepSeek-V3/R1 商用服务开通全流程与本地部署搭建 前言 如今大模型其性能出色,华为云 ModelArts Studio_MaaS大模型即服务平台华为云内置了大模型,能助力我们轻松驾驭 DeepSeek-V3/R1,本文中将分享如何…

传统业务对接AI-AI编程框架-Rasa的业务应用实战(1)--项目背景即学习初衷

我的初衷:我想学习AI。具体的方向是这样的:原本传统的平台业务去对接智能体。比如发票业务,发票的开具、审核、计税、回款等。根据用户在业务系统前台界面输入若干提示词 或者 语音输入简短语音信息,可以通过智能体给出需要处理的…

【八股消消乐】索引失效与优化方法总结

😊你好,我是小航,一个正在变秃、变强的文艺倾年。 🔔本专栏《八股消消乐》旨在记录个人所背的八股文,包括Java/Go开发、Vue开发、系统架构、大模型开发、具身智能、机器学习、深度学习、力扣算法等相关知识点&#xff…

Java面试八股--06-Linux篇

目录 一、Git 1、工作中git开发使用流程(命令版本描述) 2.Reset与Rebase,Pull与Fetch的区别 3、git merge和git rebase的区别 4、git如何解决代码冲突 5、项目开发时git分支情况 二、Linux 1、Linux常用的命令 2、如何查看测试项目的…

动态规划-647.回文子串-力扣(LeetCode)

一、题目解析 这里的子字符串是连续的,与之前的子序列不同,这里需要我们统计回文子串的数目。 二、算法原理 这里也有其他算法可以解决该问题,如中心扩展算法 时间复杂度O(N^2)/空间复杂度O(1),马拉车算法(具有局限性) 时间复杂…

条形进度条

组件 <template><view class"pk-detail-con"><i class"lightning" :style"{ left: line % }"></i><i class"acimgs" :style"{ left: line % }"></i><view class"progress&quo…

大模型赋能:金融智能革命中的特征工程新纪元

一、AI进化论&#xff1a;从“判别”到“生成”的金融新战场 1.1 判别式AI的“痛点”与大模型的“破局” 想象这样一幅画面&#xff1a;银行风控模型像老式收音机&#xff0c;需要人工反复调试参数才能捕捉风险信号&#xff1b;而大模型则是智能调音台&#xff0c;能自动“听…

HA: Wordy靶场

HA: Wordy 来自 <HA: Wordy ~ VulnHub> 1&#xff0c;将两台虚拟机网络连接都改为NAT模式 2&#xff0c;攻击机上做namp局域网扫描发现靶机 nmap -sn 192.168.23.0/24 那么攻击机IP为192.168.23.128&#xff0c;靶场IP192.168.23.130 3&#xff0c;对靶机进行端口服务探…

技巧小结:外部总线访问FPGA寄存器

概述 需求&#xff1a;stm32的fsmc总线挂载fpga&#xff0c;stm32需要访问fpga内部寄存器 1、分散加载文件将变量存放到指定地址即FPGA寄存器地址 sct文件指定变量存储地址&#xff0c;从而可以直接访问外设&#xff0c;&#xff08;28335也可以&#xff0c;不过用的是cmd文件…

深入理解 x86 汇编中的重复前缀:REP、REPZ/REPE、REPNZ/REPNE(进阶详解版)

一、重复前缀&#xff1a;串操作的 “循环加速器” 如果你写过汇编代码&#xff0c;一定遇到过需要重复处理大量数据的场景&#xff1a; 复制 1000 字节的内存块比较两个长达 200 字符的字符串在缓冲区中搜索特定的特征值 手动用loop指令编写循环&#xff1f;代码冗长不说&a…

【PCB设计】STM32开发板——原理图设计(电源部分)

一、PCB设计流程 二、准备工作 1.点击文件新建工程并命名 2.新建图页 在绘制较为复杂的原理图时&#xff0c;可以建立多个图页&#xff0c;使得原理图更加清晰。 右击原理图→新建图页 右击→重命名 3.设计规则相关配置 取消勾选第22个 4.调整页面大小 5.放置“电源树”图片…

C++仿RabbitMQ实现消息队列

前言 本项目将使用 C 在 Linux&#xff08;CentOS 7.6&#xff09; 环境下开发一个仿 RabbitMQ 的简易消息队列。 开发和调试环境如下&#xff1a; 操作系统&#xff1a;Linux (CentOS 7.6) 编辑器&#xff1a;Visual Studio Code / Vim 编译器&#xff1a;g&#xff08;GNU…

离散数学_数理逻辑(二):命题逻辑的推理

前言 每一件事都存在现象和本质.现象是表面,本质是内在.数学可以说是自然科学之母,是一切自然现象的本质.对于编程,表面上是在写代码,实际上是在用离散数学理解问题和解决问题. 引入 命题逻辑的推理部分. "推理"在思考中占了很大比重.笔者曾经把学习方法分了两种:一…