图像风格迁移笔记-海口c网

图像风格迁移笔记

article/2025/8/25 15:48:35

图像风格迁移

最早实现风格迁移的原理：
损失函数
- 内容损失函数
- 风格损失函数
- 融合内容损失函数与风格损失函数
可以融合多种风格图片的效果
同一个网络可以生成多种风格图像的效果
效果改进

在这里插入图片描述

最早实现风格迁移的原理：

最早出现的论文的实现想法是将风格图像、内容图像、白噪声图像输入到VGG19网络，利用求得的风格损失函数与内容损失函数，利用迭代，实现图像风格迁移。
在这里插入图片描述

损失函数

在这里插入图片描述
损失函数包括****内容损失与风格损失

在这里插入图片描述

内容损失函数

在这里插入图片描述

分析各层的输出特征图可以发现，浅层网络学习提取得到的特征多为像素、纹理等特征；深层网络结构学习提取的特征多是更偏向语义的特征
如下为使用不同的层来进行内容的重建的效果图：

可以发现，网络层数越深，重建的效果就越差，越更加偏向于语义

风格损失函数

在这里插入图片描述
向量点乘，可以反映出某两种特征之间的共线相关性。

反映出256个特征向量间的两两共线相关性，对角线上的数据为自身共线相关性。

下图是采用不同的层输出特征计算获得的格拉姆矩阵构建的风格损失函数获得的不同效果：
在这里插入图片描述
底层的网络捕获得到的风格特征是比较细小的风格特征；高层的网络结构捕获的风格特征是比较更宏观、更高层的原始风格特征。

只优化风格损失函数的话，获得的效果相当于是纹理生成。

融合内容损失函数与风格损失函数

在这里插入图片描述

在这里插入图片描述

可以融合多种风格图片的效果

在这里插入图片描述
思路是：将多张风格图的gram矩阵分别求出，获得一张图像与多张风格图gram矩阵的做差结果，得到损失函数，多个损失函数进行相加

同一个网络可以生成多种风格图像的效果

在这里插入图片描述

效果改进

最初的图像风格迁移实现的方式是，先生成随机噪音图像，然后经过不断地迭代优化实现风格迁移的学习，过程较慢、耗时；如下是优化后的方案，即加上一个生成网络的模块。

在这里插入图片描述

思路是：对输入的图像先经过**Feedforward Net(生成网络)**模块进行下采样，然后再进行上采样（反卷积）进行尺寸还原；将经过生成网络得到的图像再经过VGG16(已经训练好的ImageNet数据模型，可以更好地捕捉图像中重要信息)，与风格图像与内容图像进行差异对比

http://www.hkcw.cn/article/weKByIHScJ.shtml

相关文章

浏览器隐私：原理与检测方法

浏览器隐私：原理与检测方法

引言浏览器信号和详细信息是在线识别用户和防止欺诈的关键。这些数据包括用户代理字符串、JavaScript设置和屏幕分辨率等信息，有助于区分不同的浏览器。然而，一些用户会有意修改这些信号，使用用户代理欺骗等方法来隐藏自己的身份。虽然一些…

阅读更多...

python：在 PyMOL 中如何查看和使用内置示例文件？

python：在 PyMOL 中如何查看和使用内置示例文件？

参阅：开源版PyMol安装保姆级教程百度网盘下载提取码：csub pip show pymol 简介: PyMOL是一个Python增强的分子图形工具。它擅长蛋白质、小分子、密度、表面和轨迹的3D可视化。它还包括分子编辑、射线追踪和动画。可视化示例‌：打开 PyM…

阅读更多...

设计模式——建造者设计模式（创建型）

设计模式——建造者设计模式（创建型）

摘要本文详细介绍了建造者设计模式，这是一种创建型设计模式，旨在将复杂对象的构建过程与其表示分离，便于创建不同表示。文中阐述了其设计意图，如隐藏创建细节、提升代码可读性和可维护性，并通过构建电脑的示例加以说…

阅读更多...

深入Java性能调优：原理详解与实战

深入Java性能调优：原理详解与实战

一、JVM内存模型与GC机制原理： 堆内存结构： 新生代：Eden 2个Survivor区（Minor GC） 老年代：长期存活对象（Major GC/Full GC） 元空间：类元信息（替代永久代…

阅读更多...

acwing刷题

acwing刷题

目录 6122. 农夫约翰的奶酪块 6123. 哞叫时间 6122. 农夫约翰的奶酪块 #include <iostream> using namespace std; int res; int n, q; int X[1010][1010]; int Y[1010][1010]; int Z[1010][1010]; void solve() {int x, y, z;cin >> x >> y >> z;X…

阅读更多...

姜老师的MBTI课程：MBTI是可以转变的

姜老师的MBTI课程：MBTI是可以转变的

我们先来看内向和外向这条轴，I和E内向和外向受先天遗传因素的影响还是比较大的，因为它事关到了你的硬件，也就是大脑的模型。但是我们在大五人格的排雷避坑和这套课程里面都强调了一个观点，内向和外向各有优势，也各有不…

阅读更多...

leetcode hot100刷题日记——34.将有序数组转换为二叉搜索树

leetcode hot100刷题日记——34.将有序数组转换为二叉搜索树

First Blood：什么是平衡二叉搜索树？ 二叉搜索树（BST）的性质左小右大：每个节点的左子树中所有节点的值都小于该节点的值，右子树中所有节点的值都大于该节点的值。子树也是BST：左子树和右子树也…

阅读更多...

使用yocto搭建qemuarm64环境

使用yocto搭建qemuarm64环境

环境 yocto下载 # 源码下载 git clone git://git.yoctoproject.org/poky git reset --hard b223b6d533a6d617134c1c5bec8ed31657dd1268 构建 # 编译镜像 export MACHINE"qemuarm64" . oe-init-build-env bitbake core-image-full-cmdline 运行 # 跑虚拟机 export …

阅读更多...

探索TiDB数据库：WordPress在分布式数据库上的部署实践

探索TiDB数据库：WordPress在分布式数据库上的部署实践

作者： 江湖有缘原文来源： https://tidb.net/blog/359d4e00 引言在当今数据驱动的互联网应用中，数据库的性能与可扩展性已成为系统架构中的关键一环。WordPress 作为全球最流行的网站内容管理系统之一，传统上依赖于 MySQL 等…

阅读更多...

2.3JS变量和数据类型m

2.3JS变量和数据类型m

1.认识JS变量变化数据的记录--变量 2.变量的命名格式在JS中如何命名一个变量呢变量的声明：在JS中声明一个变量使用var关键字（variable单词的缩写）（后续学习ES6还有let、const声明方式） 变量赋值：使用给变…

阅读更多...

深度学习总结（41）

深度学习总结（41）

微调预训练模型另一种常用的模型复用方法是微调，如图所示，它与特征提取互为补充。微调是指，对于用于特征提取的已冻结模型基，将其顶部几层“解冻”，并对这解冻的几层与新增加的部分（本例中为全连接分类…

阅读更多...

QT入门学习

QT入门学习

一: 新建QT项目二:QT文件构成 2.1 first.pro 项目管理文件，下面来看代码解析 QT core guigreaterThan(QT_MAJOR_VERSION, 4): QT widgetsCONFIG c11TARGET main# The following define makes your compiler emit warnings if you use # any Qt feature …

阅读更多...

kaggle 预测房价

kaggle 预测房价

利用简单的线性模型，训练kaggle 房屋数据集： import os import random import tarfile import time import zipfile import pandas as pd import requests import torch from torch import nn from torch.utils import data from matplotlib import pyp…

阅读更多...

ASP.NET Core SignalR的基本使用

ASP.NET Core SignalR的基本使用

文章目录前言一、SignalR是什么？在 ASP.NET Core 中的关键特性：SignalR 工作原理简图： 二、使用步骤1.创建ASP.NET Core web Api 项目2.添加 SignalR 包3.创建 SignalR Hub4.配置服务与中间件5.创建控制器(模拟服务器向客户端发送消息)6.创建…

阅读更多...

AI书签管理工具开发全记录（七）：页面编写与接口对接

AI书签管理工具开发全记录（七）：页面编写与接口对接

文章目录 AI书签管理工具开发全记录（七）：页面编写与接口对接前言 📝1. 页面功能规划 📌2. 接口api编写 📡2.1 创建.env,设置环境变量2.2 增加axios拦截器2.3 创建接口 2. 页面编写 📄2.1 示例代…

阅读更多...

“AI 编程三国杀” Google Jules, OpenAl Codex, Claude Code，人类开始沦为AI编程发展的瓶颈？

“AI 编程三国杀” Google Jules, OpenAl Codex, Claude Code，人类开始沦为AI编程发展的瓶颈？

AI 编程三国杀：Google Jules, OpenAI Codex, Claude code “AI 编程三国杀”是一个形象的比喻，借指当前 AI 编程领域中几个主要参与者之间的激烈竞争与并存的局面。这其中，Google、OpenAI 以及 Anthropic (Claude 的开发者) 是重要的“国家”，而它们各自的 AI 编程工具则是…

阅读更多...

【Redis技术进阶之路】「原理分析系列开篇」分析客户端和服务端网络诵信交互实现（服务端执行命令请求的过程 - 文件事件处理部分）

【Redis技术进阶之路】「原理分析系列开篇」分析客户端和服务端网络诵信交互实现（服务端执行命令请求的过程 - 文件事件处理部分）

分析客户端和服务端网络诵信交互实现【专栏简介】【技术大纲】【专栏目标】【目标人群】1. Redis爱好者与社区成员2. 后端开发和系统架构师3. 计算机专业的本科生及研究生命令请求的执行过程案例分析介绍发送命令请求读取命令请求客户端状态的argv属性和argc属性命令执行器第…

阅读更多...

第29次CCF计算机软件能力认证-3-LDAP

第29次CCF计算机软件能力认证-3-LDAP

LDAP 刷新时间限制： 10.0 秒空间限制： 512 MiB 下载题目目录（样例文件） 题目背景西西艾弗岛运营公司是一家负责维护和运营岛上基础设施的大型企业，拥有数千名员工。公司内有很多 IT 系统。为了能够实现这些…

阅读更多...

2025年- H63-Lc171--33.搜索旋转排序数组(2次二分查找，需二刷）--Java版

2025年- H63-Lc171--33.搜索旋转排序数组(2次二分查找，需二刷）--Java版

1.题目描述 2.思路输入：旋转后的数组 nums，和一个整数 target 输出：target 在 nums 中的下标，如果不存在，返回 -1 限制：时间复杂度为 O(log n)，所以不能用遍历，必须使用二分查找…

阅读更多...

HomeKit 基本理解

HomeKit 基本理解

概括 HomeKit 将用户的家庭自动化信息存储在数据库中，该数据库由苹果的内置iOS家庭应用程序、支持HomeKit的应用程序和其他开发人员的应用程序共享。所有这些应用程序都使用HomeKit框架作为对等程序访问数据库. Home 只是相当于 HomeKit 的表现层,其他应用在实现 …

阅读更多...

推荐文章