一天搞懂深度学习--李宏毅教程笔记-海口c网

一天搞懂深度学习--李宏毅教程笔记

article/2025/8/2 21:13:22

目录

1. Introduction of Deep Learning
- 1.1. Neural Network - A Set of Function
- 1.2. Learning Target - Define the goodness of a function
2. Tips for Training Deep Neural Network
3. Variant of Neural Network
4. Next Wave

对一天搞懂深度学习–李宏毅教程分享内容做读书笔记，对深度学习中的神经网络进行介绍

1. Introduction of Deep Learning

深度常用于语音识别、手写文字识别、围棋、对话等多个领域。

深度学习的目标是构建一个模型，这个模型就是Network就是指神经网络，深度学习就是构建这个模型的过程。构建这个模型的过程只有三步：

在这里插入图片描述

1.1. Neural Network - A Set of Function

首先介绍这个模型（神经网络）是什么样子的。

先介绍神经元，Neuron也是一种函数，如下所示

在这里插入图片描述

其中激活函数Activation Function为Sigmoid：

在这里插入图片描述
由多个神经元相互全连接即为全连接的反向网络Fully Connect Feedforward Network，由多层Layers组成（不同模型Layers不同），如下图所示

在这里插入图片描述
记作 ${y_1,...y_M\}=f(\{x_1,...,x_N\})$

最终的输出使用softmax激活函数进行归一化，用于将每种输出转换为概率分布

在这里插入图片描述
最终得到

在这里插入图片描述

神经网络算法 - 一文搞懂 Softmax 函数

神经网络本质就是一种函数关系，不同的input vector可得到不同的output vector

在这里插入图片描述

1.2. Learning Target - Define the goodness of a function

知道模型的样子之后，深度学习的目标是找到神经网络中最合适的weights和bias。

怎么定义最合适？最合适的意思是，这个模型的输出是我们想要的理想输出。所以，使用已经标记好的训练数据喂给模型，模型的输出应该是我们的理想期望值。

例如，手写识别场景下，输入左图，期望输出应该是y2为最大值（表示模型的预期输出是2），使用softmax激活函数则期望输出为 $\hat{y}=[0,1,0,...,0]$

在这里插入图片描述
所以，模型应该适应我们的训练数据。即给定训练数据输入 $\{\hat{x}_1,...,\hat{x}_{256}\}$ ，模型的输出应该最接近我们的训练数据输出 $\{\hat{y}_1,...,\hat{y}_{10}\}$ 。

最接近的含义就是square error最小，这个square error就叫损失函数，如下，其中R就为训练样本个数
$l_r=\sum_{i=1}^{R}{(y_i-\hat{y}_i)^2}$
而且满足
$\{\hat{y}_1,...\hat{y}_{10}\}=f(\{w_1,...,w_{N},b_1,...,b_{M}\},\{\hat{x}_1,...,\hat{x}_{256}\})$

例如上图损失函数就为 $l=(y_1-0)^2+(y_2-1)^2+(y_3-0)^2+...+(y_{10}-0)^2$

那么整个模型的损失函数就为

$l=\sum_{i=1}^{R}{l_r}$

所以，深度学习的终极目的是，寻找合适的 ${w_1,...,w_{N},b_1,...,b_{M}\}$ 使上述 $l$ 最小。

2. Tips for Training Deep Neural Network

3. Variant of Neural Network

4. Next Wave

http://www.hkcw.cn/article/nSolYvwnhN.shtml

相关文章

【Canvas与色彩】八彩大风车

【Canvas与色彩】八彩大风车

【成图】【代码】 <!DOCTYPE html> <html lang"utf-8"> <meta http-equiv"Content-Type" content"text/html; charsetutf-8"/> <head><title>八彩风车 Draft1</title><style type"text/css"&…

阅读更多...

Linux权限

Linux权限

文章目录一、Linux用户权限1.1权限的概念1.2 用户分类##1.3切换用户1.4sudo提权二、Linux文件权限2.1文件属性2.2文件的类型2.3 基本权限##2.4权限划分三、Linux文件权限的修改方法3.1 chmod3.1.1操作符3.1.2数字模式 3.2chown3.3chgrp3.4目录文件权限的具体剖析3.4.1目录的…

阅读更多...

70.新增用户内容复制功能

70.新增用户内容复制功能

对于AI回答的内容可以复制和重新生成功能，对于用户则没有复制等功能，所以想了一下觉得还是很有必要添加该功能首先，修改用户消息的模板部分，添加复制按钮： 然后，更新CSS样式以确保按钮正确显示。因为之前…

阅读更多...

暴雨和强对流双预警齐发多地迎极端天气挑战

暴雨和强对流双预警齐发多地迎极端天气挑战

中央气象台今日6时继续发布暴雨蓝色预警和强对流天气蓝色预警。福建、广东、广西等六地将有大到暴雨，我国多地将有8级以上雷暴大风或冰雹天气。端午假期最后一天，出行前需关注天气变化。预计6月2日8时至3日8时，福建东部和南部沿海、广东中南部、广西南部、云南西北部和东部、…

阅读更多...

Go语言中的rune和byte类型详解

Go语言中的rune和byte类型详解

1. rune类型 1.1. 基本概念 1. rune是Go语言的内建类型，它是int32的别名，即32位有符号整数； 2. 用于表示一个Unicode码点，全拼Unicode code point； 3. 可以表示任何UTF-8编码的字符； 1.2. 特点 1. 每…

阅读更多...

基于mediapipe深度学习的虚拟画板系统python源码

基于mediapipe深度学习的虚拟画板系统python源码

目录 1.前言 2.算法运行效果图预览 3.算法运行软件版本 4.部分核心程序 5.算法仿真参数 6.算法理论概述 7.参考文献 8.算法完整程序工程 1.前言虚拟画板系统基于计算机视觉与深度学习技术，通过摄像头捕获用户手部动作，利用 MediaPipe框架实现手…

阅读更多...

AUTOSAR图解==＞AUTOSAR_SWS_DIODriver

AUTOSAR图解==＞AUTOSAR_SWS_DIODriver

AUTOSAR DIO驱动器详解基于AUTOSAR 4.4.0规范的DIO驱动架构、配置与应用目录 1. 引言2. DIO驱动架构 2.1 DIO在AUTOSAR架构中的位置2.2 DIO驱动的功能概述 3. DIO驱动的数据类型和API 3.1 基本数据类型3.2 API接口3.3 错误检测 4. DIO驱动的操作流程 4.1 通道操作4.2 端口操…

阅读更多...

Python数据类型详解：从字符串到布尔值，一网打尽

Python数据类型详解：从字符串到布尔值，一网打尽

Python是现代编程语言中非常流行的一种，它的语法简洁、易懂，非常适合初学者。而在Python编程中，“数据类型”是最基础也是最重要的概念。理解这个概念，将为你之后的编程打下坚实的基础。 1. 什么是数据类型？ 在Pytho…

阅读更多...

lc hot 100之：双指针题目对比

lc hot 100之：双指针题目对比

写到两个给我感觉很类似的双指针题目，但是代码不同，我想把两个题放在一起，对比着看看。第一题： 首先，提到“重复”，比较好想到哈希表。访问过就在哈希表里记录，然后只要找哈希表中有没有这个数…

阅读更多...

6.01打卡

6.01打卡

浙大疏锦行 DAY 40 训练和测试的规范写法知识点回顾： 1. 彩色和灰度图片测试和训练的规范写法：封装在函数中 2. 展平操作：除第一个维度batchsize外全部展平 3. dropout操作：训练阶段随机丢弃神经元，测试阶段eval模…

阅读更多...

SIM——引入双阶段搜索机制在用户行为序列的同时关注动态兴趣

SIM——引入双阶段搜索机制在用户行为序列的同时关注动态兴趣

文章目录 1. 背景2. 方法2.1 GSU2.1.1 Hard Search2.1.2 Soft Search 2.2 ESU 这里来回顾一篇经典的文章 SIM（Search-based Interest Model），也是自己学习一下，虽然挺久了，但是业界都在使用这个，说明含金量…

阅读更多...

LeRobot ACT——LeRobot对ALOHA ACT策略的封装：含源码解析与真机部署(效果比肩ACT原论文)

LeRobot ACT——LeRobot对ALOHA ACT策略的封装：含源码解析与真机部署(效果比肩ACT原论文)

前言本文一开始是此文的第一部分，后随着我司各大具身团队对各个动作策略的实践、深入，觉得可以挖掘且分享的细节越来越多，比如LeRobot ACT，其效果也不错 ALOHA ACT的复现与应用：双臂下的智能分拣场景故把其中的「Le…

阅读更多...

【Linux网络编程】网络层IP协议

【Linux网络编程】网络层IP协议

目录 IP协议的协议头格式网段划分特殊的IP地址 IP地址的数量限制私有IP地址和公网IP地址路由 IP协议的协议头格式 4位版本号 ：指定IP协议的版本，对于IPv4，版本号就是4。 4位首部长度：表名IP协议报头的长度，单…

阅读更多...

微调大模型：什么时候该做，什么时候不该做？

微调大模型：什么时候该做，什么时候不该做？

目录一、什么是“微调”？你真的需要它吗？ 二、什么时候不该微调？ 🚫 不该微调的 5 个典型场景： 1. 通用问答、闲聊、常识类内容 2. 企业内部问答 / 文档助手 3. 想要通过微调“学会格式” 4. 没有大量高质量标…

阅读更多...

[AD] CrownJewel-1 Logon 4799+vss-ShadowCopy+NTDS.dit/SYSTEM+$MFT

[AD] CrownJewel-1 Logon 4799+vss-ShadowCopy+NTDS.dit/SYSTEM+$MFT

QA QA攻擊者可以濫用 vssadmin 實用程式來建立卷影快照，然後提取 NTDS.dit 等敏感檔案來繞過安全機制。確定卷影複製服務進入運作狀態的時間。2024-05-14 03:42:16建立卷影快照時，磁碟區複製服務會使用機器帳戶驗證權限並列舉使用者群組。找到卷影複製過…

阅读更多...

系统思考：整体观和心智模式

系统思考：整体观和心智模式

如果你是小区管委会的主委，面对住户抱怨“电梯太慢，每次都要花很久等电梯”，是不是第一反应就是——换马达、更新软件，甚至换整台电梯？这其实是典型的“线性思维”陷阱——把问题看成孤立的零件故障。从系统思考的角…

阅读更多...

常见相机的ISP算法

常见相机的ISP算法

常见的ISP算法 3A算法去雾算法图像增强算法图像宽动态算法图像的电子缩放算法，无极电子缩放图像降噪算法相机常见问题 1.相机启动速度问题，启动速度较慢 2.相机扛不住高低温问题 3.相机散热问题问题 4.相机高低温芯片保护掉电 5.相机的成像效果或者…

阅读更多...

黑马Java面试笔记之框架篇（Spring、SpringMvc、Springboot）

黑马Java面试笔记之框架篇（Spring、SpringMvc、Springboot）

一. 单例bean Spring框架中的单例bean是线程安全的吗？ Spring框架中的bean是单例的，可以在注解Scope()进行设置 singleton：bean在每一个Spring IOC容器中只有一个实例。prototype：一个bean的定义可以有多个实例总结二. AOP AOP称…

阅读更多...

【Go】2、Go语言实战

【Go】2、Go语言实战

前言本系列文章参考自稀土掘金上的【字节内部课】公开课，做自我学习总结整理。前置知识本篇将涉及到一些在命令行的输入输出操作，之前我们已经学习了fmt包用于输出内容，下面将介绍bufio包用于读入数据。 bufio包简介 bufio 是 Go 标准库…

阅读更多...

基于Python与本地Ollama的智能语音唤醒助手实现

基于Python与本地Ollama的智能语音唤醒助手实现

项目简介本项目是一个基于 Python 的智能语音助手，集成了语音录制、语音识别、AI对话和语音合成功能。用户可以通过语音与本地部署的 Ollama 大模型进行自然对话。技术架构核心功能模块语音录制 - 使用 sounddevice 录制用户语音语音识别 - 使用 faster-whi…

阅读更多...

推荐文章