斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)

article/2025/7/5 21:35:39

来源:Github

编辑:大明、小芹

【新智元导读】吴恩达斯坦福大学CS230《深度学习》课程内容归纳总结放出,全文干货。对于不方便正式上课的同学们来说,相信这份核心内容总结一定会对你有所帮助。

作为全球计算机四大名校之一,斯坦福大学的CS230《深度学习》课程一直受到全球计算机学子和从业人员的热烈欢迎。

CS230授课人为全球著名计算机科学家吴恩达和他的助教Kian Katanforoosh。

日前,MIT的Afshine Amidi 和斯坦福大学的Shervine Amidi在博客上整理了一份CS230课程知识点的归纳总结,在Reddit上引发热议。

评论网友纷纷表示喜大普奔,对于没有条件上课或者没赶上授课时间的人来说,看看这份总结贴也能获益颇丰。

这份总结提要基本遵循CS230的授课思路和流程,分三大方面由浅入深地介绍了深度学习的基本概念、网络模型、研究和实验操作方法等。三部分内容分别为:卷积神经网络、递归神经网络、提示与技巧。

本文主要介绍这份总结的第一部分,即CNN部分的内容,后两部分RNN、窍门与技巧部分,读者可自行参看Github上放出的资源:

卷积神经网络(CNN)

https://stanford.edu/~shervine/teaching/cs-230/cheatsheet-convolutional-neural-networks

递归神经网络(RNN)

https://stanford.edu/~shervine/teaching/cs-230/cheatsheet-recurrent-neural-networks

技巧与窍门

https://stanford.edu/~shervine/teaching/cs-230/cheatsheet-deep-learning-tips-and-tricks

囊括全部内容的“超级VIP”pdf下载

https://github.com/afshinea/stanford-cs-230-deep-learning/blob/master/super-cheatsheet-deep-learning.pdf

卷积神经网络结构:卷积层、池化层、全连接层

传统的卷积神经网络由输入图像、卷积层、池化层和全连接层构成。

卷积层(CONV):使用过滤器执行卷积操作,扫描输入大小。它的超参数包括滤波器的Size和Stride。结果输出O称为特征映射或激活映射。

池化层(POOL)是一种下采样操作,通常在卷积层之下使用,该卷积层执行一些空间不变性。其中最大池化和平均池化属于特殊操作,分别采用最大值和平均值。

全连接层(FC)在平坦输入上运行,每个输入都连接到所有神经元。如果全连接层存在,通常位于网络体系结构的末尾,可用于优化诸如分类评分等目标。

过滤器超参数

过滤器维度: 大小为F×F的过滤器应用在C channel上维度为F×F×C。

Stride:对于卷积和池化操作而言,Stride表示每次操作后窗口移动的像素数量。

Zero-padding表示对输入边界的每一端加入P个零的过程。这个值可以通过下图中所示的三个方式手动指定,也可以自动设置。

超参数的调整

卷积层中的超参数兼容性:记输入量长度为I,过滤器长度为F,补零数量为P,Stride量为S,则该维度下特征映射的输出大小O可用下式表示:

理解模型的复杂度:为了获取模型复杂度,常常可以通过相应架构下的参数数量来达到这一目标。在给定的卷积神经网络层中,该过程如下图所示:

感受野:层K上的感受野区域记为Rk×Rk,即第K次激活映射可以“看见”的每个输入像素。若层j上的过滤器大小为Fj,层 i上的Stride值为Si,且 S0=1,则层k上的感受野可以由下式计算出:

常用激活函数

整流线性单元 : 整流线性单元层(ReLU)是激活函数g,作用于所有元素。它旨在为网络引入非线性特征,其变量总结在下图中:

Softmax:可以视作一个作用于网络架构末端通用逻辑函数,输入为分数向量,输出为概率向量。其定义如下:

物体检测

模型的类型:

有三类主要的物体识别算法,其预测的性质是不同的。如下表的描述:

三类物体识别算法

检测(Detection)

在对象检测的上下文中,根据我们是仅想要定位对象还是想要在图像中检测更复杂的形状,可以使用不同的方法。下面总结了两个主要的方法:

边界框检测和特征点检测

Intersection over Union:

Intersection over Union(交并比),也称为IoU,是一种量化预测边界框在实际边界框上的正确定位的函数。它的定义是:

备注:IoU∈[0,1]。按照惯例,如果IoU(Bp,Ba)⩾0.5,预测边界框Bp被认为是合理的。

Anchor boxes:

Anchor boxing是一种用于预测重叠边界框的技术。在实际应用中,网络可以同时预测多个box,其中每个box的预测被约束具有给定的一组几何特性。例如,第一个预测可能是给定形状的矩形框,而第二个预测可能是另一个形状不同的矩形框。

Non-max suppression:

Non-max suppression技术旨在通过选择最具代表性的对象来删除同一对象的重叠边界框。在删除了概率预测低于0.6的所有框之后,在剩余框中重复以下步骤:

对于一个给定的类,

步骤1:选择具有最大预测概率的框。

步骤2:删除任何与前一个框的IoU⩾0.5的框。

YOLO - You Only Look Once这是一种对象检测算法,它执行以下步骤:

步骤1:将输入图像分割成G×G的网格。

步骤2:对于每个网格单元,运行一个CNN网络,预测下面公式中的y:

其中是检测对象的概率,是检测到的边界框的属性,是检测到的p类的one-hot representation,k是anchor boxes的数量。

步骤3:运行 non-max suppression 算法,删除任何可能的重复重叠边界框。

R-CNN

Region with Convolutional Neural Networks (R-CNN) 是一种对象检测算法,它首先对图像进行分割以找到潜在的相关边界框,然后运行检测算法,在那些边界框中找到最可能的对象。

备注:虽然原始算法计算成本高且速度慢,但新的架构能让算法运行得更快,例如Fast R-CNN和Faster R-CNN。

面部验证和识别

模型类型:下面总结了两种主要类型的模型:

One Shot Learning

One Shot Learning是一种面部验证算法,它使用有限的训练集来学习相似函数,该函数量化两个给定图像的差异。应用于两个图像的相似度函数通常被标注为d(image 1,image 2).。

Siamese Network

Siamese Networks的目的是学习如何编码图像,然后量化不同的两个图像。对于给定的输入图像,编码输出通常记为

Triplet loss

Triplet loss ℓ是在图像A (anchor), P (positive) 和N (negative)这三个图像的嵌入表示上计算的损失函数。 anchor和positive示例属于同一个类,negative示例属于另一个类。通过调用margin参数,该损失定义如下:

神经风格迁移

动机:

神经风格转移(neural style transfer)的目标是基于给定内容C和给定风格S,生成图像G。

激活:

在给定层l中,激活被标记为,并且具有维度

内容成本函数(Content cost function)

内容成本函数用于确定生成的图像G与原始内容图像C的不同之处。它的定义如下:

风格矩阵(Style matrix)

style matrix是一个Gram矩阵,其中每个元素量化了通道k和k'的相关性。它是根据激活定义的:

风格成本函数(Style cost function )

风格成本函数用于确定生成的图像G与风格S的不同之处。它的定义如下:

总成本函数(Overall cost function)

总成本函数的定义是内容和风格成本函数的组合,由参数α, β加权,如下所示:

使用计算技巧的架构

生成对抗网络(Generative Adversarial Network)

生成对抗网络,也称为GAN,由生成模型和判别模型组成,其中生成模型旨在生成最真实的输出,这些输出将被用于区分生成图像和真实图像。

ResNet(Residual Network)

残差网络架构(也称为ResNet),使用具有大量层的residual blocks来减少训练误差。 residual blocks 具有以下特征:

Inception Network

该架构使用 inception modules,目的是尝试不同的卷积,以通过特征的多样化来提高其性能。具体来说,它使用1×1卷积技巧来限制计算负担。

原文链接:

https://stanford.edu/~shervine/teaching/cs-230/cheatsheet-convolutional-neural-networks


http://www.hkcw.cn/article/SYZVGgnubL.shtml

相关文章

江苏网警通报“江苏刘老师系列”猥亵儿童视频案件

8月16日下午,江苏网警发布通告,对网友十分关注的“江苏刘老师系列”猥亵儿童视频案作出说明: 8月15日,江苏网警接多位网友举报,网络流传一标题为“江苏刘老师媲美欣”猥亵儿童系列淫秽视频,希望公安机关调查处理。经核查,该案已查处。2016年3月,江苏淮安网警在办理一…

动车拒让座网友已吵翻,让不让座真是个道德问题?

“尊老爱幼是我们中华民族的传统美德,请您尽量把座位让给老弱病残孕以及带小孩的乘客。”乘坐公交车时,广播里总是不停播放着这句话。通常在公交车或地铁上,如果我们遇到老幼病残孕,大多数人可能会起身将自己的座位让给他们。 但如果在动车上,你买的是坐票,买无坐票的老人…

深圳地铁表白文案,每一句都有故事!

▲ 深圳地铁表白文案发车了, 网友直呼:单身车厢扎心了! 近日,深圳开地铁表白专列,在1号线运行1个月,5月8日发车,每天巡回行驶,还有单身专用车厢! 发车当天,就已刷爆当地朋友圈,在上千条表白中,有对喜欢的人,也有对父母、城市,甚至有对陌生人的表白… 因为一个人,…

反腐剧《人民的名义》1-56全集剧情介绍 刘庆祝的妻子魏彩霞现身说法

人民的名义第27集剧情介绍 赵瑞龙和李达康谈起欧阳菁被逮捕之事,李达康猜出此事来拢去脉,赵瑞龙按赵立春的意思传达了三条建议。高育良不明白赵瑞龙来吕州的目的,当年的美食城是他批的,那时也是为了发展第三产业。沙瑞金来到月芽湖考察,美食城拆迁势在必行,沙瑞金通过易学习了解…

当年科比对尼克斯砍下61分,真的太华丽了

2009年2月4日,科比对尼克斯全场比赛出战36分钟,31投19中,其中三分球6投3中,罚球20罚全中,砍下61分。看看科比的表演,过人、梦幻脚步、中投,真的美如画。 科比vs尼克斯61分原声集锦>

比悲伤更悲伤的故事 听听那时我们的爱情

1980年出生的中国台湾青年杨明学不能算是一个走运的人——原本家境不错、才华满身的他,2002年在加拿大留学期间不幸被检查出肌肉软组织肿瘤,一种十分罕见的病例,他不得不返回台湾就医——说是就医,不过是回到故土,度过生命最后的时光。 年轻的杨明学是一个业余的作词人,这…

盘发党丨齐肩发的春天,N款编发盘发教程天天不重样!

齐肩发编发发型扎法步骤教程 步骤一:从头顶的一侧取出两缕发丝,分成三股。步骤二:将头发按照编织麻花辫的步骤开始编发。展开全文步骤三:如图中所以这样编辫子。 步骤四:编发的过程中,取少量头发加入编发中。步骤五:一直按照以上的方法将辫子编到后脑勺处。步骤六:然后…

全智贤林允儿颜值逆天 韩国女神们代言的美肌品盘点

去年,全智贤获广告模特儿好感度排行榜冠军,她代言的化妆品也火了一把。纵观韩系美妆品,但凡有个女神模样的代言人,销量都差不到哪里去。韩国女神就是品牌力量,看看全MM、允儿的逆天颜值,她们代言的美肤品值得收了!(更多护肤小知识,请关注微信:hufumaster) 全智贤代言…

收藏 适合婚礼用的25首英文歌曲

收藏 | 适合婚礼用的25首英文歌曲 2015-03-20一分钟英语 一分钟英语 微信号 one6399 功能介绍 学英语,每天只需一分钟! 提示:点击上方一分钟英语一键关注25首以英文歌为主的婚礼用曲,在这些歌曲的见证下,办一场最美的婚礼吧~~ 1:Beauty and the Beast 原因:选择此曲当然不…

原创李念和51岁富豪老公罕见合照,生俩娃脸还美得像少女,笑靥如花

李念和51岁富豪老公罕见合体出席聚会!她一袭露肩红裙明艳贵气,太有当家主母的气场,生俩娃脸还美得像少女,笑靥如花,美得格外清甜又娇俏。展开全文李念,1985年1月30日出生于湖北省荆门市京山市,毕业于上海戏剧学院本科表演系2002级。李念小时候的志向是当一名英姿飒爽的女…

世界上最长的蛇有多长?网传55米长巨蟒曾吓晕路人

说到蛇,大家可能听过一个成语,那就是“蛇蝎心肠”,由此可见,人们对蛇的印像是极其不好的,这不仅仅是因为根深蒂固的对蛇的印像,还以为蛇本身是一种带有剧毒的生物,世界上最毒的蛇咬一口分泌的毒液可以毒死100个人。对于这种毒物,就如同是老鼠一样,只要见找着了,就不会…

考生发现高考考场是自己的初中班级 回忆满满迎高考

高考前夕,一位考生在查看考场时惊讶地发现,自己的考场竟然是曾经就读的初中班级。这一巧合让他瞬间回想起许多往事,心中充满了感慨。有网友评论说,这个地方见证了他从初中到高中的成长,也将会见证他迈入大学的时刻。2025年的全国统一高考将于6月7日开始。考试前一天,考生…

上海市中心最实惠电影院在哪里?18元看热门大片,咂劲伐!

每周四晚上 位于市中心的 静安区文化馆“静剧场” 设置了院线大片特惠档 花18元 观众就能看到时下最新上映的大片 比如《封神》《孤注一掷》 《巨齿鲨2》…… 这里,可以说是 上海市中心区域最实惠的电影院了 在市中心 18元看大片周四晚上,记者来到乌鲁木齐北路459号静安区文化…

雄安新区首次承接高考工作 科技护航安全考试

今年是雄安新区自成立以来首次承接高考工作,共设有3个考区、7个考点、243个考场。新区充分运用现代科技手段,全面升级了考场监控系统、身份识别系统和作弊防控系统,对试卷运送、保管、分发、回收等关键环节实施全程无死角监控与GPS定位,并利用大数据优化考点周边的交通调度…

孟加拉国定于明年4月举行大选 临时政府推动公平选举

孟加拉国临时政府首席顾问尤努斯于6日宣布,该国将于2026年4月上旬举行大选。他在全国电视讲话中表示,选举委员会将在适当时候公布详细的选举路线图。目前,临时政府正致力于营造良好的选举环境,并已与各政党展开对话,力求实现公平选举。此前,2024年8月4日,孟加拉国爆发了…

原创韩国女网红因大码走红,42岁身材好过卡戴珊,今恋上21岁鲜肉

人们经常会说一句话,不要轻言放弃,因为该来的都会来,当然这也包括爱情。可能很多人觉得自己二三十岁了,还没有遇到一个特别喜欢的人,这是不是就说明这辈子就无法遇到一个特别中意的人呢?但是韩国女神金宥利就是这个样子。不过这个金宥利可不是那个年纪轻轻就选择结束生命…

高考首日 考生家长举两米向日葵送考 旗开得胜一举夺魁

6月7日,2025年高考首日在湖南长沙天心考区长郡中学考点举行。一辆车牌带有“985”的警车吸引了众多考生和家长的目光。两位民警站在车前,祝愿考生们妙笔生花,金榜题名。现场还看到一些家长特意穿上旗袍送考,希望孩子能够旗开得胜。还有一些家长准备了向日葵,寓意孩子能一举…

复旦大学教师于娟用生命写下的日记:活着才是王道

2011年4月19日,复旦大学海归博士、抗癌教师于娟的生命终结了。她在患病15个月的时间内,在病榻上陆续写下了生命日记:“我想告诉大家,什么是我拿命试过,此路不通。”这些用最后的生命写成的忠告,是非常值得大家,特别是值得白领们一读的。 于娟在得病前,过的是一种典型的…

【使用指南】移动图书馆:掌心里的阅读“神器”!

移动图书馆是什么? 它是一款为图书馆读者提供阅读服务的移动端应用,同时可以远程查询馆藏、续借馆内纸质书籍。让读者在任何时间任何地点都能享受到河源市图书馆提供的阅读服务。 移动图书馆有什么特点? 01 一站式检索 点击首页搜索框,输入关键词,点击搜索即可进入结果页面…

长治公安公开征集崔志明等人违法犯罪线索

长治市公安局上党分局正在侦办崔志明等人犯罪团伙案件。该团伙自2023年8月以来,采用谩骂和堵门滋事等手段,高价强揽、垄断上党区裕民小区8号楼(黎都名府小区)的装修上料市场。目前,主要犯罪嫌疑人崔志明(绰号“明的”)、刘志刚(绰号“刚的”)、牛小兵等人已被抓获,为深挖犯…