序列搜索策略

article/2025/7/3 13:24:14

序列搜索策略

贪心搜索(greedy search)

  • 在大语言模型中, 对于输出序列的每一时间步t′, 我们都将基于贪心搜索从Y中找到具有最高条件概率的词元,即:
    y t ′ = argmax ⁡ y ∈ Y P ( y ∣ y 1 , … , y t ′ − 1 , c ) y_{t^{\prime}}=\underset{y \in \mathcal{Y}}{\operatorname{argmax}} P\left(y \mid y_1, \ldots, y_{t^{\prime}-1}, \mathbf{c}\right) yt=yYargmaxP(yy1,,yt1,c)
    一旦输出序列包含了“”或者达到其最大长度限制,则输出完成。

    即将当前时刻预测概率最大的词输出

    image-20250602223404094

  • 贪心搜索是效率最高的,但是贪心搜索很可能不是最优的,可以看下面的例子

    在时间步2的时候,选择具有第二高条件概率的词元“C”(而非最高条件概率的词元)

    image-20250602223529773

    因为我们在第二步没有选择最优,导致后续的预测词元概率发生了变化,从而形成了更好的结果


穷举搜索(exhaustive search)

  • 如果目标是获得最优序列, 我们可以考虑使用穷举搜索(exhaustive search): 穷举地列举所有可能的输出序列及其条件概率, 然后计算输出条件概率最高的一个。

  • 最优的算法:对所有可能的序列,计算他的概率,然后选取最好的额那个

  • 如果输出字典大小为n,序列最长为T那么我们需要考察 n T n^T nT个序列,假设

    n = 10000 T = 100 则 n T = 10 50 n^T = 10^{50} nT=1050

    计算上是不可行的

  • 所以最好我们需要有个折中的方法

集束搜索(beam search)

  • 束搜索(beam search)是贪心搜索的一个改进版本。 它有一个超参数,名为束宽(beam size)k。 在时间步1,我们选择具有最高条件概率的k个词元。 这k个词元将分别是k个候选输出序列的第一个词元。 在随后的每个时间步,基于上一时间步的k个候选输出序列, 我们将继续从k|Y|个可能的选择中 挑出具有最高条件概率的k个候选输出序列。下面是k=2,字典长度为5时候的示例

    image-20250602224347302

  • 集束搜索时间复杂度
    O ( k n T ) O(knT) O(knT)

  • 每个候选的最终分数为:
    1 L α log ⁡ P ( y 1 , … , y L ∣ c ) = 1 L α ∑ t ′ = 1 L log ⁡ P ( y t ′ ∣ y 1 , … , y t ′ − 1 , c ) \frac{1}{L^\alpha} \log P\left(y_1, \ldots, y_L \mid \mathbf{c}\right)=\frac{1}{L^\alpha} \sum_{t^{\prime}=1}^L \log P\left(y_{t^{\prime}} \mid y_1, \ldots, y_{t^{\prime}-1}, \mathbf{c}\right) Lα1logP(y1,,yLc)=Lα1t=1LlogP(yty1,,yt1,c)
    通常 α = 0.75 \alpha=0.75 α=0.75,其中L是最终候选序列的长度, α通常设置为0.75。 因为一个较长的序列在 的求和中会有更多的对数项, 因此分母中的Lα用于惩罚长序列。

  • 总结:集束搜索在每次搜索时保存K个最好的候选。当k=1时时贪心搜索,当k=n时时穷举搜索


http://www.hkcw.cn/article/BZYKyTychf.shtml

相关文章

MG影视登录解锁永久VIP会员 v8.0 支持手机电视TV版影视直播软件

MG影视登录解锁永久VIP会员 v8.0 支持手机电视TV版影视直播软件 MG影视App电视版是一款资源丰富、免费便捷、且专为大屏优化的影视聚合应用,聚合海量资源,畅享电视直播,是您电视盒子和…

【浏览器】无法连接到互联网解决方法

Mac网络连接一切正常(手机连接互联网能正常使用) 但是涉及到网络界面就提示“无法连接到互联网”: 解决办法: 点击左上角→系统设置→网络→→位置→编辑位置→→新增一个即可 正常了!!

【C语言预处理详解(下)】--#和##运算符,命名约定,命令行定义 ,#undef,条件编译,头文件的包含,嵌套文件包含,其他预处理指令

目录 五.#和##运算符 5.1--#运算符 5.2--##运算符 六.命名约定,#undef,命令行定义 6.1--命名约定 6.2--#undef 6.3--命名行定义 七.条件编译 常见的条件编译指令: 1.普通的条件编译: 2.多个分支的条件编译(可以利用条…

数据资产评估进阶:精读资产评估专家指引第9号——数据资产评估指导【附全文阅读】

这篇文档是有关数据资产评估的专业报告,以下是文档中需要关注的重点内容: 1. 评估对象:文档中提到了数据资产评估的评估对象,即被评估数据资产。需要关注被评估数据资产的信息属性、法律属性、价值属性等,以及其特征对…

btstack协议栈---ESP32底层逻辑分析

目录 循环体 循环体中,怎么读取、处理数据 packet_handler 上面各层如何处理数据 谁触发了数据的传输? 硬件相关的数据有4类 循环体 BTStack针对不同的运行环境,抽象出了对应的btstack_run_loop结构体,共成员为: 比如其中的execute成员很重要,它是一个循环,在循…

碳中和新路径:铁电液晶屏如何破解高性能与节能矛盾?

一、显示技术困局:当 “高刷” 遭遇 “高耗” 在元宇宙、电竞产业蓬勃发展的当下,显示设备的刷新率与能耗成为行业痛点。传统液晶受 “边缘场效应” 制约,刷新率长期停滞在 300Hz 以下,动态画面拖影问题显著;同时&…

408考研逐题详解:2009年第27题

2009年第27题 一个分段存储管理系统中,地址长度为 32 位,其中段号占 8 位,则最大段长是( ) A. 2 8 2^8 28B \qquad B. 2 16 2^{16} 216B \qquad C. 2 24 2^{24} 224B \qquad D. 2 32 2^{32} 232B 解析 本题…

ASC格式惯导数据文件转IMR格式文件

我们使用惯导采集数据之后,如果需要用现有软件进行解算,比如POSMind等等,就会涉及到IMR格式的惯导数据文件。而NovAtel Convert转换软件只能将原始DAT格式的文件转成ASCLL文件,因此我自编程实现了ASC格式文件到IMR格式文件的转换。…

电脑为什么换个ip就上不了网了

在日常使用电脑上网时,很多人可能遇到过这样的问题:当IP地址发生变化后,突然就无法连接网络了。当电脑更换IP地址后无法上网,这一现象可能由多种因素导致,涉及网络配置、硬件限制或运营商策略等层面。以下是系统性分析…

动中通天线跟踪性能指标的测试

卫星通信动中通天线包括天线、卫星信号跟踪接收机、GNSS接收机(含天线)、组合导航设备、天线控制器、伺服结构以及其他射频组件等。其中: • GNSS接收机提供系统位置信息; • 组合导航设备提供天线所在平台的方位、俯仰、横滚姿态…

从 GPT 的发展看大模型的演进

这是一个技术爆炸的时代。一起来看看 GPT 诞生后,与BERT 的角逐。 BERT 和 GPT 是基于 Transformer 模型架构的两种不同类型的预训练语言模型。它们之间的角逐可以从 Transformer 的编码解码结构角度来分析。 BERT(Bidirectional Encoder Representatio…

Charles青花瓷抓取外网数据包

免责声明:内容仅供学习参考,请合法利用知识,禁止进行违法犯罪活动! Charles有一个问题,开启翻墙工具后会发现无法进行抓包,这是需要做额外的配置才可以 首选选择下图中的External Proxy Settings 然后如下…

在考古方向遥遥领先的高校课程建设-250602

解决方案:全栈自学,全栈自研,独立自主。 全文AI…… 每代人的智商和注意力差异是如何出现的-250602-CSDN博客 网络还是有这些内容的: 考古教育之殇:高校课程建设的滞后与困境 在考古学这一承载着人类文明密码与历史记…

K-匿名模型

K-匿名模型是隐私保护领域的一项基础技术,防止通过链接攻击从公开数据中重新识别特定个体。其核心思想是让每个个体在发布的数据中“隐匿于人群”,确保任意一条记录至少与其他K-1条记录在准标识符(Quasi-Identifiers, QIDs)上不可…

BUUCTF[极客大挑战 2019]EasySQL 1题解

[极客大挑战 2019]EasySQL题解 分析解题过程漏洞原理分析明确注入点:尝试万能密码法法一法二 总结 分析 从题目分析,这道题应该与SQL注入有关,启动靶机之后,访问url是一个登录界面,随便输入用户名密码之后&#xff0…

8088单板机C语言项目计划表

Prj1 原来第一版8088单板机C语言实现版 用Nmake 和 Makefile编译方式实现的 略显复杂 Prj2 8088单板机C语言实现LED灯闪烁控制 Prj3 8088单板机C语言串口实现“Hellow World!” Prj4 8088单板机C语言串口实现格式化sprintf(&#x…

【电赛培训课程】测量与信号类赛题知识点讲解与赛题解析

一、三极管基础知识 1.基本运行规则 ICE βIBEUBE 0.7V 2.什么时候选择使用三极管而不是运算放大器 不需要精确的放大倍数(交流放大)题目指定 3.优点 不容易产生自激振荡,在相同的频率下更不容易失真便宜量大管够 二、三极管放大电路…

学到新的日志方法mp

使用mp技术的时候可以在类上加上注解Slf4j 就可以使用日志 不需要在定义变量log,注意日志只能在方法内使用,不能在方法外进行使用

Linux入门(十三)动态监控系统监控网络状态

top与ps 命令很相似,它们都是用来显示正在执行的进程,top与ps大的区别是top在执行一段时间可以更新正在运行的进程。 #-d 更新秒数 如果不写-d 那默认是3秒更新 # -i 隐藏不活跃进程 top -d 5交互操作 P 按cpu使用大小排序,默认此项 M 按内存…

SolidWorks建模(U盘)- 多实体建模拆图案例

这个U盘模型并不是一个多装配体,它是一个多实体零件,它是在零件模式下创建的这些多实体的零部件。按右键解除爆炸就可以装配到一起,再按右键爆炸,就能按照之前移动的位置进行炸开 爆炸视图直接展示 模型案例和素材或取&#xff08…