[概率论基本概念4]什么是无偏估计

article/2025/6/8 15:02:14

关键词:Unbiased Estimation

一、说明

对于无偏和有偏估计,需要了解其叙事背景,是指整体和抽样的关系,也就是说整体的叙事是从理论角度的,而估计器原理是从实践角度说事;为了表明概率理论(不可操作)和统计学(可操作)的实践的一致性,于是提出有偏和无偏的观点。

二、关于无偏和有偏

如果给定参数的估计量 的 预期值等于该参数的真实值, 则称该估计量是无偏的 。另一个说法,如果估计量产生的参数估计平均而言是正确的,那么它就是无偏的。
我们先做一个思想实验,如通过打靶考核射手的水平,假如决定射手的因素有两个:眼力和手平衡。
在这里插入图片描述
于是对于任意一个选手,这个选手的属性如下:

<眼力=1,手平衡=1>,<眼力=0,手平衡=1>,<眼力=1,手平衡=0>,
<眼力=0,手平衡=0>

打靶结果
在这里插入图片描述
我们从上面例子解释“无偏”和“有偏”的关系。在以上打靶结果中,
<眼力=1,手平衡=1>和<眼力=1,手平衡=0>属于“无偏
<眼力=0,手平衡=1>和<眼力=0,手平衡=0>属于“有偏
为什么呢?
我们考虑打靶的重心值:
X ˉ = ∑ i = 1 3 X i \bar{X}=\sum^{3}_{i=1}X_i Xˉ=i=13Xi
X ˉ \bar{X} Xˉ的极限等于把心c,那么就是无偏的,否则就是有偏的。

注意:有偏估计也不是没有意义的。只要能给出固定偏移,不难将无偏估计转化成无偏估计。

三、偏差和无偏差估计器

如果估计器 u ( X 1 , X 2 , … , X n ) u(X_1,X_2,\ldots,X_n) u(X1,X2,,Xn)以下情况成立:
E [ u ( X 1 , X 2 , … , X n ) ] = θ E[u(X_1,X_2,\ldots,X_n)]=\theta E[u(X1,X2,,Xn)]=θ那么统计 u ( X 1 , X 2 , … , X n ) u(X_1,X_2,\ldots,X_n) u(X1,X2,,Xn)是参数的无偏估计量 θ \theta θ。 否则, u ( X 1 , X 2 , … , X n ) u(X_1,X_2,\ldots,X_n) u(X1,X2,,Xn)是一个有偏估计 θ \theta θ

3.1 贝努力变量p的无偏估计

如果 X i X_i Xi是具有参数的伯努利随机变量 p p p, 那么:
p ^ = 1 n ∑ i = 1 n X i \hat{p}=\dfrac{1}{n}\sum\limits_{i=1}^nX_i p^=n1i=1nXi
是最大似然估计量(MLE) p ^ \hat{p} p^ 是p的无偏估计量.

证明:
回想一下,如果 X i X_i Xi是具有参数的伯努利随机变量 p p p, 那么 E ( X i ) = p E(X_i)=p E(Xi)=p
。 这里对估计器求期望:
E ( p ^ ) = E ( 1 n ∑ i = 1 n X i ) = 1 n ∑ i = 1 n E ( X i ) = 1 n ∑ i = 1 n p = 1 n ( n p ) = p E(\hat{p})=E\left(\dfrac{1}{n}\sum\limits_{i=1}^nX_i\right)=\dfrac{1}{n}\sum\limits_{i=1}^nE(X_i)=\dfrac{1}{n}\sum\limits_{i=1}^np=\dfrac{1}{n}(np)=p E(p^)=E(n1i=1nXi)=n1i=1nE(Xi)=n1i=1np=n1(np)=p

第一个等式成立,因为我们只是替换了 p ^ \hat{p} p^及其定义。第二个等式根据线性组合的期望规则成立。第三个等式成立,因为 E ( X i ) = p E(X_i)=p E(Xi)=p。第四个等式成立,因为当你添加值p向上连加n次,你得到np。当然,最后一个等式是简单的代数。

总而言之,我们已经证明: E ( p ^ ) = p E(\hat {p})= p Ep^=p
因此,最大似然估计量是p。

3.2 正态分布的无偏估计

如果 X i X_i Xi是具有均值的正态分布的随机变量,参数 μ \mu μ和方差 σ 2 \sigma^2 σ2的无偏估计是:
μ ^ = ∑ X i n = X ˉ \hat{\mu}=\dfrac{\sum X_i}{n}=\bar{X} μ^=nXi=Xˉ
σ ^ 2 = ∑ ( X i − X ˉ ) 2 n \hat{\sigma}^2=\dfrac{\sum(X_i-\bar{X})^2}{n} σ^2=n(XiXˉ)2
下面用无偏性估计定义进行验证:
只要证明: E ( X i ) = μ E(X_i)=\mu E(Xi)=μ Var ( X i ) = σ 2 \text{Var}(X_i)=\sigma^2 Var(Xi)=σ2就可以。

E ( X ˉ ) = E ( 1 n ∑ i = 1 n X i ) = 1 n ∑ i = 1 n E ( X i ) = 1 n ∑ i = 1 μ = 1 n ( n μ ) = μ E(\bar{X})=E\left(\dfrac{1}{n}\sum\limits_{i=1}^nX_i\right)=\dfrac{1}{n}\sum\limits_{i=1}^nE(X_i)=\dfrac{1}{n}\sum\limits_{i=1}\mu=\dfrac{1}{n}(n\mu)=\mu E(Xˉ)=E(n1i=1nXi)=n1i=1nE(Xi)=n1i=1μ=n1(nμ)=μ
第一个等式成立,因为我们只是用 X ˉ \bar{X} Xˉ及其定义。同样,第二个相等性符合线性组合的期望规则。第三个相等性成立,因为 E ( X i ) = μ E(X_i)=\mu E(Xi)=μ.第四个相等性成立,因为当您将值 μ \mu μ累加n次倍,你会得到np。最后一个相等是简单代数。
总之,我们已经证明: E ( X ˉ ) = μ E(\bar{X})=\mu E(Xˉ)=μ
因此,最大似然估计量为 μ \mu μ是公正的.
下面我们证明 σ ^ 2 = ∑ ( X i − X ˉ ) 2 n \hat{\sigma}^2=\dfrac{\sum(X_i-\bar{X})^2}{n} σ^2=n(XiXˉ)2也是公正无偏的。
首先回顾方差的基本定义:
V a r ( X ) = E ( ( X − E ( X ) ) 2 ) = E ( X 2 ) − E ( X ) 2 Var(X)=E( (X-E(X))^2)=E(X^2)-E(X)^2 Var(X)=E(XEX2)=E(X2)E(X)2
对于独立同分布的抽样样本 ( X 1 , X 2 , … , X n ) (X_1,X_2,\ldots,X_n) (X1,X2,,Xn),每个随机变量数值特征是一样的,也就是说:
E ( X 1 ) = E ( X 2 ) = , … , E ( X n ) = μ E(X_1)=E(X_2)=,\ldots,E(X_n)=\mu E(X1=EX2=,,EXn)=μ
V a r ( X ) = V a r ( X 1 ) = V a r ( X 2 ) = , … , V a r ( X n ) = σ 2 Var(X)=Var(X_1)=Var(X_2)=,\ldots,Var(X_n)=\sigma^2 Var(X)=Var(X1=VarX2=,,VarXn)=σ2
下面我们将给出证明
E ( σ ^ 2 ) = E ( ∑ ( X i − X ˉ ) 2 n ) = ∑ E ( X i − X ˉ ) 2 n = ∑ E ( X i 2 − 2 X 2 X ˉ + X ˉ 2 ) n = ∑ [ E ( X i 2 ) − 2 E ( X i X ˉ ) + E ( X ˉ ) 2 ] n = ∑ [ E ( X i 2 ) − 2 E ( X i ) X ˉ + ( X ˉ ) 2 ) n = ∑ [ E ( X i 2 ) − X ˉ 2 ] n = n [ E ( X 2 ) − E X ˉ 2 ] n = E ( X 2 ) − E X ˉ 2 = σ 2 E(\hat{\sigma}^2)=E(\dfrac{\sum(X_i-\bar{X})^2}{n})=\dfrac{\sum E(X_i-\bar{X})^2}{n}=\dfrac{\sum E(X_i^2-2X_2\bar{X}+\bar{X}^2)}{n}=\dfrac{\sum[ E(X_i^2)-2E(X_i\bar{X})+E(\bar{X})^2]}{n}=\dfrac{\sum[ E(X_i^2)-2E(X_i)\bar{X}+(\bar{X})^2)}{n}=\dfrac{\sum[ E(X_i^2)- \bar{X}^2]}{n}=\dfrac{n[ E(X^2)- E\bar{X}^2]}{n}= E(X^2)- E\bar{X}^2=\sigma^2 E(σ^2)=E(n(XiXˉ)2)=nE(XiXˉ)2=nE(Xi22X2Xˉ+Xˉ2)=n[E(Xi2)2E(XiXˉ)+E(Xˉ)2]=n[E(Xi2)2E(Xi)Xˉ+(Xˉ)2)=n[E(Xi2)Xˉ2]=nn[E(X2)EXˉ2]=E(X2)EXˉ2=σ2
第一个等号是等价代换,第二个等号E(期望)的线性等价性质。第三个等号。代数展开。第四个等号,期望线性恒等式。第五个等式,因为 X ˉ \bar X Xˉ不是随机变量,而 X i X_i Xi是随机变量,因此用 E ( c X ) = c E ( X ) E(cX)=cE(X) E(cX=cEX E ( X ˉ ) = X ˉ E(\bar X)=\bar X E(Xˉ)=Xˉ简化;第六个等式,因为 E ( X i ) = E ( X ) E(X_i)=E(X) EXi=EX这是因为两个随机变量的期望是一致的。第七个等式代数加和展开。第八等式,正态分布方差公式简化版。从而 E ( σ 2 ^ ) = σ 2 E(\hat{\sigma^2})=\sigma^2 E(σ2^)=σ2得证。

四、结论

这里需要首先肯定得是,有偏/无偏与误差偏差无关,不是说误差越大越有偏;一种可能是估计器误差很大,但他是无偏估计;另一种可能是估计器误差很小,但他是有偏估计。一个抽样有偏和无偏得判断措施就是对他求期望,该期望与整体得期望比较,发现有/无偏性。


http://www.hkcw.cn/article/BTRuTxGrHP.shtml

相关文章

React-native之Flexbox

本文总结: 我们学到了 React Native 的 Flexbox 布局&#xff0c;它让写样式变得更方便啦&#xff01;&#x1f60a; Flexbox 就像一个有弹性的盒子&#xff0c;有主轴和交叉轴&#xff08;行或列&#xff09;。 在 RN 里写样式要用 StyleSheet.create 对象&#xff0c;属性名…

学习日记-day21-6.3

完成目标&#xff1a; 目录 知识点&#xff1a; 1.集合_哈希表存储过程说明 2.集合_哈希表源码查看 3.集合_哈希表无索引&哈希表有序无序详解 4.集合_TreeSet和TreeMap 5.集合_Hashtable和Vector&Vector源码分析 6.集合_Properties属性集 7.集合_集合嵌套 8.…

ABP-Book Store Application中文讲解 - Part 6: Authors: Domain Layer

ABP-Book Store Application中文讲解 - Part 6: Authors: Domain Layer 1. 汇总 ABP-Book Store Application中文讲解-汇总-CSDN博客 2. 前一章 ABP-Book Store Application中文讲解 - Part 5: Authorization-CSDN博客 项目之间的引用关系。 ​ BookAppService利用的是Cu…

智慧高铁站:数字时代交通枢纽的标杆

智慧高铁站作为现代综合交通体系的核心节点&#xff0c;通过数字技术与基础设施的深度融合&#xff0c;正在重塑旅客出行体验与车站运营模式。这一转型不仅体现在技术应用层面&#xff0c;更代表着交通服务理念的根本性变革&#xff0c;为现代交通枢纽建设树立了全新标杆。 一、…

ARM架构推理Stable Diffusiond

代码仓库&#xff1a; https://github.com/siutin/stable-diffusion-webui-docker.git Docker容器地址&#xff1a; https://hub.docker.com/r/siutin/stable-diffusion-webui-docker/tags git clone https://github.com/siutin/stable-diffusion-webui-docker.git cd stabl…

关于 KWDB 数据存储的几件事儿

邻近粽子节&#xff0c;KWDB 的朋友给我发消息&#xff0c;问我吃过红茶味的粽子没&#xff0c;作为北方人的我一般只吃蜜枣白粽&#xff0c;还没见过茶香粽子&#xff0c;顶多泡碗祁红&#xff0c;就着茶水吃粽子。 她又问道&#xff0c;两个月时间到了&#xff0c;你准备好了…

酵母杂交那些事儿(一)

酵母单杂、酵母双杂、酵母三杂&#xff0c;仅仅一个字的区别&#xff0c;你对它们了解吗&#xff1f;这些经常用到的实验&#xff0c;它们的原理你确定都搞清楚了吗&#xff1f;如果没有&#xff0c;那么今天你就来对地方了&#xff0c;因为伯远生物&#xff08;https://plant.…

sqlite3 命令行工具详细介绍

一、启动与退出 启动数据库连接 sqlite3 [database_file] # 打开/创建数据库文件&#xff08;如 test.db&#xff09; sqlite3 # 启动临时内存数据库 (:memory:) sqlite3 :memory: # 显式启动内存数据库文件不存在时自动创建不指定文件名则使用临时内…

项目开发:【悟空博客】基于SSM框架的博客平台

目录 一.导入 1.Spirng框架 2.SpirngMVC 二.项目介绍 &#xff08;一&#xff09;项目功能 &#xff08;二&#xff09;页面展示 1.注册页面 2.登录页面 3.列表页面 4.详情页面 5.编辑页面 三.准备工作 1.用户表——userinfo 2.文章表——articleinfo 3.插入数…

大话软工笔记—分离之组织和物品

一. 组织 组织在架构中既不属于“业务架构”&#xff0c;也不属于“管理架构”&#xff0c;它是由组织结构、角色、权限等要素构成。 1. 组织的概念 组织&#xff08;名词&#xff09;&#xff0c;将资源按照某个目标构建出一个有层次的集合体&#xff0c;即组织结构。 组织…

伊吖学C笔记(5、数组、表达式、考题设计)

一、数组 数组是由同一种类数据构成的集合。就好比一个班所有同学的身高&#xff0c;一个月的日平均气温&#xff0c;抽样调查的一百个数据...等等&#xff0c;都可以当作一个数组。构建数组是为了对同类的多个数据实行高效管理。 1.数组定义 格式&#xff1a;类型说明 数组…

由docker引入架构简单展开说说技术栈学习之路

想象一下&#xff0c;你开了一家线上小卖部&#xff08;单机版&#xff09;&#xff0c;突然爆单了怎么办&#xff1f;别急&#xff0c;技术架构的升级打怪之路&#xff0c;可比哆啦A梦的口袋还神奇&#xff01; 第1关&#xff1a;单枪匹马的创业初期&#xff08;单机架构&…

Dify知识库下载小程序

一、Dify配置 1.查看或创建知识库的API 二、下载程序配置 1. 安装依赖resquirements.txt ######requirements.txt##### flask2.3.3 psycopg2-binary2.9.9 requests2.31.0 python-dotenv1.0.0#####安装依赖 pip3 install -r requirements.txt -i https://pypi.tuna.tsinghua.…

Neovim - 打造一款属于自己的编辑器(一)

前言&#xff08;劝退&#xff09; neovim 是一个现代化&#xff0c;高扩展的 vim 编辑器 fork 版本&#xff0c;适合程序员打造极致高效的开发环境。 在正式开始 neovim 配置之前&#xff0c;我还是要劝退一下的。 很多人说使用 neovim 的都是变成高手&#xff0c;但我认为…

BugKu Web渗透之本地管理员

启动场景后&#xff0c;网页显示如下&#xff1a; 看起来似乎很多n。拷贝n到文件查看器&#xff0c;没有发现异常。 步骤一&#xff1a; 右键显示源码。 暂时没有发现异常。想着拷贝n到文件查看器&#xff0c;发现末尾有注释。 步骤二&#xff1a; 看见有“”&#xff0c;想…

配置cursor

介绍整体界面 上面的是功能菜单 **打开文件&#xff1a;**在打开A文件的情况下&#xff0c;再打开B文件&#xff08;再点击一次cursor&#xff0c;重新点击打开文件夹&#xff0c;选择文件B&#xff09; 打开最近文件 左侧界面 第一个是我们所有编程的文件 第二个是在项目里…

智能考核在消防员体能考核中有哪些应用?

一、训练方式的创新 个性化训练计划&#xff1a;借助智能考核系统&#xff0c;使消防员的训练更加个性化。系统依据消防员的体能、技能等数据&#xff0c;结合训练目标和历史表现&#xff0c;运用大数据分析和人工智能算法&#xff0c;为每位消防员生成专属的训练计划。如蚂蚁…

5分钟申请edu邮箱【方案本周有效】

这篇文章主要展示的是成果。如果你是第1次看见我的内容&#xff0c;具体的步骤请翻看往期的两篇作品。先看更正补全&#xff0c;再看下一个。 建议你边看边操作。 【更正补全】edu教育申请通过方案 本周 edu教育邮箱注册可行方案 #edu邮箱 伟大无需多言 我已经验证了四个了…

阿里云为何,一个邮箱绑定了两个账号

阿里云“幽灵账号”之谜&#xff1a;同一个邮箱注销后仍有两个账号&#xff1f;深度揭秘成因与终极解决方案&#xff01; 你是否曾在阿里云上使用同一个邮箱注册过多个账号&#xff0c;明明已经**“彻底”注销了其中一个**&#xff0c;却惊愕地发现系统里依然**“幽灵般”挂着…

RM-R1:基于推理任务构建奖励模型

摘要&#xff1a;奖励建模对于通过人类反馈的强化学习使大型语言模型与人类偏好对齐至关重要。为了提供准确的奖励信号&#xff0c;奖励模型&#xff08;RM&#xff09;在分配分数或判断之前应该激发深度思考并进行可解释的推理。受最近在推理密集型任务中长链推理的进展启发&a…