期望、和标准差是概率论中最常见的概念

1 个随机变量
1.1 随机现象
在一定条件下并不总是出现相同结果的现象称为随机现象,例如抛硬币和掷骰子。随机现象有两个特点:(1)结果不止一个;(2)结果不只一个。 (2) 事先不知道会发生什么结果 #
1.2 样本空间和样本点 #
随机现象所有可能的基本结果的集合称为样本空间,记作\Omega=\left\{w\right\},其中w表示基本结果,也称为样本点。 采样点是采样最基本的元素。 单元
1.3 随机变量和随机事件
#
与微积分中的变量不同,概率论中的变量有“分布”的概念。 “分布”意味着我们不仅需要知道一个变量可以取哪些值,还需要知道它取这些值的概率。 同时,概率论中的变量也强调随机值,因此常被称为“随机变量”。 那么为什么我们需要添加分布的概念,为什么我们需要知道一个变量取特定值的概率呢? 原因是随机变量的统计规律可以通过分布来理解。 例如,假设随机变量X代表某种电器产品的使用寿命。 如果从配送时间来看,这对于消费者来说无疑是非常重要的信息。
#
使用等号或不等号将随机变量与某些实数连接起来表示随机事件,如 \{X\leq a\} , a\}">\{X> a\} #
2 分布函数和概率密度函数 分布函数
为了掌握随机变量的统计规律,我们必须知道随机变量取各种值(各种事件)的概率,而分布函数本质上就是事件的概率\{X\leq x\},定义为 F(x )=P(X\leq x),使用事件 \{X\leq x\} 的原因是 \{a 和 c\}">\{X>c\} 都可以使用事件\{X\leq x\ } 表示
#
\{A #
c\}=\Omega-\{X\leq c\}">\{X>c\}=\Omega-\{X\leq c\} #
分布函数的三个重要性质 #
(1)单调性:分布函数是定义在整个实轴(-\infty,\infty)上的单调非减函数;
(2) 有界性:分布函数的取值范围为[0,1],且\lim_{x \ -\infty }{F(x)} =0,\lim_{x \ +\infty }{F( x)} =1 #
(3) 右连续性:即当x从右侧逼近x_0时,\lim_{x \ x_0^{+0}}{F(x)}=F(x_0+0)=F(x_0)
单调性和有界性更容易理解。 我们应该如何理解正确的连续性? 右连续性本质上源自分布函数的定义,可以通过海涅定理证明。 不过,把复杂化繁为简(机会主义),我们可以通过离散随机变量的分布函数来理解右连续性,如下图所示,当x从右边逼近x_1时,很明显\lim_{x \ x_1^ {+0}}{F(x)}=F(x_1)
概率密度函数
#
对于离散随机变量,常用分布列来表示其分布。 对于连续随机变量,有无穷多个值,不能再使用分布列,需要用概率密度函数来表示其概率分布。 #
如何理解概率密度函数? 本质上,它仍然是描述“概率”、“可能性”之类的东西。 当p(x)的值很大时,意味着随机变量X取值x的概率很高。用更规范的表达方式来说,概率密度函数p(x)的值不是概率( emm,是什么?只要把这个值理解为概率的密度即可,密度越高,概率越大...),但是p(x)乘以微分元素dx就可以得到概率上的近似值小区间(x,x+dx),即p(x)dx\ P(x)。 (a,b)上的许多相邻微分元素累加起来就是p(x)在(a,b)上的积分,这个积分值就是概率,即
#
\int_{a}^{b}p(x)dx=P(a #
显然 (-\infty,x] 上的积分就是分布函数 #
\int_{-\infty}^{x}p(x)dx=P(X\leq x)=F(x) #
显然F'(x)=p(x),F(x)是概率函数,其导函数F'(x)自然是概率密度函数 #
3 数据预期
#
数学期望以某个值的概率作为“权重”标准差的计算公式,进行加权平均,是一种比平均值更合理的计算方法。 它不仅考虑随机变量的可能值,还考虑取这些值的概率。 #
数学期望源于历史上著名的赌博问题
两个赌徒A和B同样擅长赌博。 每人下注50法郎。 每轮比赛不存在平局。 谁先赢得三轮比赛,谁将获得 100 法郎的全部赌注。 当A赢两局,B赢一局时,停止赌博并问如何公平地分配100法郎? #
一个常见的想法是:A 得到 2/3,B 得到 1/3
#
1654年,帕斯卡提出了如下除法。 假设赌注继续进行。 假设A最终收入为,A赢B赢,B赢A赢,B赢B赢。 这四种情况中的三种标准差的计算公式,A获胜,即A获得100法郎的概率为3/4,B获得100法郎的概率为1/4。 综上,A的“预期”收入为:0\times 0.25+ 100\times 0.75=75 #
这样的划分显然更加合理。 它不仅考虑到已经结束的赌博游戏,还考虑到如果赌博继续进行的情况。 #
对于离散随机变量,期望定义如下
#
E(X)=\sum_{i=1}^{\infty}{x_ip(x_i)} #
这里要求级数 \sum_{i=1}^{\infty}{|x_i|p(x_i)} 绝对收敛,以保证数学期望唯一(由无穷级数理论可知:如果无穷级数绝对收敛,则保证其和不受阶数变化的影响。由于有限项的和不受阶数变化的影响,因此取有限个可能的随机变量的数学期望总是存在。emm,我不太懂无穷级数的理论。先记住,稍后再讲) #
对于连续随机变量,期望定义如下 #
E\left( X \right)=\int_{-\infty}^{\infty}xp\left( x \right)dx #
其中\int_{-\infty}^{\infty}\left| x \right|p\left( x \right)dx
#