随机变量与概率分布
统计实验是随机实验,可以无限期重复,有一组已知的结果。随机变量和概率分布都与这些实验有关。对于每个随机变量,都有一个相关的概率分布,由一个叫做累积分布函数的函数定义。
什么是随机变量?
随机变量是一个函数,它将数值赋给统计实验的结果。换句话说,它是从统计实验的样本空间定义到实数集合的函数。
例如,考虑一个随机的实验,把一枚硬币翻两次。可能的结果是HH,HT,TH和TT(H—头,T—故事)。设变量X为实验中观察到的人头数。然后,X可以取0,1或2,它是一个随机变量。这里,随机变量X将把集合S={HH,HT,TH,TT}(样本空间)映射到集合{0,1,2},这样HH映射到2,HT和TH映射到1,TT映射到0。在函数表示法中,这可以写成,X:S→R,其中X(HH)=2,X(HT)=1,X(TH)=1,X(TT)=0。
随机变量有两种类型:离散型和连续型,因此随机变量可以假定的可能值的数目最多可数。在前面的例子中,随机变量X是一个离散的随机变量,因为{0,1,2}是一个有限集。现在,考虑一个统计实验,找出学生在一个班级中的权重。设Y为随机变量,定义为学生的权重。Y可以取特定间隔内的任何实际值。因此,Y是一个连续的随机变量。
什么是概率分布?
概率分布是描述随机变量取一定值的概率的函数。
对于每个可能的结果x,从实数集到实数集,一个叫做累积分布函数(F)的函数可以定义为F(x)=P(x≤x)(x小于或等于x的概率)。现在第一个例子中x的累积分布函数可以写成F(A)=0,如果A<0;F(A)=0.25,若0≤a<1;F(a)=0.75,若1≤a<2且F(a)=1,若a≥2。
在离散随机变量的情况下,一个函数可以从一组可能的结果定义为一组实数,这样每个可能的结果x都可以定义为ƒ(x)=P(x=x)(x等于x的概率)。这个特殊的函数ƒ称为随机变量x的概率质量函数,现在称为概率质量在第一个具体例子中,X的函数可以写成ƒ(0)=0.25,ƒ(1)=0.5,ƒ(2)=0.25,否则ƒ(X)=0。因此,在第一个例子中,概率质量函数和累积分布函数将描述X的概率分布。
在连续随机变量的情况下,称为概率密度函数(ƒ)的函数可以定义为每个x的ƒ(x)=dF(x)/dx,其中F是连续随机变量的累积分布函数。很容易看出,这个函数满足∫ƒ(x)dx=1。概率密度函数和累积分布函数描述了连续随机变量的概率分布。例如,使用概率密度函数ƒ(x)=1/√(2πσ2)e^([(x-µ)]2/(2σ2))来描述正态分布(连续概率分布)。
随机变量和概率分布有什么区别?•随机变量是一个将样本空间的值与实数相关联的函数。•概率分布是一个函数,它将随机变量的值与相应的发生概率相关联。 |