随机变量(random variables)和概率分布(probability distribution)的区别

随机变量与概率分布

统计实验是随机实验，可以无限期重复，有一组已知的结果。随机变量和概率分布都与这些实验有关。对于每个随机变量，都有一个相关的概率分布，由一个叫做累积分布函数的函数定义。

什么是随机变量？

随机变量是一个函数，它将数值赋给统计实验的结果。换句话说，它是从统计实验的样本空间定义到实数集合的函数。

例如，考虑一个随机的实验，把一枚硬币翻两次。可能的结果是HH，HT，TH和TT（H—头，T—故事）。设变量X为实验中观察到的人头数。然后，X可以取0，1或2，它是一个随机变量。这里，随机变量X将把集合S={HH，HT，TH，TT}（样本空间）映射到集合{0，1，2}，这样HH映射到2，HT和TH映射到1，TT映射到0。在函数表示法中，这可以写成，X:S→R，其中X（HH）=2，X（HT）=1，X（TH）=1，X（TT）=0。

随机变量有两种类型：离散型和连续型，因此随机变量可以假定的可能值的数目最多可数。在前面的例子中，随机变量X是一个离散的随机变量，因为{0，1，2}是一个有限集。现在，考虑一个统计实验，找出学生在一个班级中的权重。设Y为随机变量，定义为学生的权重。Y可以取特定间隔内的任何实际值。因此，Y是一个连续的随机变量。

什么是概率分布？

概率分布是描述随机变量取一定值的概率的函数。

对于每个可能的结果x，从实数集到实数集，一个叫做累积分布函数（F）的函数可以定义为F（x）=P（x≤x）（x小于或等于x的概率）。现在第一个例子中x的累积分布函数可以写成F（A）=0，如果A<0；F（A）=0.25，若0≤a<1；F（a）=0.75，若1≤a<2且F（a）=1，若a≥2。

在离散随机变量的情况下，一个函数可以从一组可能的结果定义为一组实数，这样每个可能的结果x都可以定义为ƒ（x）=P（x=x）（x等于x的概率）。这个特殊的函数ƒ称为随机变量x的概率质量函数，现在称为概率质量在第一个具体例子中，X的函数可以写成ƒ（0）=0.25，ƒ（1）=0.5，ƒ（2）=0.25，否则ƒ（X）=0。因此，在第一个例子中，概率质量函数和累积分布函数将描述X的概率分布。

在连续随机变量的情况下，称为概率密度函数（ƒ）的函数可以定义为每个x的ƒ（x）=dF（x）/dx，其中F是连续随机变量的累积分布函数。很容易看出，这个函数满足∫ƒ（x）dx=1。概率密度函数和累积分布函数描述了连续随机变量的概率分布。例如，使用概率密度函数ƒ（x）=1/√（2πσ2）e^（[（x-µ）]2/（2σ2））来描述正态分布（连续概率分布）。

随机变量和概率分布有什么区别？•随机变量是一个将样本空间的值与实数相关联的函数。•概率分布是一个函数，它将随机变量的值与相应的发生概率相关联。