1、首先,使用符号BinomialDistribution[n,p]创建参数为n,p的二项分布。如图得到该分布的均值和方差,供一会标准化使用。
2、使用PDF得出其概率函数,通过指定两个参变量的数值得到其具体形式。其中Binomial是二项式系数。
3、接下来,要对该二项分布标准化。标准化方法是,(随机变量-期望)/标准差。验证标准化后的均值和标准差,为0和1。
4、使用TransformedDistribution标准化,使用CDF得到标准化后的分布的累计分布函数,是个阶梯状函数。使用Plot绘制该图形。
5、接下来,将该累积分布函数和标准正太分布对照画出。并且使用如图代码产生随n变化的动画。
6、如图当p=0.5时,n从2到100,两个累积分布函数的对比。当p=0.5时图像始终是对称的。
7、如图当p=0.1时,n仍然同样变化。可以看到,当单次概率p偏离0.5时,n较小时偏态非常明显。但是随着n增大,中心极限定理保证了其趋近于对称的标准正态分布。
8、为了计算变换后二项分布鲥豆碾滠累计分布的具体表达式(x的函数),我们首先使用Solve解出指定位置x时,原来二项分布中k的数值(k应当取整)。普通二项分布的累计分布函数,可以使用正则化的不完全beta函数表示,形式已知。接下来,使用正则化的不完全beta函数,带入k。即得到标准化后累计分布。绘图比较结果正确。
9、或者,我们也可以比较变换后的每一个离散项,和正态分布概率密度函数中代表同样宽度的条带的面积(概率)。首先使用Solve,假设原二项分布的k对应变换后的x,使用Solve接触荏鱿胫协n。令k趋近于正无穷,计算如图极限,发现为1。也就是说,二项分布对任意的x反解出k,对应的离散项的概率和正态分布x处概率密度乘上离散宽度比值为1。那么他们的CDF累计分布函数也处处比值为1。