正态分布曲线下面积是很有实际应用价值的。
Excel中的正态分布的密度函数NORMDIST(x,μ,σ,逻辑值),用以表达正态分布,其中:
x ——“值”,是要求分布的随机变量数值;
μ——“平均数”,是分布的算数平均数;
σ——“标准差”,是分布的标准差;
逻辑值——“积累与否”,是决定函数的逻辑值,其中取值为 “TRUE”(真),则返回累计分布函数;取“FALSE”(伪),则NORMDIST会返回正态分布函数的高度。如果为了绘制正态分布曲线,就要取“FALSE”。
关于在Excel中用面积图绘制正态分布曲线图表的内容,可见【附录1】中我的另一篇博客文章《Excel:正态分布的面积图(积累逻辑值为False)》。
在正态分布的密度函数中有上述两个常数:算数平均数μ和标准差σ。
正态分布的值有99.74%落在(μ-3σ,μ+3σ)区间内,也就是说落在以平均值为中心的左右各3个σ(共六个σ)的范围内,所谓管理学中的“三西格玛”或“六西格玛”就源于此。
正态分布的密度函数的图形也就是常说的那种中间高两头低的钟形的图形:
它是关于直线x=μ对称的;在x =μ处达到最大值;
若固定μ的值,而σ变化时,则密度曲线的位置不变,而其形状将改变:
l 当σ较大时离散程度大,曲线平缓,分布散落在x =μ周边较大范围中;
l 而当σ较小时离散程度小,曲线陡峭,分布集中在x =μ附近。
若固定σ的值,而μ变化时,则密度曲线的形状不变,它沿着x轴方向平行移动。
例1.参考【附录1】的方法用Excel的二维面积图绘制μ=60,σ=15,在(-∞,+∞)的正态分布曲线图,可见该中间高两头低的钟形图形是以μ=60为对称轴的轴对称图形,并以横轴为渐近线,如下图:

图1. μ=60,σ=15,在(-∞,+∞)的正态分布曲线二维面积图
根据数理统计知识可知,上述正态分布曲线下的全部面积为1,这一点是很有用的。
例2.仍然保持上图μ=60,σ=15,但是当X≤65时的图形如下:

图2. μ=60,σ=15,在(-∞,65)的正态分布曲线二维面积图(红色)
X≤65的分布是上述图表中的红色部分,这部分曲线下的面积,可以通过计算查表获得。
先通过折合公式z=(X-μ)/ σ计算,将一般正态分布折合成标准正态分布:
z=(65-60)/15=0.3333. 即高出平均值0.3333个标准差。
查标准正态分布表(任何一本数理统计教材的附录或上网搜索都可查到),如下:
标准正态分布表
 x | 0 | 0.01 | 0.02 | 0.03 | 0.04 | 0.05 | 0.06 | 0.07 | 0.08 | 0.09 | 0 | 0.500 0 | 0.504 0 | 0.508 0 | 0.512 0 | 0.516 0 | 0.519 9 | 0.523 9 | 0.527 9 | 0.531 9 | 0.535 9 | 0.1 | 0.539 8 | 0.543 8 | 0.547 8 | 0.551 7 | 0.555 7 | 0.559 6 | 0.563 6 | 0.567 5 | 0.571 4 | 0.575 3 | 0.2 | 0.579 3 | 0.583 2 | 0.587 1 | 0.591 0 | 0.594 8 | 0.598 7 | 0.602 6 | 0.606 4 | 0.610 3 | 0.614 1 | 0.3 | 0.617 9 | 0.621 7 | 0.625 5 | 0.6293 | 0.633 1 | 0.636 8 | 0.640 4 | 0.644 3 | 0.648 0 | 0.651 7 | | 查表得该红色部分面积为: 0.6293。该结论非常有用,其几何意义如下: 整个曲线下面积(蓝色)为1,红色部分为0.6293,即比x=65小的分布占全体的62.93%。 将此概念应用于考试分数的标准化:比如某次某科考试,整个考区的平均分数为60分,标准差为15分,某考生的考分65分,折合成标准分为0.3333。根据上述统计分析可知该考生战胜了该考区63%的考生。这种方式顾及到整个考区考生分数的集中趋势和离散程度,确定的是该考生的百分比地位。这比只看单纯的考分和名次,要合理得多。 例3.用标准分衡量在不同考试中的考生地位并评价其进步与否: 第一次考试某考生获得72分,考区平均分为70分,标准差为10; 第二次考试该考生还是获得70分,考区平均分为65分,标准差为5; 通过折合公式z=(X-μ)/ σ计算并查表(见【附录2】): Z1=(72-70)/10=0.2,查表得0.5793,可知该考生在第一次考试中战胜了57.93%≈58%的考生。 Z2=(70-65)/5=1.0,查表得0.8413,可知该考生在第二次考试中战胜了84.13%≈84%的考生。 在家长眼中,学生的第二次考试分数似乎不如第一次考试,会认为孩子退步了,可能会加以指责批评。可是考虑了整个考区学生的集中趋势(μ)和离散程度(σ),就可以明显知道:其实第一次考试,该学生只战胜了一半多一点——58%的考生,而第二次似乎分数低了一些,实际却战胜了绝大多数的考生,处于85%左右的高端。 这种使用标准分的百分比的地位分析还是比较科学的。笔者在辅导高考的很多年里,一直利用计算机使用自己编制的程序,使用自己平时积累的大量的原始数据,运用这种方法指导自己对学生的评价,效果比较理想。预测与实际结果拟合度较高。 在工业生产中,这种方式称为工程能力指数。笔者在制造业工作时,也是利用电脑使用VBA编程,在Excel中运用这种方式对订单直接生产成本和质量控制自动进行分析,为决策层管理层对客户和订单进行筛选时提供了可靠的数据量化根据。 还有一点,以上例子都是x≥μ,x高于平均数,x处于对称轴右侧,即z≥0。查表提供的数据也都是z≥0的。那么z<0时,即红色区域在对称轴左侧时如何处理? 例4.μ=60,σ=15,但是当X≤55时,如何求得曲线下面积? 折合公式z=(X-μ)/ σ计算,将一般正态分布折合成标准正态分布: z=(55-60)/15=-0.3333为负值,即低于平均值0.3333个标准差。如下图:  |
图3. μ=60,σ=15,在(-∞,55)的正态分布曲线二维面积图(蓝斜纹)
要求X≤55的曲线下面积(蓝斜纹),可以考虑正态分布曲线是关于x=60为对称轴的轴对称图形,它与x≥65(蓝色)是对称的,只需求得x≤65时的面积(蓝斜纹和黑斜纹总和),将曲线下总面积1减去这个数值就可以了。
由上面计算并查表得x≤65时的面积(蓝斜纹和黑斜纹总和)为: 0.6293,
1-0.6293=0.3707
于是当X≤55时,曲线下面积为0.3707,如有考分为55分,该考生在该考区战胜了37%的考生。
至于正态分布的更多的理论问题和应用,应该阅读相关的数理统计的专业知识。
以上只是因为自己在数理统计的学习时对这个正态分布关心较多,在工作中使用也较多,但毕竟多年不用不看,差不多都已遗忘,只能根据自己残存的印象,做一个回忆和记录。
还有一个电脑开机排位的问题,可见我的另一篇博文《开机速度排名和正态分布》地址是:
http://shuchonghui.blog.163.com/blog/static/1511563201101241130282/
http://blog.stnn.cc/oldshu/Efp_Bl_1004954030.aspx
本文也是为了这篇文章,对正态分布曲线下面积的几何意义做一个铺垫。
【附录1】《Excel:正态分布的面积图(积累逻辑值为False)》地址为:
http://shuchonghui.blog.163.com/blog/static/1511563201011225655168/
http://blog.stnn.cc/oldshu/Efp_Bl_1004870649.aspx
【附录2】
标准正态分布表 | |  | | | x | 0 | 0.01 | 0.02 | 0.03 | 0.04 | 0.05 | 0.06 | 0.07 | 0.08 | 0.09 | 0 | 0.500 0 | 0.504 0 | 0.508 0 | 0.512 0 | 0.516 0 | 0.519 9 | 0.523 9 | 0.527 9 | 0.531 9 | 0.535 9 | 0.1 | 0.539 8 | 0.543 8 | 0.547 8 | 0.551 7 | 0.555 7 | 0.559 6 | 0.563 6 | 0.567 5 | 0.571 4 | 0.575 3 | 0.2 | 0.579 3 | 0.583 2 | 0.587 1 | 0.591 0 | 0.594 8 | 0.598 7 | 0.602 6 | 0.606 4 | 0.610 3 | 0.614 1 | 0.3 | 0.617 9 | 0.621 7 | 0.625 5 | 0.629 3 | 0.633 1 | 0.636 8 | 0.640 4 | 0.644 3 | 0.648 0 | 0.651 7 | 0.4 | 0.655 4 | 0.659 1 | 0.662 8 | 0.666 4 | 0.670 0 | 0.673 6 | 0.677 2 | 0.680 8 | 0.684 4 | 0.687 9 | 0.5 | 0.691 5 | 0.695 0 | 0.698 5 | 0.701 9 | 0.705 4 | 0.708 8 | 0.712 3 | 0.715 7 | 0.719 0 | 0.722 4 | 0.6 | 0.725 7 | 0.729 1 | 0.732 4 | 0.735 7 | 0.738 9 | 0.742 2 | 0.745 4 | 0.748 6 | 0.751 7 | 0.754 9 | 0.7 | 0.758 0 | 0.761 1 | 0.764 2 | 0.767 3 | 0.770 3 | 0.773 4 | 0.776 4 | 0.779 4 | 0.782 3 | 0.785 2 | 0.8 | 0.788 1 | 0.791 0 | 0.793 9 | 0.796 7 | 0.799 5 | 0.802 3 | 0.805 1 | 0.807 8 | 0.810 6 | 0.813 3 | 0.9 | 0.815 9 | 0.818 6 | 0.821 2 | 0.823 8 | 0.826 4 | 0.828 9 | 0.835 5 | 0.834 0 | 0.836 5 | 0.838 9 | 1 | 0.841 3 | 0.843 8 | 0.846 1 | 0.848 5 | 0.850 8 | 0.853 1 | 0.855 4 | 0.857 7 | 0.859 9 | 0.862 1 | 1.1 | 0.864 3 | 0.866 5 | 0.868 6 | 0.870 8 | 0.872 9 | 0.874 9 | 0.877 0 | 0.879 0 | 0.881 0 | 0.883 0 | 1.2 | 0.884 9 | 0.886 9 | 0.888 8 | 0.890 7 | 0.892 5 | 0.894 4 | 0.896 2 | 0.898 0 | 0.899 7 | 0.901 5 | 1.3 | 0.903 2 | 0.904 9 | 0.906 6 | 0.908 2 | 0.909 9 | 0.911 5 | 0.913 1 | 0.914 7 | 0.916 2 | 0.917 7 | 1.4 | 0.919 2 | 0.920 7 | 0.922 2 | 0.923 6 | 0.925 1 | 0.926 5 | 0.927 9 | 0.929 2 | 0.930 6 | 0.931 9 | 1.5 | 0.933 2 | 0.934 5 | 0.935 7 | 0.937 0 | 0.938 2 | 0.939 4 | 0.940 6 | 0.941 8 | 0.943 0 | 0.944 1 | 1.6 | 0.945 2 | 0.946 3 | 0.947 4 | 0.948 4 | 0.949 5 | 0.950 5 | 0.951 5 | 0.952 5 | 0.953 5 | 0.953 5 | 1.7 | 0.955 4 | 0.956 4 | 0.957 3 | 0.958 2 | 0.959 1 | 0.959 9 | 0.960 8 | 0.961 6 | 0.962 5 | 0.963 3 | 1.8 | 0.964 1 | 0.964 8 | 0.965 6 | 0.966 4 | 0.967 2 | 0.967 8 | 0.968 6 | 0.969 3 | 0.970 0 | 0.970 6 | 1.9 | 0.971 3 | 0.971 9 | 0.972 6 | 0.973 2 | 0.973 8 | 0.974 4 | 0.975 0 | 0.975 6 | 0.976 2 | 0.976 7 | 2 | 0.977 2 | 0.977 8 | 0.978 3 | 0.978 8 | 0.979 3 | 0.979 8 | 0.980 3 | 0.980 8 | 0.981 2 | 0.981 7 | 2.1 | 0.982 1 | 0.982 6 | 0.983 0 | 0.983 4 | 0.983 8 | 0.984 2 | 0.984 6 | 0.985 0 | 0.985 4 | 0.985 7 | 2.2 | 0.986 1 | 0.986 4 | 0.986 8 | 0.987 1 | 0.987 4 | 0.987 8 | 0.988 1 | 0.988 4 | 0.988 7 | 0.989 0 | 2.3 | 0.989 3 | 0.989 6 | 0.989 8 | 0.990 1 | 0.990 4 | 0.990 6 | 0.990 9 | 0.991 1 | 0.991 3 | 0.991 6 | 2.4 | 0.991 8 | 0.992 0 | 0.992 2 | 0.992 5 | 0.992 7 | 0.992 9 | 0.993 1 | 0.993 2 | 0.993 4 | 0.993 6 | 2.5 | 0.993 8 | 0.994 0 | 0.994 1 | 0.994 3 | 0.994 5 | 0.994 6 | 0.994 8 | 0.994 9 | 0.995 1 | 0.995 2 | 2.6 | 0.995 3 | 0.995 5 | 0.995 6 | 0.995 7 | 0.995 9 | 0.996 0 | 0.996 1 | 0.996 2 | 0.996 3 | 0.996 4 | 2.7 | 0.996 5 | 0.996 6 | 0.996 7 | 0.996 8 | 0.996 9 | 0.997 0 | 0.997 1 | 0.997 2 | 0.997 3 | 0.997 4 | 2.8 | 0.997 4 | 0.997 5 | 0.997 6 | 0.997 7 | 0.997 7 | 0.997 8 | 0.997 9 | 0.997 9 | 0.998 0 | 0.998 1 | 2.9 | 0.998 1 | 0.998 2 | 0.998 2 | 0.998 3 | 0.998 4 | 0.998 4 | 0.998 5 | 0.998 5 | 0.998 6 | 0.998 6 | 3 | 0.998 7 | 0.999 0 | 0.999 3 | 0.999 5 | 0.999 7 | 0.999 8 | 0.999 8 | 0.999 9 | 0.999 9 | 1.000 0 | x | 0 | 0.1 | 0.2 | 0.3 | 0.4 | 0.5 | 0.6 | 0.7 | 0.8 | 0.9 | |
评论