正态分布是概率论中最重要的一种分布,它在客观世界中有着广泛的应用。通常随机变量的取值范围较集中的现象,如学生成绩的分布、人的身高和体重的分布等都服从正态分布。
在Excel中,绘制正态分布曲线,一般都采用散点图或折线图,其实,使用面积图,可以利用曲线下的面积染色,更为美观。如再采用三维面积图,并利用透明填充,透视感更强。
在Excel中,就有一个正态分布的密度函数NORMDIST(x,μ,σ,逻辑值),用以表达正态分布,它的语法表达式是:
NORMDIST(值,平均数,标准差,积累与否),其中:
x ——“值”,是要求分布的随机变量数值;
μ——“平均数”,是分布的算数平均数;
σ——“标准差”,是分布的标准差;
逻辑值——“积累与否”,是决定函数的逻辑值,其中:
l 如果“积累与否”的逻辑值取“TRUE”(真),则NORMDIST会返回累计分布函数;此类图表另外行文(见【附录】《Excel:正态分布的面积图(积累逻辑值为TRUE)》地址)。
l 如果“积累与否”的逻辑值取“FALSE”(伪),则NORMDIST会返回正态分布函数的高度。如果为了绘制正态分布曲线,就要取“FALSE”。
回忆一下在学习概率统计时的一些最基本的概念:
在正态分布的密度函数中有上述两个常数μ和σ,μ为分布的算数平均数,σ为分布的标准差。
正态分布的值有99.74%落在(μ-3σ,μ+3σ)区间内,也就是说落在以平均值为中心的左右各3个σ(共六个σ)的范围内,所谓“六西格玛”就源于此。
正态分布的密度函数的图形也就是常说的中间高两头低的那种钟形的图形,它是关于直线x=μ对称的;在x =μ处达到最大值。
若固定σ的值,而μ变化时,则密度曲线的形状不变,它沿着x轴方向平行移动。
若固定μ的值,而σ变化时,则密度曲线的位置不变,而其形状将改变,当σ较大时离散程度大,曲线平缓,分布散落在x =μ周边较大范围中,当σ较小时离散程度小,曲线陡峭,分布集中在x =μ附近。
为了制作正态分布面积图,先准备下列数据表格(实际使用的表格中,单元格中都是数据,以下为了说明具体公式,在“工具”-“选项”-“视图”中勾选了“公式”,以便各单元格的具体参数都显示出来,以供参考。实际使用时还应该将这个勾选取消):
在A列,准备按自己需要设置自变量数据x,本例从0——100,(A2——A102)。
在B列:B2=NORMDIST(A2,50,5,FALSE),μ=50,σ=5,一直拖到B102。
在C列:C2=NORMDIST(A2,50,10,FALSE),μ=50,σ=10,一直拖到C102。
在D列:D2=NORMDIST(A2,50,15,FALSE),μ=50,σ=15,一直拖到D102。
在E列:E2=NORMDIST(A2,70,8,FALSE),μ=70,σ=8,一直拖到E102。
前三个正态分布,它们的平均值都相同,都是50,而标准差不同,分别是5、10、15。这三个图形的对称轴相同,都是x=μ,但陡峭平缓程度会随着标准差的变化而变化。第四个分布的对称轴则在上述分布的右侧,且比较陡峭。
我们先以D列数据:μ=50,σ=15,做一个面积图。选取D2:D102,做面积图,如图1所示:
图1
将透明色填充,做一比较,如图2所示:
图2
在此基础上再增加E列数据μ=70,σ=8,作分布面积图,且一个填充透明,在后侧,另一个填充不透明,在前侧。显然后侧面积有部分被阻挡遮盖。如图3所示:
图3
将图3序列前后顺序做一交换,填充透明的在前侧,填充不透明在后侧。后侧被阻挡遮盖部分由于透明的缘故,显现出来了。如图4所示
图4
两个面积都填充透明,如图5所示,全部透明效果如何,看来也是见仁见智的事了:
图5
然后,我们再以B、C、D三列数据:μ都是50,单σ分别等于5、10、15,做三个面积图。选取B2:B102 、C2:C102和 D2:D102,做二维面积图,两个填充透明色在后方,另外一个填充不透明的在前方。显然,后方透明色被遮挡。如图6所示,:
图6
调整一下系列顺序,把不透明的调到后方,被遮挡的部分显现出来了,如图7所示:
图7
将三部分都调成透明色,效果如图8所示:
图8
在三个面积全都是透明色的条件下,调整了系列顺序,视觉效果变化并不明显,如图9所示:
图9
下面使用三维面积图:三块面积都使用三维面积图形式,一个透明在前,两个不透明在后。要说明的是,这三块面积,看似曲线组成,实际上是折线组成,只不过由于自变量x取值较多,近似于曲线。这在上述二维作图时表现不明显,100条折线组成的图形比较平滑。然而在三维作图中每块面积的上缘(类似于山顶上)每个折线形的边缘轮廓线都会显现出来。当然也可以设置无边线,但会使整个三维图显得模糊,因此,仍然保留了边缘轮廓线。如图10所示:
图10
将上图的数据系列调整一下顺序,两个不透明在前,一个透明在后。如图11所示:
图11
三个面积图都为透明色,如图12所示:
图12
将上图系列顺序调整一下,如图13所示:
图13
将图13调整一下透视参数,如图14所示:
图14
【附录】
《Excel:正态分布的面积图(积累逻辑值为TRUE)》地址:
http://shuchonghui.blog.163.com/blog/static/1511563201011231454432/ < xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" />
评论