http://wiki.mbalib.com/wiki/%E6%96%B9%E5%B7%AE
方差(Variance)
什么是方差
方差和标准差是测度数据变异程度的最重要、最常用的指标。
方差是各个数据与其算术平均数的离差平方和的平均数,通常以σ2表示。方差的计量单位和量纲不便于从经济意义上进行解释,所以实际统计工作中多用方差的算术平方根——标准差来测度统计数据的差异程度。
标准差又称均方差,一般用σ表示。方差和标准差的计算也分为简单平均法和加权平均法,另外,对于总体数据和样本数据,公式略有不同。
方差的计算公式
设总体方差为σ2,对于未经分组整理的原始数据,方差的计算公式为:
对于分组数据,方差的计算公式为:
方差的平方根即为标准差,其相应的计算公式为:
未分组数据:
分组数据:
样本方差和标准差
样本方差与总体方差在计算上的区别是:总体方差是用数据个数或总频数去除离差平方和,而样本方差则是用样本数据个数或总频数减1去除离差平方和,其中样本数据个数减1即n-1称为自由度。设样本方差为,根据未分组数据和分组数据计算样本方差的公式分别为:
未分组数据:
分组数据:
未分组数据:
分组数据:
例:考察一台机器的生产能力,利用抽样程序来检验生产出来的产品质量,假设搜集的数据如下:
3.43 |
3.45 |
3.43 |
3.48 |
3.52 |
3.50 |
3.39 |
3.48 |
3.41 |
3.38 |
3.49 |
3.45 |
3.51 |
3.50 |
根据该行业通用法则:如果一个样本中的14个数据项的方差大于0.005,则该机器必须关闭待修。问此时的机器是否必须关闭?
解:根据已知数据,计算
因此,该机器工作正常。
方差和标准差也是根据全部数据计算的,它反映了每个数据与其均值相比平均相差的数值,因此它能准确地反映出数据的离散程度。方差和标准差是实际中应用最广泛的离散程度测度值。
---------------------------------------------------------------------
http://zh.wikipedia.org/wiki/%E6%96%B9%E5%B7%AE
方差
维基百科,自由的百科全书
在概率论和统计学中,一个随机变量的“方差”描述的是它的离散程度,也就是该变量离其期望值的距离。 一个实随机变量的方差也称为它的二阶距,恰巧也是它的二阶culmulent。 方差的算术平方根称为该随机变量的标准差。
[编辑] 定义
设 X 为服从分布 F 的随机变量,则称 Var(X) = E(X − EX)2 为随机变量 X 或者分布 F 的方差。
如果 是隨機變數 X 的期望值 (平均數) , 則其變異數為:
[编辑] 特性
在样本空间Ω上存在有限期望和方差的随机变量构成一个希尔伯特空间: L^2(Ω, dP),不过这里的内积和长度跟方差,标准差还是不大一样。 所以,我们得把这个空间“除”常变量构成的子空间,也就是说把相差一个常数的 所有原来那个空间的随机变量做成一个等价类。这还是一个新的无穷维线性空间, 并且有一个从老空间内积诱导出来的新内积,而这个内积就是方差
[编辑] 一般化
如果X是一个向量其取值范围在Rn空间,并且其每个元素都是一个一维随机变量,我们就把X称为随机向量。随机向量的方差是一维随机变量方差的自然推广,其定义为E[(X − μ)(X − μ)T], 其中 μ = E(X) ,XT是X的转秩. 这个方差是一个非负定方阵,通常称为协方差矩阵。
如果X是一个复随机变量,那么其方差定义则为E[(X − μ)(X − μ)*], 其中X*是X的复共轭向量。根据这个定义,方差为实数。
[编辑] 历史
方差这个词首先由Ronald Fisher在论文The Correlation Between Relatives on the Supposition of Mendelian Inheritance中引入.
[编辑] 参考出处
- ^ Press, W. H., Teukolsky, S. A., Vetterling, W. T. & Flannery, B. P. (1986) Numerical recipes: The art of scientific computing. Cambridge: Cambridge University Press. (online)
posted on 2009-03-12 22:51
donnie 阅读(10853)
评论(0) 编辑 收藏 所属分类:
math