随笔 - 79  文章 - 11  trackbacks - 0
<2009年3月>
22232425262728
1234567
891011121314
15161718192021
22232425262728
2930311234

不再堕落。
Oracle documents: 
http://tahiti.oracle.com/

常用链接

留言簿

随笔分类(66)

随笔档案(79)

相册

收藏夹(11)

搜索

  •  

积分与排名

  • 积分 - 52750
  • 排名 - 949

最新随笔

最新评论

阅读排行榜

http://wiki.mbalib.com/wiki/%E6%96%B9%E5%B7%AE

方差(Variance)

什么是方差

  方差和标准差是测度数据变异程度的最重要、最常用的指标。

  方差是各个数据与其算术平均数的离差平方和的平均数,通常以σ2表示。方差的计量单位和量纲不便于从经济意义上进行解释,所以实际统计工作中多用方差的算术平方根——标准差来测度统计数据的差异程度。

  标准差又称均方差,一般用σ表示。方差和标准差的计算也分为简单平均法和加权平均法,另外,对于总体数据和样本数据,公式略有不同。

方差的计算公式

  设总体方差为σ2,对于未经分组整理的原始数据,方差的计算公式为:

  \sigma^2=\frac{\sum_{i=1}^N(X_i-\bar{X})^2}{N}

  对于分组数据,方差的计算公式为:

  \sigma^2=\frac{\sum_{i=1}^K(X_i-\bar{X})^2 f_i}{\sum_{i=1}^K f_i}

  方差的平方根即为标准差,其相应的计算公式为:

  未分组数据:\sigma=\sqrt{\frac{\sum_{i=1}^N(X_i-\bar{X})^2}{N}}

  分组数据:\sigma=\sqrt{\frac{\sum_{i=1}^K(X_i-\bar{X})^2 f_i}{\sum_{i=1}^K f_i}}

样本方差和标准差

  样本方差与总体方差在计算上的区别是:总体方差是用数据个数或总频数去除离差平方和,而样本方差则是用样本数据个数或总频数减1去除离差平方和,其中样本数据个数减1即n-1称为自由度。设样本方差为S_{n-1}^2,根据未分组数据和分组数据计算样本方差的公式分别为:

  未分组数据:S_{n-1}^2=\frac{\sum_{i=1^n(x_i-\bar{x})^2}}{n-1}

  分组数据:S_{n-1}^2=\frac{\sum_{i=1^k(x_i-\bar{x})^2 f_i}}{\sum_{i=1}^k f_i-1}

  未分组数据:S_{n-1}=\sqrt{\frac{\sum_{i=1^n(x_i-\bar{x})^2}}{n-1}}

  分组数据:S_{n-1}=\sqrt{\frac{\sum_{i=1^k(x_i-\bar{x})^2 f_i}}{\sum_{i=1}^k f_i-1}}

  例:考察一台机器的生产能力,利用抽样程序来检验生产出来的产品质量,假设搜集的数据如下:

3.43 3.45 3.43 3.48 3.52 3.50 3.39
3.48 3.41 3.38 3.49 3.45 3.51 3.50

  根据该行业通用法则:如果一个样本中的14个数据项的方差大于0.005,则该机器必须关闭待修。问此时的机器是否必须关闭?

  解:根据已知数据,计算\bar{x}=\frac{\sum x}{n}=3.459

  S^2=\frac{\sum(x-\bar{x})^2}{n-1}=0.002<0.005

  因此,该机器工作正常。

  方差和标准差也是根据全部数据计算的,它反映了每个数据与其均值相比平均相差的数值,因此它能准确地反映出数据的离散程度。方差和标准差是实际中应用最广泛的离散程度测度值。

---------------------------------------------------------------------
http://zh.wikipedia.org/wiki/%E6%96%B9%E5%B7%AE

方差

维基百科,自由的百科全书

跳转到: 导航, 搜索

概率论统计学中,一个随机变量的“方差”描述的是它的离散程度,也就是该变量离其期望值的距离。 一个实随机变量的方差也称为它的二阶距,恰巧也是它的二阶culmulent。 方差的算术平方根称为该随机变量的标准差

目录

[隐藏]

[编辑] 定义

X 为服从分布 F 的随机变量,则称 Var(X) = E(XEX)2 为随机变量 X 或者分布 F方差

如果 \mu = \operatorname{E}(X) 是隨機變數 X期望值 (平均數) , 則其變異數為: \operatorname{var}(X) = \operatorname{E}( ( X - \mu ) ^ 2 ).

[编辑] 特性

在样本空间Ω上存在有限期望和方差的随机变量构成一个希尔伯特空间: L^2(Ω, dP),不过这里的内积和长度跟方差,标准差还是不大一样。 所以,我们得把这个空间“除”常变量构成的子空间,也就是说把相差一个常数的 所有原来那个空间的随机变量做成一个等价类。这还是一个新的无穷维线性空间, 并且有一个从老空间内积诱导出来的新内积,而这个内积就是方差

[编辑] 一般化

如果X是一个向量其取值范围在Rn空间,并且其每个元素都是一个一维随机变量,我们就把X称为随机向量。随机向量的方差是一维随机变量方差的自然推广,其定义为E[(X − μ)(X − μ)T], 其中 μ = E(X) ,XTX的转秩. 这个方差是一个非负定方阵,通常称为协方差矩阵

如果X是一个复随机变量,那么其方差定义则为E[(X − μ)(X − μ)*], 其中X*X的复共轭向量。根据这个定义,方差为实数。

[编辑] 历史

方差这个词首先由Ronald Fisher在论文The Correlation Between Relatives on the Supposition of Mendelian Inheritance中引入.

[编辑] 参考出处

  1. ^ Press, W. H., Teukolsky, S. A., Vetterling, W. T. & Flannery, B. P. (1986) Numerical recipes: The art of scientific computing. Cambridge: Cambridge University Press. (online)
posted on 2009-03-12 22:51 donnie 阅读(10859) 评论(0)  编辑  收藏 所属分类: math

只有注册用户登录后才能发表评论。


网站导航: