无为

无为则可为,无为则至深!

  BlogJava :: 首页 :: 联系 :: 聚合  :: 管理
  190 Posts :: 291 Stories :: 258 Comments :: 0 Trackbacks

为阐述单个变量的分布函数的求法,首先讲一个掷图钉的例子:设掷为头的可能性是 t, 那么 t 的可能性概率分布函数 P(t| ξ ) 。那么下一次掷为头的概率是 P(x=heads| ξ )= p(x=heads|t, ξ )p(t| ξ )dt= t*p(t| ξ )dt=E(t| ξ ) 。而且,进一步地如果掷为头后的 t 的分布概率就为 p(t| x=heads, ξ )=c* p(x=heads|t, ξ )* p(t| ξ )=c*t* p(t| ξ ). 这样的话 p(t|m heads ,n tails , ξ )=c*t(m)*(1-t)(n)* p(t| ξ ) [ 其中 t(m) 表示 t m 次方 ] ,也就求得 m 次掷为“头”, n 次掷为尾后的 t 的概率分布情况。上面的是对于两个结果的情况的分析,那么对于离散的多种结果的情况,我们可以用同样的方法进行分析。下面讲怎么样用贝叶斯方法来进行分类。

定义:如果 K 为属性的个数, D 定义为含有 K 个值的向量。表示为 D=(x1=v1,x2=v2,….xk=vk), 其中 x 为属性, v 为属性值。一个 Concept 定义为相似记录的集合, Concept C 定义为 K 个可能的属性值的分布函数的向量。表示为 C=(f1,f2,…fk) 。这里 fk 是一个分布函数,它由在这个 Concept 里第 k 个属性的所有属性值决定。例如, vk1,vk2,….vkN N 个记录 D1,D2…DN 的第 k 个属性值 , 那么 fk 可能的分布函数是 fk(xk|D1…DN)=Mk*exp{-(xk-ak)*(xk-ak)/2 б k* бk } .

定义 H=(C1,C2…,CJ) 为所有各种分类集合的集合。对于新的一个记录 D, 如果 Cj 为那个接受 D 的那一类, Hj 为接受了以后变化了的 H, 那么衡量 Cj 接受 D 的好坏就由 P(Hj|DH)=P(Hj|H)P(D|HjH)/P(D|H) 来决定,它的最大值也就对应哪个最适合的 Cj 。假定 P(Hj|H) 对于每一个 j 都是相等的,那么我们只需要比较 P(D|HjH) 。而 P(D|HjH) =P(Cj|HjH)*

P(D|CjHjH)=|Cj|/|C|*P(D|Cj),P(D|Cj)

表示 D 属于 Cj 的程度。这里 |C| 表示 C 中记录的个数。, P(D|C)= П P( vk|fk ) 对于连续变量, P(vk|fk)=fk(vk) ? xk, 这儿 ? xk vk 周围很小的一个常量范围。对于离散变量, P(vk|fk)=C 中第 k 个属性值是 vk 的个数 /C 中记录的个数。

凡是有该标志的文章,都是该blog博主Caoer(草儿)原创,凡是索引、收藏
、转载请注明来处和原文作者。非常感谢。

posted on 2006-06-10 14:03 草儿 阅读(292) 评论(0)  编辑  收藏 所属分类: BI and DM

只有注册用户登录后才能发表评论。


网站导航: