为阐述单个变量的分布函数的求法,首先讲一个掷图钉的例子:设掷为头的可能性是
t,
那么
t
的可能性概率分布函数
P(t|
ξ
)
。那么下一次掷为头的概率是
P(x=heads|
ξ
)=
∫
p(x=heads|t,
ξ
)p(t|
ξ
)dt=
∫
t*p(t|
ξ
)dt=E(t|
ξ
)
。而且,进一步地如果掷为头后的
t
的分布概率就为
p(t| x=heads,
ξ
)=c* p(x=heads|t,
ξ
)* p(t|
ξ
)=c*t* p(t|
ξ
).
这样的话
p(t|m heads ,n tails ,
ξ
)=c*t(m)*(1-t)(n)* p(t|
ξ
) [
其中
t(m)
表示
t
的
m
次方
]
,也就求得
m
次掷为“头”,
n
次掷为尾后的
t
的概率分布情况。上面的是对于两个结果的情况的分析,那么对于离散的多种结果的情况,我们可以用同样的方法进行分析。下面讲怎么样用贝叶斯方法来进行分类。
定义:如果
K
为属性的个数,
D
定义为含有
K
个值的向量。表示为
D=(x1=v1,x2=v2,….xk=vk),
其中
x
为属性,
v
为属性值。一个
Concept
定义为相似记录的集合,
Concept C
定义为
K
个可能的属性值的分布函数的向量。表示为
C=(f1,f2,…fk)
。这里
fk
是一个分布函数,它由在这个
Concept
里第
k
个属性的所有属性值决定。例如,
vk1,vk2,….vkN
是
N
个记录
D1,D2…DN
的第
k
个属性值
,
那么
fk
可能的分布函数是
fk(xk|D1…DN)=Mk*exp{-(xk-ak)*(xk-ak)/2
б
k*
бk
}
.
定义
H=(C1,C2…,CJ)
为所有各种分类集合的集合。对于新的一个记录
D,
如果
Cj
为那个接受
D
的那一类,
Hj
为接受了以后变化了的
H,
那么衡量
Cj
接受
D
的好坏就由
P(Hj|DH)=P(Hj|H)P(D|HjH)/P(D|H)
来决定,它的最大值也就对应哪个最适合的
Cj
。假定
P(Hj|H)
对于每一个
j
都是相等的,那么我们只需要比较
P(D|HjH)
。而
P(D|HjH) =P(Cj|HjH)*P(D|CjHjH)=|Cj|/|C|*P(D|Cj),P(D|Cj)
表示
D
属于
Cj
的程度。这里
|C|
表示
C
中记录的个数。,
P(D|C)=
П
P(
vk|fk
)
对于连续变量,
P(vk|fk)=fk(vk)
?
xk,
这儿
?
xk
是
vk
周围很小的一个常量范围。对于离散变量,
P(vk|fk)=C
中第
k
个属性值是
vk
的个数
/C
中记录的个数。
凡是有该标志的文章,都是该blog博主Caoer(草儿)原创,凡是索引、收藏
、转载请注明来处和原文作者。非常感谢。