wfw的java日志

我的评论

'样本确定了w,用数学的语言描述,就是w可以表示为样本的某种组合:

w=α1x1+α2x2+…+αnxn'

这个也不太明白,为什么w是x的线性组合函数?
'高维模式识别是指样本维数很高,例如文本的向量表示,如果没有经过另一系列文章(《文本分类入门》)中提到过的降维处理,出现几万维的情况很正常,其他算法基本就没有能力应付了,SVM却可以,主要是因为SVM 产生的分类器很简洁,用到的样本信息很少(仅仅用到那些称之为“支持向量”的样本,此为后话),使得即使样本维数很高,也不会给存储和计算带来大麻烦(相对照而言,kNN算法在分类时就要用到所有样本,样本数巨大,每个样本维数再一高,这日子就没法过了……)。'

其心有两个地方不理解:

1. ‘其他算法基本就没能力应付了’中其他算法出了后面提到的knn还有谁?粗略想了一下常见的分类算法,贝叶斯,决策树,线性回归,逻辑回归这些都OK吧?
2. ‘用到的样本信息很少’大概明白LZ的意思,但还是感觉有点。。。
'为SVM关注的是VC维,后面我们可以看到,SVM解决问题的时候,和样本的维数是无关的'

不是很理解VC维和这句话,我的理解是VC维和样本维度是相关的,比如样本维度是2,最多就有2^2个样本,如果是二分类问题,’最大的VC维‘就是2^(2^2)
如果相关的话,上面的话不是矛盾么?

导航

<2025年1月>
2930311234
567891011
12131415161718
19202122232425
2627282930311
2345678

统计

常用链接

留言簿(1)

随笔档案

搜索

最新评论