rcdk, 是在R下面集成了CDK工具包,以此来通过CDK生成的化学性质数据进行更深层次的统计分析,下面来看看在rcdk中如何进行多个化合物结构的聚类。
首先需要在R下面安装rcdk程序包,然后就可以进入命令行,进行如下操作:
>library("rcdk") //加载包
>mols <- load.molecules("mymols.sdf") //读取sdf文件
> fps <- lapply(mols, get.fingerprint, type="extended") //生产fingerprint值
> fp.sim <- fp.sim.matrix(fps, method="tanimoto") //建立矩阵
> fp.dist <- 1-fp.sim
> clustering <- hclust(as.dist(fp.dist))
> plot(clustering)
执行到这里,我们就得到了结果,如下图:
这里我选择的是50个化合物结构进行处理。是不是很方便~:)
posted on 2011-04-11 21:41
周锐 阅读(910)
评论(0) 编辑 收藏 所属分类:
Chemistry 、
CDK 、
R