Posted on 2007-07-11 10:52
David.Ko 阅读(1498)
评论(0) 编辑 收藏 所属分类:
AI
模式识别,就是通过计算机用数学技术方法来研究模式的自动处理和判读。我们把环境与客体统称为“模式”。随着计算机技术的发展,人类有可能研究复杂的信息处理过程。信息处理过程的一个重要形式是生命体对环境及客体的识别。对人类来说,特别重要的是对光学信息(通过视觉器官来获得)和声学信息(通过听觉器官来获得)的识别。这是模式识别的两个重要方面。市场上可见到的代表性产品有OCR(Optical Character Recognition),语音识别系统。
计算机识别的显著特点是速度快,准确性高,效率高。完全可以取代人工录入。
识别过程与人类的学习过程相似。以“汉字识别”为例:首先将汉字图象进行处理,抽取主要表达特征并将特征与汉字的代码存在计算机中。就象老师教我们这个字叫什么如何写记在大脑中。这一过程叫做“训练”。识别过程就是将输入的汉字图象经处理后与计算机中的所有字进行比较,找出最相近的字就是识别结果。这一过程叫做“匹配”。
OCR还有一个重要组成部分是对具体对象的“版面分析”或称“分割”。属于图象处理范畴。比如在一篇文章中将每个独立的汉字切分出来;名片识别中要将每个字段切出来。切分的难度不亚于识别。
以下给出OCR的常用概念与技术指标:
识别率:正确识别的字符占所有测试字符的比例。是大量字符测试后的统计结果。
拒识率:无法识别(没有给出识别结果)的字符占所有测试字符的比例。
误识率:将甲识别成乙等识别错误的字符占所有测试字符的比例。
识别速度:基于某种速度计算机的识别一个字符的时间或一秒钟能识别字符的个数。
扫描分辨率:指扫描仪光学源的物理分辨率。分辨率越高获得的图象越清晰。
那么人的模式识别是什么呢?看来主要的还是要依靠原先的认知结构。在专家记忆中有5到10万个组快,且都按照层次网络结构进行连接,而且易于提取。那么在认识或者学习新东西的时候,很容易对“模式”进行识别了。