GIS数据建库基本思想(上)
3.
数据规范
这里说的数据规范,指的是可以被系统所正确识别的数据。这依赖于上述数据库建库的第一个过程,即数据库标准的制定和数据规范。这里的主要矛盾在于,因为
GIS
平台的不一致,各个平台对空间数据描述的模型不同,而导致了在一个平台上生成的数据在另一个平台不能正确读出,从而导致转换前后矢量或属性数据的丢失,甚至无法转换的结果。
例如,
AutoCAD
存在拟合曲线
Spline
对象,图形块
Block
对象,区域
Region
对象,代理对象等许多特殊的图形对象,在
GIS
系统中没有相应的图形对象与之相对应。因此要想将这些数据入库,必须先将以上对象转化,使之变成
GIS
可以识别的图形对象。
AutoCAD
的扩展数据由于为
AutoCAD
所特有,因此也必须寻找解决办法
(
例如数据格式转换
)
,使之能被
GIS
所正确读取。
此外还包括数据规范中规定的各个图层之间相互的空间拓扑关系及属性数据等,这些都要求有相应的检测和修正工具予以保证。
4.
数据生产
数据生产过程主要包括准备阶段和数据输入阶段。以下为
AutoCAD
平台下数据的生产过程为例。
准备阶段
此过程包括定义图层名称,配置图层的各种属性(颜色,线性,线宽,图形符号等)。这一过程是数据生产的准备阶段,工作逻辑上非常简单,在认真设置和检查后,产生错误的可能性会很小。
数据生产阶段
包括栅格数据自动矢量化和人工输入两个比较大的方面,有时候全为人工输入。
栅格数据自动矢量化是通过扫描仪器输入栅格数据,然后通过图像识别算法,进行矢量跟踪,从而确定实体的空间位置。在目前的技术发展中,程序的算法往往不能完全识别出所需要的对象并进行正确的矢量化,若栅格数据是经过底图扫描而非遥感影像,可能还会出现扫面不清晰,因此会产成各种各样的问题。常见的错误主要有以下几种:
(1)
房屋等面状闭合物体留有缺口,即不封闭。
(2)
扫描后的线段存在很多重复点的现象。
(3)
扫描后的线段存在自相交的情况。
(4)
在图像边缘上的线段,扫描后出现畸变现象。
(5)
在图像的边缘存在数据丢失的现象。
(6)
由于图像定位不准,导致扫描后图像部分基准点偏移,从而导致相邻的地区存在图形重叠或交叉的现象。
其中基准点偏差的影响尤为显著,严重影响数据建库。一般情况下,我们需要封闭检查,重复点检查,自相交检查,基准点检查和校正等检查工具去发现和排除这些错误。在这些错误中,错误
1
、
2
、
3
、
6
在逻辑上比较简单,相对比较好解决。错误
4
、
5
则比较难于检查和解决。
人工输入是指数据录入人员按照要求用鼠标或绘图议等手工在图纸上进行绘图,并设置和添加各种属性的过程。这一过程十分繁重的,并且工作具有重复性和枯燥性等特点,因此容易造成各种错误,从而影响数据质量。产成的错误的原因主要有两个:
精度问题造成的错误,这种原因往往造成图形拓扑关系错误。例如,应该闭合的面状物体没有闭合,应该端点相连的直线没有连接,不应该重叠的线段存在重叠的部分,不应该交叉的图形存在交叉,面与面之间存在缝隙,面与面之间发生重叠,基准点和控制点定位不准确等等。
人为疏忽造成的原因。例如,有属性的图形物体忘记给属性赋值,导致属性丢失;有属性的图形物体错误赋值,导致属性错误;图幅边框被删除或者移动位置;图幅边界上的图形没有很好的完成接边处理,造成相邻图形不匹配等等。这些错误都经常的会在数据生产过程中发生,如果不加以检测和修正,将直接影响建库的正确性和准确性,应予以注意。
5.
小结
从以上分析可以看出,数据建模、数据规范、数据生产都是
GIS
数据顺利、准确入库的关键,在整个过程中,数据校验起到了非常重要的作用,在实际操作中,需要系统理论知识和经验知识来作为建立
GIS
数据库的架构支撑。根据个人有限的系统工程方面的理论知识,只能对数据校验做出如下概述:
(1)
首先,需要对准备入库的各种源数据进行研究和分析,从中发现数据中存在的明显的错误,并估计潜在的错误。
(2)
根据数据建库标准和数据规范,分析这些错误可能对建库造成的影响,按照严重程度、优先级别、逻辑关系等将错误分类,并制定处解决问题的方案。
(3)
按照制定的解决方案有计划、有步骤的纠正这些错误,使之符合建库的规范。
(4)
这样循环检查几次,尽量消除数据中的错误,一般情况下,总会有少量错误存在。
(5)
当已经很难找出错误时,可以开始进行抽样检测,并小规模进行试验性入库。
(6)
在试验性入库成功后,进行大批量的实际入库。
(7)
入库完毕,对入库成果进行抽样检查,查找不正确的地方,并进行修正。
(8)
GIS
数据入库正式完成,交付使用。
经过上述过程,整个建库工作就已经完成。上文所述,只是个人在
GIS
数据建库方面的一点个人经验和系统知识,在今后的实际工作中仍需不断完善、深入。
原文链接:http://www.gissky.net/blog/blog.asp?name=bluewood