//导出dataset数据到XML文件
//Author:Quietwalk
//2010-09-09
public bool ExportToXMl(DataSet ds, string strXMLPath)
{
//DirectoryInfo mobileDir = new DirectoryInfo(strXMLPath);
FileInfo XMLfile = new FileInfo(strXMLPath);
bool bReturnValue = false;
try
{
if (ds != null && ds.Tables.Count > 0 && XMLfile.Exists)
{
ds.WriteXml(strXMLPath, XmlWriteMode.WriteSchema);
bReturnValue = true;
}
}
catch(SqlCeException ex)
{
throw(ex);
}
return bReturnValue;
}
//XML 数据导入到 DataSet中
//Author:Quietwalk
//2010-09-09
public DataSet ImportFromXml(string fromPath)
{
FileInfo xmlFile = new FileInfo(fromPath);
DataSet dsXML =null;
if (xmlFile.Exists)
{
FileStream fsReadXml = new FileStream(fromPath, FileMode.Open);
XmlTextReader myXmlReader = new XmlTextReader(fsReadXml);
dsXML=new DataSet ();
dsXML.ReadXml(myXmlReader);
myXmlReader.Close();
}
return dsXML;
}
说明:
DateSet.ReadXML()
ReadXML缺省使用XmlReadMode.Auto方式读取,这就给大数据量留下了低效率的伏笔。因为tb如果XML没有Scheme,DataSet就会自己推算XML的结构,然后再加载,这就是低效的主要原因。让DataSet推算不让我们帮他算,因为DataSet已经提供了一个ReadXmlSchema方法。
dataset是这样存储的:table(0)中存放feature层的信息,包括fno等属性,只有一行;
table(1)中包括attribute的信息包括ano等属性,有两行。如果attribute下还有其他子层,就依次放在 table(2)..中。 dataset读取数据之后,可以与datagrid绑定进行显示,绑定时可以针对dataset中的单个表,也可以一次绑定所有表。
1. 载入 xml 文件的格式要求
a. 不可以读取空的文件.
如果使用 DataSet.ReadXml 载入一个空的文件, 将出现异常, 因为没有根元素.
b. 可以读取没有 <?xml?> 头的 xml 文件.
你的 xml 文件可以不包含 <?xml version="1.0" encoding="utf-8" ?> 这样的代码.
2. xml 文件的编码格式
a. <?xml?> 头中标记的编码最好和文件自身的编码一致.
在测试文件中, 我使用 utf-32 存储标记为 utf-8 的 xml 文件, 或者反过来都导致了 DataSet 读取文件异常. 虽然, 我并没有对所有的编码进行测试, 而且用 ASCII 存储标记为 utf-8 的 xml 时, tb读取不会出现异常, 只不过中文可能会出现乱码, 最好还是保持编码一致吧.
b. 采用 ASCII 存储 xml 文件可能出现中文乱码.
xml 自身是不支持 ASCII 的, 虽然读取没有异常, 但你读取的信息可能是一堆"?".
3. XmlReadMode 参数对 DataSet 读取 xml 文件的影响
a. 非典型 DataSet 如果包含架构, 并使用默认的 XmlReadMode.Auto 或者忽略此选项, 将只载入 xml 文件中符合架构的数据.
如果你的数据集中包含了架构信息, 例如定义了 S1, T1(Name string, Age int), Student(Name string, Age int), Teacher 4 个表, 数据集名称为 TestDS, 命名空间为 http://tempuri.org/TestDS.xsd, 如果一个的 xml 文件如下:
<?xml version="1.0" encoding="utf-8" ?>
<TestDS xmlns="http://tempuri.org/TestDS.xsd">
<Student>
<Name>小明</Name>
<Age>12</Age>
</Student>
<Teacher>
<Name>王老师</Name>
<Age>32</Age>
</Teacher>
<Room>
<ID>123</ID>
</Room>
</TestDS>
使用 DataSet.ReadXml 读取此 xml 文件时, 第一个 Student 被读取到 DataSet 的 Student 表中, 因为 xml 中 Student 对应的列名数据类型和 DataSet 架构一致. 第二个 Teacher 不会被读取, DataSet 架构中虽然包含了表 Teacher, 但并没有定义任何的列, 而 xml 中的 Teacher 包含了 Name, Age 两个列. 第三个 Room 不会被读取, 因为架构中不包含表 Room. 以上是针对非典型 DataSet 测试的结果, 典型 DataSet 应该也是如此, 有兴趣的朋友可以自己测试一下.
b. 非典型 DataSet 如果不包含架构, 并使用默认的 XmlReadMode.Auto 或者忽略此选项, 将分析并采用 xml 文件的架构.
如果仅仅使用 new 创建了一个非典型 DataSet, 那么 DataSet 中尚未包含架构. 如果一个的 xml 文件如下:
<?xml version="1.0" encoding="utf-8" ?>
<TestDS xmlns="http://tempuri.org/TestDS.xsd">
<Room>
<ID>123</ID>
</Room>
<Room>
<ID>123</ID>
<Name>储藏室</Name>
</Room>
</TestDS>
当 DataSet 读取 xml 文件时, 将分析数据集名称, 命名空间, 并针对每一条数据进行架构分析, 我想这一点很重要, 正如上面的文件中, 当读取到第一个 Room 时, 分析得到需要 Room(ID) 这样的表, 读取第二个 Room 时, 会发现 Room 表的架构信息已经存在, 经过对比发现需要变更架构为 Room(ID, Name). 每一条数据除了架构分析以外, 还要进行可能的架构更改工作. 因此, 在效率上可能不及 a 中说到的情况.
c. 对于 XmlReadMode 的其余选项, 似乎并不用于 ReadXml 方法, 或者没有实际效果.
4. 载入 xml 字符串, byte[] 数组到 DataSet
a. 使用 DataSet.ReadXml(new StringReader(string)) 可以将 xml 字符串载入到 DataSet.
xml 字符串应该是合法的, 如果在字符串的 <?xml?> 头中指定 encoding, 那么指定任何编码都可以读取中文字符, 也就是说指定对于载入是没有作用的.
b. 使用 DataSet.ReadXml(new MemoryStream(byte[])) 可以将 byte[] 数组表示的 xml 载入到 DataSet.
对于编码, 载入 byte[] 数组和载入文件的要求是类似的, <?xml?> 头中标记的编码应该和 byte[] 数组的编码一致, 最好不要采用 ASCII, 原因在上文中已经提到. 使用 Encoding.GetBytes 方法将字符串转化为 byte[] 数组时, 编码应该对照. 如果, 使用 Encoding.UTF8.GetBytes, 那么字符串中 <?xml?> 头应该标记 uft-8, 另外, 也可以不标记 encoding, 结果是相同的.