版权所有: (xiaodaoxiaodao) 蓝小刀    xiaodaoxiaodao@gmail.com

http://www.blogjava.net/xiaodaoxiaodao/articles/103444.html

转载请注明来源 / 作者

 

tidy 试用

 

tidy 是一个把 HTML 标准化的工具,可以在 http://tidy.sourceforge.net/ 上下载

下了个 DOS 版本用了下,

在命令行输入 tidy -f errs.txt -m hy.htm

-f 代表日志文件是 errs.txt ,如果没有则创建, -m hy.htm 表示要进行标准化的文件,转换后会覆盖掉原来的 hy.htm ),

转换后打开发现 hy.htm 中的汉字变成乱码了, google search 了一下,呵呵,发现原来可以加个 config 文件配置编码类型,把 config.txt 放在相应的目录下,然后再次运行

tidy -f errs.txt -config config.txt -m hy.htm ,用 IE 打开后中文正确显示

(实际中遇到一个问题 -config config.txt 只能放在 -m hy.htm 之前 ,否则转换后仍然是乱码

下面是从 http://tidy.sourceforge.net/docs/quickref.html 下载的 config.txt ,把 char-encoding: latin1 改成 char-encoding: raw 就可解决乱码问题

// sample config file for HTML tidy

indent: auto

indent-spaces: 2

wrap: 72

markup: yes

output-xml: no

input-xml: no

show-warnings: yes

numeric-entities: yes

quote-marks: yes

quote-nbsp: yes

quote-ampersand: no

break-before-br: no

uppercase-tags: no

uppercase-attributes: no

char-encoding: latin1

new-inline-tags: cfif, cfelse, math, mroot,

   mrow, mi, mn, mo, msqrt, mfrac, msubsup, munderover,

   munder, mover, mmultiscripts, msup, msub, mtext,

   mprescripts, mtable, mtr, mtd, mth

new-blocklevel-tags: cfoutput, cfquery

new-empty-tags: cfelse

 

 

  版权所有: (xiaodaoxiaodao) 蓝小刀    xiaodaoxiaodao@gmail.com