版权所有:
(xiaodaoxiaodao)
蓝小刀
xiaodaoxiaodao@gmail.com
http://www.blogjava.net/xiaodaoxiaodao/articles/103444.html
转载请注明来源
/
作者
tidy
试用
tidy
是一个把
HTML
标准化的工具,可以在
http://tidy.sourceforge.net/
上下载
下了个
DOS
版本用了下,
在命令行输入
tidy -f errs.txt -m hy.htm
(
-f
代表日志文件是
errs.txt
,如果没有则创建,
-m hy.htm
表示要进行标准化的文件,转换后会覆盖掉原来的
hy.htm
),
转换后打开发现
hy.htm
中的汉字变成乱码了,
google search
了一下,呵呵,发现原来可以加个
config
文件配置编码类型,把
config.txt
放在相应的目录下,然后再次运行
tidy -f errs.txt -config config.txt -m hy.htm
,用
IE
打开后中文正确显示
(实际中遇到一个问题
-config config.txt
只能放在
-m hy.htm
之前
,否则转换后仍然是乱码
)
下面是从
http://tidy.sourceforge.net/docs/quickref.html
下载的
config.txt
,把
char-encoding: latin1
改成
char-encoding:
raw
就可解决乱码问题
// sample config file for HTML tidy
indent: auto
indent-spaces: 2
wrap: 72
markup: yes
output-xml: no
input-xml: no
show-warnings: yes
numeric-entities: yes
quote-marks: yes
quote-nbsp: yes
quote-ampersand: no
break-before-br: no
uppercase-tags: no
uppercase-attributes: no
char-encoding: latin1
new-inline-tags: cfif, cfelse, math, mroot,
mrow, mi, mn, mo, msqrt, mfrac, msubsup, munderover,
munder, mover, mmultiscripts, msup, msub, mtext,
mprescripts, mtable, mtr, mtd, mth
new-blocklevel-tags: cfoutput, cfquery
new-empty-tags: cfelse
|
版权所有:
(xiaodaoxiaodao)
蓝小刀
xiaodaoxiaodao@gmail.com