js和C#中的字符串编码解码

最近朋友问我关于编码和加密问题，下午有点时间就查了一些资料，总结一下与大家分享：

在用javascript对URL字符串进行编码中，虽然escape()、encodeURI()、encodeURIComponent()三种方法都能对一些影响URL完整性的特殊字符进行过滤。但后两者是将字符串转换为UTF-8的方式来传输，解决了页面编码不一至导致的乱码问题。例如：发送页与接受页的编码格式(Charset)不一致（假设发送页面是GB2312而接收页面编码是UTF-8），使用escape()转换传输中文字串就会出现乱码问题。
以下是JS下对URL进行编/解码的各种方法：
1、escape 方法：返回一个可在所有计算机上读取的编码 String 对象。
function escape(charString : String) : String
不会被此方法编码的字符： @ * / +
说明：escape 方法返回一个包含 charstring 内容的字符串值（Unicode 格式）。所有空格、标点、
重音符号以及任何其他非 ASCII 字符都用 %xx 编码替换，其中 xx 等于表示该字符的十六进制数。
例如，空格返回为“%20”。（字符值大于 255 的字符以 %uxxxx 格式存储。）
注意：escape 方法不能用来对“统一资源标识符”(URI) 进行编码。对其编码应使用 encodeURI 和encodeURIComponent 方法。
2、encodeURI 方法：返回编码为有效的统一资源标识符 (URI) 的字符串。
function encodeURI(URIString : String) : String
不会被此方法编码的字符：! @ # $ & * ( ) = : / ; ? + '
说明：encodeURI 方法返回一个已编码的 URI。如果将编码结果传递给 decodeURI，则将返回初始的字符串。encodeURI 不对下列字符进行编码：“:”、“/”、“;”和“?”。请使用
encodeURIComponent 对这些字符进行编码。
3、encodeURIComponent方法：返回编码为统一资源标识符 (URI) 的有效组件的字符串。
function encodeURIComponent(encodedURIString : String) : String
不会被此方法编码的字符：! * ( ) '
说明：encodeURIComponent 方法返回一个已编码的 URI。如果将编码结果传递给decodeURIComponent，则将返回初始的字符串。因为 encodeURIComponent 方法将对所有字符编码，
请注意，如果该字符串代表一个路径，例如 /folder1/folder2/default.html，则其中的斜杠也将被编码，这样，当该字符串作为请求发送到 Web 服务器时它将是无效的。如果字符串中包含多个 URI 组件，请使用 encodeURI 方法进行编码。
4、unescape方法：从用 escape 方法编码的 String 对象中返回已解码的字符串。
function unescape(charString : String) : String
说明：unescape 方法返回一个包含 charstring 内容的字符串值。所有以 %xx 十六进制形式编码的
字符都用 ASCII 字符集当中等效的字符代替。（以 %uxxxx 格式（Unicode 字符）编码的字符用十六
进制编码 xxxx 的 Unicode 字符代替。）
注意：unescape 方法不应用于解码“统一资源标识符”(URI)。请改用 decodeURI 和 decodeURIComponent 方法。
5、decodeURI 方法：返回一个已编码的统一资源标识符 (URI) 的非编码形式。
function decodeURI(URIstring : String) : String
decodeURIComponent 方法：返回统一资源标识符 (URI) 的一个已编码组件的非编码形式。
function decodeURIComponent(encodedURIString : String) : String
BTW：C#中对URL编码的方法。。。
编码：Server.UrlEncode(string)
解码：Server.UrlDecode(string) 前面三种客户端编码都可以用这个方法在后台解码。

关于HttpUtility.UrlEncode，HttpUtility.UrlDecode，Server.UrlEncode，Server.UrlDecode

HttpUtility.UrlEncode 方法:

对 URL 字符串进行编码，以便实现从 Web 服务器到客户端的可靠的 HTTP 传输。

重载列表
将字节数组转换为已编码的 URL 字符串，以便实现从 Web 服务器到客户端的可靠的 HTTP 传输。
[C#] public static string UrlEncode(byte[]);

对 URL 字符串进行编码，以便实现从 Web 服务器到客户端的可靠的 HTTP 传输。
[C#] public static string UrlEncode(string);

使用指定的编码对象对 URL 字符串进行编码，以便实现从 Web 服务器到客户端的可靠 HTTP 传输。
[C#] public static string UrlEncode(string, Encoding);

从数组中的指定位置开始一直到指定的字节数为止，将字节数组转换为 URL 编码的字符串，以便实现从 Web 服务器到客户端的可靠的 HTTP 传输。
[C#] public static string UrlEncode(byte[], int, int);

HttpUtility.UrlDecode 方法：

将已经为在 URL 中传输而编码的字符串转换为解码的字符串。

重载列表
将已经为在 URL 中传输而编码的字符串转换为解码的字符串。
[C#] public static string UrlDecode(string);

使用指定的解码对象将 URL 编码的字节数组转换为已解码的字符串。
[C#] public static string UrlDecode(byte[], Encoding);

使用指定的编码对象将 URL 编码的字符串转换为已解码的字符串。
[C#] public static string UrlDecode(string, Encoding);

使用指定的编码对象，从数组中的指定位置开始到指定的字节数为止，将 URL 编码的字节数组转换为已解码的字符串。
[C#] public static string UrlDecode(byte[], int, int, Encoding);

Server是HttpServerUtility类的实例，是System.Web.UI.Page的属性。
HttpServerUtility.UrlEncode 方法：
编码字符串，以便通过 URL 从 Web 服务器到客户端进行可靠的 HTTP 传输。

重载列表
对字符串进行 URL 编码，并返回已编码的字符串。
[C#] public string UrlEncode(string);

URL 对字符串进行编码，并将结果输出发送到 TextWriter 输出流。
[C#] public void UrlEncode(string, TextWriter);
例：
String TestString = "This is a <Test String>.";
StringWriter writer = new StringWriter();
Server.UrlEncode(TestString, writer);
String EncodedString = writer.ToString();

HttpServerUtility.UrlDecode 方法：
对字符串进行解码，该字符串为了进行 HTTP 传输而进行编码并在 URL 中发送到服务器。

重载列表
对字符串进行 URL 解码并返回已解码的字符串。
[C#] public string UrlDecode(string);

对在 URL 中接收的 HTML 字符串进行解码，并将结果输出发送到 TextWriter 输出流。
[C#] public void UrlDecode(string, TextWriter);

需要注意的几点：
1、HttpUtility.UrlEncode，HttpUtility.UrlDecode是静态方法，而Server.UrlEncode，Server.UrlDecode是实例方法。
2、Server是HttpServerUtility类的实例，是System.Web.UI.Page的属性。
3、用HttpUtility.UrlEncode编码后的字符串和用Server.UrlEncode进行编码后的字符串对象不一样:
例如：
string url="http://search.99read.com/index.aspx?book_search=all&main_str=奥迷尔";
Response.Write(HttpUtility.UrlEncode(url));
Response.Write("<br>");
Response.Write(Server.UrlEncode(url));

输出结果是：
http%3a%2f%2fsearch.99read.com%2findex.aspx%3fbook_search%3dall%26main_str%3d%e5%a5%a5%e8%bf%b7%e5%b0%94
http%3a%2f%2fsearch.99read.com%2findex.aspx%3fbook_search%3dall%26main_str%3d%b0%c2%c3%d4%b6%fb

原因：Server.UrlEncode的编码方式是按照本地程序设置的编码方式进行编码的，而HttpUtility.UrlEncode是默认的按照.net的utf-8格式进行编码的。

如果改一下程序：
string url1="http://search.99read.com/index.aspx?book_search=all&main_str=奥迷尔";
Response.Write(HttpUtility.UrlEncode(url1,System.Text.Encoding.GetEncoding("GB2312")));
Response.Write("<br>");
Response.Write(Server.UrlEncode(url1));

输出的结果是：
http%3a%2f%2fsearch.99read.com%2findex.aspx%3fbook_search%3dall%26main_str%3d%b0%c2%c3%d4%b6%fb
http%3a%2f%2fsearch.99read.com%2findex.aspx%3fbook_search%3dall%26main_str%3d%b0%c2%c3%d4%b6%fb

4、有时候可能别的系统传递过来的url是用别的编码方式编码的。
介绍自己编写的一个方法，可以获取指定编码格式的QueryString。

public string GetNonNullQueryString(string key,Encoding encoding)
{
   //引用System.Collections.Specialized和System.Text命名空间
   string stringValue;
   System.Collections.Specialized.NameValueCollection encodingQueryString;
   //该方法是在2.0中新增的
   encodingQueryString = HttpUtility.ParseQueryString(Request.Url.Query,encoding);
   //'里面的key就是你提交的参数的Key
   return encodingQueryString[key] != null ? encodingQueryString[key].Trim() : "";
}

调用：
string url = GetNonNullQueryString("url",Encoding.UTF8).Trim();

在对URL进行编码时，该用哪一个？这两都使用上有什么区别吗？
测试：
string file="文件上（传）篇.doc";
string Server_UrlEncode=Server.UrlEncode(file);
string Server_UrlDecode=Server.UrlDecode(Server_UrlEncode);
string HttpUtility_UrlEncode=System.Web.HttpUtility.UrlEncode(file);
string HttpUtility_UrlDecode=System.Web.HttpUtility.UrlDecode(HttpUtility_UrlEncode);
Response.Write("原数据："+file);
SFun.WriteLine("Server.UrlEncode："+Server_UrlEncode);
SFun.WriteLine("Server.UrlDecode："+Server_UrlDecode);
SFun.WriteLine("HttpUtility.UrlEncode："+HttpUtility_UrlEncode);
SFun.WriteLine("HttpUtility.UrlDecode："+HttpUtility_UrlDecode);
输出：
原数据：文件上（传）篇.doc
Server.UrlEncode：%ce%c4%bc%fe%c9%cf%a3%a8%b4%ab%a3%a9%c6%aa.doc
Server.UrlDecode：文件上（传）篇.doc
HttpUtility.UrlEncode：%e6%96%87%e4%bb%b6%e4%b8%8a%ef%bc%88%e4%bc%a0%ef%bc%89%e7%af%87.doc
HttpUtility.UrlDecode：文件上（传）篇.doc
区别在于：HttpUtility.UrlEncode()默认是以UTF8对URL进行编码，而Server.UrlEncode()则以默认的编码对URL进行编码。
在用 ASP.Net 开发页面的时候, 我们常常通过 System.Web.HttpUtility.UrlEncode 和 UrlDecode 在页面间通过 URL 传递参数. 成对的使用 Encode 和 Decode 是没有问题的.
但是, 我们在编写文件下载的页面的时候, 常常用如下方法来指定下载的文件的名称:
Response.AddHeader("Content-Disposition","attachment; filename="
+ HttpUtility.UrlEncode(fileName, Encoding.UTF8));
之所以转换成 UTF8 是为了支持中文文件名.
这时候问题就来了, 因为 HttpUtility.UrlEncode 在 Encode 的时候, 将空格转换成加号('+'), 在 Decode 的时候将加号转为空格, 但是浏览器是不能理解加号为空格的, 所以如果文件名包含了空格, 在浏览器下载得到的文件, 空格就变成了加号.
一个解决办法是, 在 HttpUtility 的 UrlEncode 之后, 将 "+" 替换成 "%20"( 如果原来是 "+" 则被转换成 "%2b" ) , 如:
fileName = HttpUtility.UrlEncode(fileName, Encoding.UTF8);
fileName = fileName.Replace("+", "%20");
不明白微软为什么要把空格转换成加号而不是"%20". 记得 JDK 的 UrlEncoder 是将空格转换成 "%20"的.
经检查, 在 .Net 2.0 也是这样.
有时候默认aspx是以utf-8为编码的，你的程序默认编码（<globalization requestEncoding="gb2312" responseEncoding="gb2312"/>），问题出现了，以前没有问题的HttpUtility.UrlDecode在Page.Request回的值是乱码这就是上面说的HttpUtility.UrlDecode默认以UTF8对URL进行编码，这种情况下面只需将HttpUtility.UrlDecode改成Server.UrlEncode即可。

二.js加密解密

在做网页时（其实是网页木马呵呵），最让人烦恼的是自己辛辛苦苦写出来的客户端IE运行的javascript代码常常被别人轻易的拷贝，实在让自己的心里有点不是滋味，要知道自己写点东西也挺累的

^*^

　　　　以加密下面的javascript代码为例：

<SCRIPT LANGUAGE="javascript">
alert("《我爱一起》");
</SCRIPT>

　　一：最简单的加密解密

　　大家对于javascript函数escape()和unescape()想必是比较了解啦（很多网页加密在用它们），分别是编码和解码字符串，比如例子代码用escape()函数加密后变为如下格式：

alert%28%22%u9ED1%u5BA2%u9632%u7EBF%22%29%3B

　　如何？还看的懂吗？当然其中的ASCII字符"alert"并没有被加密，如果愿意我们可以写点javascript代码重新把它加密如下：

%61%6C%65%72%74%28%22%u9ED1%u5BA2%u9632%u7EBF%22%29%3B

　　呵呵！如何？这次是完全都加密了！

　　当然，这样加密后的代码是不能直接运行的，幸好还有eval(codeString)可用，这个函数的作用就是检查javascript代码并执行，必选项 codeString 参数是包含有效 javascript 代码的字符串值，加上上面的解码unescape()，加密后的结果如下：

<SCRIPT LANGUAGE="javascript">
var code=unescape("%61%6C%65%72%74%28%22%u9ED1%u5BA2%u9632%u7EBF%22%29%3B");
eval(code)
</SCRIPT>

　　是不是很简单？不要高兴，解密也就同样的简单，解密代码都摆给别人啦（unescape()）！呵呵

　　二：转义字符""的妙用

　　大家可能对转义字符""不太熟悉，但对于javascript提供了一些特殊字符如：n （换行）、 r （回车）、' （单引号）等应该是有所了解的吧？其实""后面还可以跟八进制或十六进制的数字，如字符"a"则可以表示为："141"或"x61"（注意是小写字符"x"），至于双字节字符如汉字"黑"则仅能用十六进制表示为"u9ED1"（注意是小写字符"u"），其中字符"u"表示是双字节字符，根据这个原理例子代码则可以表示为：

　　八进制转义字符串如下:

<SCRIPT LANGUAGE="javascript">
eval("1411541451621645042u9ED1u5BA2u9632u7EBF425173")
</SCRIPT>

　　十六进制转义字符串如下:

<SCRIPT LANGUAGE="javascript">
eval("x61x6Cx65x72x74x28x22u9ED1u5BA2u9632u7EBFx22x29x3B")
</SCRIPT>

　　这次没有了解码函数，因为javascript执行时会自行转换，同样解码也是很简单如下：

<SCRIPT LANGUAGE="javascript">
alert("x61x6Cx65x72x74x28x22u9ED1u5BA2u9632u7EBFx22x29x3B")
</SCRIPT>

　　就会弹出对话框告诉你解密后的结果！

　　三：使用Microsoft出品的脚本编码器Script Encoder来进行编码

　　工具的使用就不多介绍啦！我是直接使用javascript调用控件Scripting.Encoder完成的编码！代码如下：

<SCRIPT LANGUAGE="javascript">
var Senc=new ActiveXObject("Scripting.Encoder");
var code='<SCRIPT LANGUAGE="javascript">rnalert("《我爱一起》");rn</SCRIPT>';
var Encode=Senc.EncodeScriptFile(".htm",code,0,"");
alert(Encode);
</SCRIPT>

　　编码后的结果如下：

<SCRIPT LANGUAGE="JScript.Encode">#@~^FgAAAA==@#@&ls DD`J黑客防线r#p@#@&FgMAAA==^#~@</SCRIPT>

　　够难看懂得吧？但相应的解密工具早已出来，而且连解密网页都有！因为其解密网页代码过多，我就不多说拉！给大家介绍一下我独创的解密代码，如下：

<SCRIPT LANGUAGE="JScript.Encode">
function decode()
alert(decode.toString());
</SCRIPT>

　　咋样？够简单吧？它是原理是：编码后的代码运行前IE会先对其进行解码，如果我们先把加密的代码放入一个自定义函数如上面的decode()中，然后对自定义函数decode调用toString()方法，得到的将是解码后的代码！

　　如果你觉得这样编码得到的代码LANGUAGE属性是JScript.Encode，很容易让人识破，那么还有一个几乎不为人知的window对象的方法execScript()，其原形为：

　　window.execScript( sExpression, sLanguage )

　　参数：

sExpression:　必选项。字符串(String)。要被执行的代码。

sLanguage　:　必选项。字符串(String)。指定执行的代码的语言。默认值为 Microsoft JScript

使用时，前面的"window"可以省略不写！

　　利用它我们可以很好的运行编码后的javascript代码，如下：

<SCRIPT LANGUAGE="javascript">
execScript("#@~^FgAAAA==@#@&ls DD`J我爱一起r#p@#@&FgMAAA==^#~@","JScript.Encode")
</SCRIPT>

　　你可以利用方法二对其中的""号内的字符串再进行编码，使得"JScript.Encode"以及编码特征码"#@~^"不出现，效果会更好！

　　四：任意添加NUL空字符（十六进制00H）

　　一次偶然的实验，使我发现在HTML网页中任意位置添加任意个数的"空字符"，IE照样会正常显示其中的内容，并正常执行其中的javascript 代码，而添加的"空字符"我们在用一般的编辑器查看时，会显示形如空格或黑块，使得原码很难看懂，如用记事本查看则"空字符"会变成"空格"，利用这个原理加密结果如下：（其中显示的"空格"代表"空字符"）

<S C RI P T L ANG U A G E =" J a v a S c r i p t ">
a l er t (" 我爱一起") ;
< / SC R I P T>

　　如何？是不是显得乱七八糟的？如果不知道方法的人很难想到要去掉里面的"空字符"（00H）的！

　　五：无用内容混乱以及换行空格TAB大法

　　在javascript代码中我们可以加入大量的无用字符串或数字，以及无用代码和注释内容等等，使真正的有用代码埋没在其中，并把有用的代码中能加入换行、空格、TAB的地方加入大量换行、空格、TAB，并可以把正常的字符串用""来进行换行，这样就会使得代码难以看懂！如我加密后的形式如下：

<SCRIPT LANGUAGE="javascript">
"xajgxsadffgds";1234567890
625623216;var $=0;alert//@$%%&*()(&(^%^
//cctv function//
(//hhsaasajx xc
/*
asjgdsgu*/
"我爱一起"//ashjgfgf
/*
@#%$^&%$96667r45fggbhytjty
*/
//window
)
;"#@$#%@#432hu";212351436
</SCRIPT>

　　至少如果我看到这样的代码是不会有心思去分析它的，你哪？

　　六：自写解密函数法

　　这个方法和一、二差不多，只不过是自己写个函数对代码进行解密，很多VBS病毒使用这种方法对自身进行加密，来防止特征码扫描！下面是我写的一个简单的加密解密函数，加密代码如下（详细参照文件"加密.htm"）：

<SCRIPT LANGUAGE="javascript">
function compile(code)
{
var c=String.fromCharCode(code.charCodeAt(0)+code.length);
for(var i=1;i<code.length;i++)
alert(escape(c));
}
compile('alert("《我爱一起》");')
</SCRIPT>

　　运行得到加密结果为：

o%CD%D1%D7%E6%9CJ%u9EF3%uFA73%uF1D4%u14F1%u7EE1Kd

　　相应的加密后解密的代码如下：

<SCRIPT LANGUAGE="javascript">
function uncompile(code)
{
code=unescape(code);
var c=String.fromCharCode(code.charCodeAt(0)-code.length);
for(var i=1;i<code.length;i++)
return c;
}
eval(uncompile("o%CD%D1%D7%E6%9CJ%u9EF3%uFA73%uF1D4%u14F1%u7EE1Kd"));
</SCRIPT>

　　七：错误的利用

　　利用try{}catch(e){}结构对代码进行测试解密，虽然这个想法很好（呵呵，夸夸自己），因为实用性不大，我仅给个例子

<SCRIPT LANGUAGE="javascript">
var a='alert("《我爱一起》");';
var c="";
for(var i=0;i<a.length;i++)
alert(c);
//上面的是加密代码，当然如果真正使用这个方法时，不会把加密写上的
//现在变量c就是加密后的代码
//下面的函数t()先假设初始密码为０，解密执行，
//遇到错误则把密码加１，然后接着解密执行，直到正确运行
var d=c; //保存加密后的代码
var b=0; //假定初始密码为0
t();
function t()catch(e){
c="";
for(var i=0;i<d.length;i++)
b+=1;
t();
//setTimeout("t()",0);
}
}
</SCRIPT>

三。实现Server.UrlEncode和Server.UrlDecode的js代码

var EncodeURI = function(unzipStr,isCusEncode){
    if(isCusEncode){
        var zipArray = new Array();
        var zipstr = "";
        var lens = new Array();
        for(var i=0;i<unzipStr.length;i++){
         var ac = unzipStr.charCodeAt(i);
         zipstr += ac;
         lens = lens.concat(ac.toString().length);
        }
        zipArray = zipArray.concat(zipstr);
        zipArray = zipArray.concat(lens.join("O"));
        return zipArray.join("N");
    }else{
        //return encodeURI(unzipStr);
        var zipstr="";
        var strSpecial="!\"#$%&'()*+,/:;<=>?[]^`{|}~%";
        var tt= "";

        for(var i=0;i<unzipStr.length;i++){
            var chr = unzipStr.charAt(i);
            var c=StringToAscii(chr);
            tt += chr+":"+c+"n";
            if(parseInt("0x"+c) > 0x7f){
                 zipstr+=encodeURI(unzipStr.substr(i,1));
            }else{
                 if(chr==" ")
                    zipstr+="+";
                 else if(strSpecial.indexOf(chr)!=-1)
                    zipstr+="%"+c.toString(16);
                 else
                    zipstr+=chr;
                }
            }
        return zipstr;
    }
}

var DecodeURI = function(zipStr,isCusEncode){
    if(isCusEncode){
        var zipArray = zipStr.split("N");
        var zipSrcStr = zipArray[0];
        var zipLens;
        if(zipArray[1]){
            zipLens = zipArray[1].split("O");
        }else{
            zipLens.length = 0;
        }

        var uzipStr = "";

        for(var j=0;j<zipLens.length;j++){
            var charLen = parseInt(zipLens[j]);
            uzipStr+= String.fromCharCode(zipSrcStr.substr(0,charLen));
            zipSrcStr = zipSrcStr.slice(charLen,zipSrcStr.length);
        }
        return uzipStr;
    }else{
        //return decodeURI(zipStr);
        var uzipStr="";

        for(var i=0;i<zipStr.length;i++){
            var chr = zipStr.charAt(i);
            if(chr == "+"){
                 uzipStr+=" ";
            }else if(chr=="%"){
                 var asc = zipStr.substring(i+1,i+3);
                 if(parseInt("0x"+asc)>0x7f){
                     uzipStr+=decodeURI("%"+asc.toString()+zipStr.substring(i+3,i+9).toString()); ;
                     i+=8;
                 }else{
                     uzipStr+=AsciiToString(parseInt("0x"+asc));
                     i+=2;
                 }
            }else{
                 uzipStr+= chr;
            }
        }
        return uzipStr;
    }
}

var StringToAscii = function(str){
    return str.charCodeAt(0).toString(16);
}

var AsciiToString = function(asccode){
    return String.fromCharCode(asccode);
}

posted on 2012-05-18 20:20 ** 阅读(6686) 评论(1) 编辑收藏

# re: js和C#中的字符串编码解码 2013-11-25 14:48 Mr'Liu

受教回复更多评论

新用户注册刷新评论列表


只有注册用户登录后才能发表评论。




网站导航: 博客园 IT新闻 Chat2DB C++博客博问管理

# re: js和C#中的字符串编码解码 2013-11-25 14:48 Mr'Liu

Hopes

js和C#中的字符串编码解码

评论

导航

统计

公告

常用链接

留言簿(2)

随笔档案

文章分类

文章档案

新闻档案

相册

收藏夹

C#学习

友情链接

搜索

最新评论

阅读排行榜

评论排行榜