使用 Request.QueryString 接受参数时，跟编码有关的一些问题

我们先来看以下几个请求，看a.aspx 页面用Request.QueryString接受到的是啥信息？

	页面URL	Request.QueryString["info"]接受到的值
案例一	a.aspx?info=%25	%
案例二	a.aspx?info=%bc%bc%ca%f5	????

情况分析：

案例一

a.aspx?info=%25 为何 Request.QueryString["info"]接受到的值是 % ，而不是 %25，是因为Request.QueryString 替我们在接受到值后，做了一次URL解码。 HttpUtility.UrlDecode("%25") 的计算结果就是 %

上面的这个案例一虽然看起来很简单。但是我们在一些特殊场景时候，就会因为这个而极度郁闷。

比如以下几种情况：

你有一个自己的加密算法，而这个加密算法，某些情况下会计算出带百分号的结果，而这个结果你是要通过URL参数的方式传递给其它页面的。
这时候你就苦恼的发现，某些时候某个功能就不能用。

如果解决案例一碰到的情况呢？

解决方案一：

把需要传递的参数传递前作一次 HttpUtility.UrlEncode ，
记得是按照 UTF-8 的编码的 UrlEncode 。这样如果我们希望客户端接受到的是 %25 就应该传递的是 %2525 。

切记，不可在接受方每次接受后，自作聪明的都做一次 UrlEncode 。而是在发送方做 UrlEncode 。
如果接受方接受后作 UrlEncode 的话，就会出现下面情况：
发送方发送 a.aspx?info=%25 ，这时候如果接受方接受后作 UrlEncode 的话，一切正确
发送方发送 a.aspx?info=% ，这时候如果接受方接受后作 UrlEncode 的话，则就乱了。

另：这套方案中切记， UrlEncode 和 UrlDecode 的次数应该一一对应。不能多一次，也不能少一次。
有人就会说，这还会出现次数不对应么？比如下面情况，一个不留意就很可能出现次数不对应。而出现不是你所期望的情况。
比如我们有这样类似的功能：

a.aspx 页面中，根据传入的 from 参数，自动跳转到 from 参数（用Request.QueryString["from"]来接受这个参数）设置的页面。
b.aspx 页面也是同样的逻辑，根据传入的 from 参数（用Request.QueryString["from"]来接受这个参数），自动跳转到指定的页面。
c.aspx 页面也是同样的逻辑，根据传入的 from 参数（用Request.QueryString["from"]来接受这个参数），自动跳转到指定的页面。

这样我们就可能书写下面的链接地址：
a.aspx?from=b.aspx
a.aspx?from=b.aspx?from=c.aspx
a.aspx?from=b.aspx?from=c.aspx?from=http://blog.joycode.com/ghj/

下面再复杂一点，我给下面几个链接，其中都有 a 这个参数，请告诉我 a 这个参数是被那个页面接受到了？
说明： HttpUtility.UrlEncode("&") == "%26" HttpUtility.UrlEncode("%") == "%25"

地址	a 参数会被那个页面接受到
a.aspx?from=b.aspx?from=c.aspx&a=1	a 参数被 a.aspx 页面接受到了
a.aspx?from=b.aspx?from=c.aspx%26a=1	a 参数被 b.aspx 页面接受到了
a.aspx?from=b.aspx?from=c.aspx%2526a=1	a 参数被 c.aspx 页面接受到了

如果想不明白，就想想下面这句话
每一次用 Request.QueryString 获取参数时候，就作了一次 HttpUtility.UrlDecode。

解决方案二：

不用 Request.QueryString ，而是自己实现一个获取查询参数的方法。细节我在案例二讲完后再告诉大家，因为这个解决方案也处理了案例二的一些情况。

案例二

a.aspx?info=%bc%bc%ca%f5 传给我们的信息其实是使用 GB2312 编码后的“技术” 这两个汉字。
不信，你可以用下面表达式计算的结果就是 %bc%bc%ca%f5
HttpUtility.UrlEncode("技术", System.Text.Encoding.GetEncoding("GB2312"))

ASP.net 系统内部，在处理 Request.QueryString 等情况时候，都是使用的 UTF-8 的编码，我们如果不存在多系统并存的问题时候，这个问题一点都不存在。
但是，当需要跟其它系统交互式后，问题就可能会出现。
如果你不了解案例二这里情况时，你就会被这个问题苦恼死。

比如下面这两个地址提到的问题：

ASP.net中的Server.UrlEncode函数和ASP中的Server.URLEncode函数返回的值竟然不一样
http://blog.joycode.com/ghj/archive/2003/10/20/2992.aspx

PHP与aspx之间中文通过URL如何传递？
http://topic.csdn.net/u/20071018/19/8a4066af-a08c-4214-91e9-ed4caf977e07.html

案例二的解决方案
使用带编码的 HttpUtility.ParseQueryString 函数

就是采用类似下面代码的方式，来获得指定格式编码的查询文本参数。

System.Collections.Specialized.NameValueCollection nv =
System.Web.HttpUtility.ParseQueryString(Request.Url.Query, System.Text.Encoding.GetEncoding("GB2312"));
Response.Write(nv["Tag"]);

要说我为啥知道上面几种解决方案，是因为我用 Reflector 看了 Request.QueryString 的实现代码。在查看代码时候，我们会看到这样一个 internal 方法：
System.Web.HttpValueCollection 类的内部方法：
internal void FillFromString(string s, bool urlencoded, Encoding encoding)

这个内部方法实现了，按需解密查询参数的功能，但是遗憾的是，在QueryString 的处理函数中，强制指定了解析 QueryString 时，必须作一次 HttpUtility.UrlDecode。参看如下代码：

public static NameValueCollection ParseQueryString(string query, Encoding encoding)
{
...
return new HttpValueCollection(query, false, true, encoding);
}

如果我们不想采用案例一的解决方案一，我们就需要自己写一个解析查询信息的代码。我们完全可以照抄 System.Web.HttpValueCollection 类的 internal void FillFromString(string s, bool urlencoded, Encoding encoding) 方法来改写。但郁闷的是：如果你用 Reflector 察看这个函数的实现时候，Reflector 出来的代码是错误的。正确的方法如下：是在施凡帮助下完成的。

自己实现从 URL 查询文本 Query 中解析出我们自己需要的文本的方法

/// <summary>
/// 根据 URL 中的查询文本 Query 解析成一个 NameValueCollection
/// 在装配脑袋帮助下郭红俊改编自 System.Web.HttpValueCollection 类的内部方法：
/// internal void FillFromString(string s, bool urlencoded, Encoding encoding)
/// </summary>
/// <param name="query">需要解析的查询文本</param>
/// <param name="urlencoded">解析文本时候是否需要URL解码</param>
/// <param name="encoding">解析文本时候，按照那种URL编码进行解码</param>
/// <returns></returns>
public static NameValueCollection FillFromString(string query, bool urlencoded, Encoding encoding)
{
    NameValueCollection queryString = new NameValueCollection();
    if (string.IsNullOrEmpty(query))
    {
        return queryString;
    }

    // 确保查询文本首字符不是 ?
    if (query.StartsWith("?"))
    {
        query = query.Substring(1, query.Length - 1);
    }

    int num1 = (query != null) ? query.Length : 0;
    // 遍历每个字符
    for (int num2 = 0; num2 < num1; num2++)
    {
        int num3 = num2;
        int num4 = -1;
        while (num2 < num1)
        {
            switch (query[num2])
            {
                case '=':
                    if (num4 < 0)
                    {
                        num4 = num2;
                    }
                    break;
                case '&':
                    goto BREAKWHILE;
            }
            num2++;
        }

BREAKWHILE:

        string name = null;
        string val = null;
        if (num4 >= 0)
        {
            name = query.Substring(num3, num4 - num3);
            val = query.Substring(num4 + 1, (num2 - num4) - 1);
        }
        else
        {
            val = query.Substring(num3, num2 - num3);
        }
        if (urlencoded)
        {

            queryString.Add(HttpUtility.UrlDecode(name, encoding), HttpUtility.UrlDecode(val, encoding));
        }
        else
        {
            queryString.Add(name, val);
        }
        if ((num2 == (num1 - 1)) && (query[num2] == '&'))
        {
            queryString.Add(null, string.Empty);
        }
    }

return queryString;

}

用上面的代码，我们就可以按需解析自己需要的查询参数，而不是受限的使用Request.QueryString 。

小结

Request.QueryString 替我们件事情：每次接受到参数后，都做 UrlEncode ，并且是按照 UTF-8编码做的 UrlEncode 。这在大多数情况下没有任何问题，但是一些情况下，会给我们带来麻烦，本文就是分析这些可能给我们带来麻烦的场景，以及解决方法。

参考资料：

使用 Reflector ; 查看代码时候，碰到的一个Reflector 的bug
http://blog.joycode.com/ghj/archive/2006/12/06/88646.aspx

解密不同编码的的参数。
http://blog.joycode.com/ghj/archive/2006/04/19/74894.aspx

posted on 2009-10-16 14:17 becket_zheng 阅读(282) 评论(0) 编辑收藏所属分类: web前端开发

常用链接

留言簿

随笔分类(138)

随笔档案(134)

文章分类(77)

文章档案(109)

email

常去的Blog

搜索

最新评论

阅读排行榜

评论排行榜


只有注册用户登录后才能发表评论。




网站导航: 博客园 IT新闻 Chat2DB C++博客博问管理
相关文章: JQuery插件汇总 js-window对象的方法和属性资料 RTree Dtree+Jquery动态生成树节点 JQuery安装与智能感应支持jQuery版本vsdoc.js的智能提示的VS2008 SP1补丁下载在JS文件使用Google Analytics谷歌分析的统计代码 JavaScript - 设计模式（简单工厂和工厂模式） 5个有趣的IE浏览器地址栏JavaScript代码 asp.net “从客户端检测到有潜在危险的Request.Form值” 处理办法（转）