疯狂

STANDING ON THE SHOULDERS OF GIANTS

posts - 481, comments - 486, trackbacks - 0, articles - 1

在java中使用TreeMap进行中文排序(转)

Posted on 2011-05-20 11:36 疯狂阅读(2194) 评论(0) 编辑收藏所属分类: java

最近工作遇到需要按一个model中不同的列进行排序的问题，查了一下JDK API文档，发现，java中可以排序的工具类和接口共有五个SortedMap 、SortedSet、TreeMap 、TreeSet和Collections，由于我要排序的是一系列model，所以，最后使用了TreeMap对象，而且TreeMap到最后的处理比较自由，可以直接返回TreeMap对象，也可以返回model的一个Collection对象。其它几个类的用法其实都是大同小异，如果java基础较好，看一下API文档很容易明白，只是Collection中需要显式调用sort()方法而已。

写理论的东西或者深入的东西就会太多了，而且让人会看得比较烦，这里讲求实用，就不多说了，直接入正体，基本的排序代码如下：
package ChineseSort;

import java.util.Collection;

import java.util.Iterator;

import java.util.SortedMap;

import java.util.TreeMap;

public class TestSort {

public static void main(String[] args) {

// TODO Auto-generated method stub

TreeMap map = new TreeMap();

for(int i=0; i<10; i++) {

String s = ""+(int)(Math.random()*1000);

map.put(s,s);

}

map.put("abcd","abcd");

map.put("Abc", "Abc");

map.put("bbb","bbb");

map.put("BBBB", "BBBB");

map.put("北京","北京");

map.put("中国","中国");

map.put("上海", "上海");

map.put("厦门", "厦门");

map.put("香港", "香港");

map.put("碑海", "碑海");

Collection col = map.values();

Iterator it = col.iterator();

while(it.hasNext()) {

System.out.println(it.next());

}

代码就不多作解释了，一看就明白，开始放进去10个整数随机数，然后是英文，然后是中文。运行结果如下：

132

205

287

295

399

410

411

464

670

Abc

BBBB

abcd

bbb

上海

中国

北京

厦门

碑海

香港

注意，这里的数字排序正常，而英文排序是区分大小写的，这个也是正常的，因为ASCII码中小写字母比大写字母靠后，中文排序则明显的不正确，碑和北明显应该在一起的，而且应该在最前面。这个主要是java中使用中文编码GB2312或者JBK时，char型转换成int型得过程出现了比较大的偏差，很多文章介绍过了，大家可以去网上找一下，这里不多说了，直接寻找解决方案。

Java中之所以出现偏差，主要是compare方法的问题，所以这里自己实现Comparator接口，而国际化的问题，使用Collator类来解决。这里先解决中文问题,代码如下：

package ChineseSort;

import java.text.CollationKey;

import java.text.Collator;

import java.util.Comparator;

public class CollatorComparator implements Comparator {

Collator collator = Collator.getInstance();

public int compare(Object element1, Object element2) {

CollationKey key1 = collator.getCollationKey(element1.toString());

CollationKey key2 = collator.getCollationKey(element2.toString());

return key1.compareTo(key2);

}

同时修改我们前面完成的TestSort类，找到TreeMap map = new TreeMap();

修改为

CollatorComparator comparator = new CollatorComparator();

TreeMap map = new TreeMap();

再次运行该类，运行结果如下：

325

653

730

757

874

895

909

921

Abc

abcd

bbb

BBBB

碑海

北京

上海

厦门

香港

中国

此时可以看到中文的排序已经完成正常。如果想不让英文区分大小写，则修改CollatorComparator类，找到

element1.toString()

修改为：

element1.toString().toLowerCase()

当然你改成转换成大写的也无所谓了，当然element2.toString()也要同时修改为element2.toString().toLowerCase()。再次运行结果如下：

207

353

656

659

770

789

857

861

931

984

Abc

abcd

bbb

BBBB

碑海

北京

上海

厦门

香港

中国

现在可以看到，排序已经完全符合我们的要求了。如果要反向排序也很容易，遍历的时候倒过来，或者你写两个Comparator的实现类，正向的排序就像我们前面所写的，反向排序就将return key1.compareTo(key2);修改成return -key1.compareTo(key2);，加了个负号，这里你可以直接加个符号看看效果，结果我就不写了，肯定中国是Number One。我还真没找到TreeMap里直接反向的方法，谁看到了告诉我。

最后一些要说明的，这里我就不再写实现的代码了，就是我们要实现的是根据model中的一个列进行排序，而我们测试代码只是简单的一些值，这个容易，遍历所有model，把要排序的列值取出来作为TreeMap的key，然后model放进去作为value就行了，这个很简单，如果想写成稍微通用点的，就使用反射机制，把取值方法封装一下就行了，然后把model对象和方法名扔进去就行了。至于value值重复的问题，也好办，只要value相同只要不是多列同时作为排序的键，那么他们之间的前后顺序无所谓，判断一下当前Map中是否含有该key值，存在，则新的key做成value+longtime就行了，就是加个时间戳（感觉用时间戳比较方便，其它的能区分的办法也行啦）。至于多列的排序，其实也容易，按照列的前后顺序firstvalue+secondvalue+......组成key放到TreeMap里照样OK J 方便吧。

新用户注册刷新评论列表


只有注册用户登录后才能发表评论。




网站导航: 博客园 IT新闻 Chat2DB C++博客博问管理
相关文章: JAVA Thread Dump 分析综述关于java RMI在多网卡下(或者启动360，百度，腾讯等wifi共享下)无法连接问题(java.rmi.ConnectException: Connection refused to host: xx) Quartz+Spring的集群配置(转) java.awt.headless=true dom4j通过xpath查询xml (转) 深入探讨 Java 类加载器 Java ClassLoader基础知识 synchronized 要注意的地方关于java.lang.IllegalMonitorStateException ThreadPoolExecutor运转机制详解 .

疯狂

在java中使用TreeMap进行中文排序(转)

日历

公告

留言簿(11)

随笔分类

相册

搜索

积分与排名

最新随笔

最新评论