2008年8月11日随笔档案 - 学习笔迹

2008年8月11日

css 实现鼠标移到上面背景变色

如鼠标移到 class 为 box 的 div 标签中背景变色

.vbox div:hover{background: #ddd;}

据说 IE6.0、Firefox2.0、Opera 9.23都不支持

posted @ 2010-02-24 22:10 流浪汗阅读(1969) | 评论 (0) | 编辑收藏

css 标签 a 的 hover 是否有效与出现的顺序有关

想改 a 的默认方式，比如：链接不要下划线，鼠标移到上面时有划线。

css 如

a:hover {text-decoration: underline;}
a:link {text-decoration: none;}
a:visited {text-decoration: none;}

是没有达到鼠标称到上面有划线。

必须改为：

a:link {text-decoration: none;}
a:visited {text-decoration: none;}
a:hover {text-decoration: underline;}

a:hover 放到最后。

posted @ 2010-02-24 22:04 流浪汗阅读(994) | 评论 (3) | 编辑收藏

Nginx Location 语法，与简单配置

一、介绍Nginx是俄罗斯人编写的十分轻量级的HTTP服务器,Nginx，它的发音为“engine X”，是一个高性能的HTTP和反向代理服务器，同时也是一个IMAP/POP3/SMTP 代理服务器．
二、Location语法语法：location [=|~|~*|^~] /uri/ { … }
注：
1、~ 为区分大小写匹配
2、~* 为不区分大小写匹配
3、!~和!~*分别为区分大小写不匹配及不区分大小写不匹配
示例一：
location / { }
匹配任何查询，因为所有请求都以 / 开头。但是正则表达式规则将被优先和查询匹配。
示例二：
location =/ {}
仅仅匹配/
示例三：
location ~* \.(gif|jpg|jpeg)$ ｛
rewrite \.(gif|jpg)$ /logo.png;
｝
注：不区分大小写匹配任何以gif，jpg，jpeg结尾的文件
三、ReWrite语法
last - 基本上都用这个Flag。
break - 中止Rewirte，不在继续匹配
redirect - 返回临时重定向的HTTP状态302
permanent - 返回永久重定向的HTTP状态301
1、下面是可以用来判断的表达式：
-f和!-f用来判断是否存在文件
-d和!-d用来判断是否存在目录
-e和!-e用来判断是否存在文件或目录
-x和!-x用来判断文件是否可执行
2、下面是可以用作判断的全局变量
例：http://localhost:88/test1/test2/test.php
$host：localhost
$server_port：88
$request_uri：http://localhost:88/test1/test2/test.php
$document_uri：/test1/test2/test.php
$document_root：D:\nginx/html
$request_filename：D:\nginx/html/test1/test2/test.php
四、Redirect语法
server {
listen 80;
server_name start.igrow.cn;
index index.html index.php;
root html;
if ($http_host !~ "^star\.igrow\.cn$&quot

{
      rewrite ^(.*) http://star.igrow.cn$1 redirect;
}
}
五、防盗链location ~* \.(gif|jpg|swf)$ {
  valid_referers none blocked start.igrow.cn sta.igrow.cn;
  if ($invalid_referer) {
  rewrite ^/ http://$host/logo.png;
  }
}
六、根据文件类型设置过期时间
location ~* \.(js|css|jpg|jpeg|gif|png|swf)$ {
if (-f $request_filename) {
expires 1h;
break;
}
}
七、禁止访问某个目录
location ~* \.(txt|doc)${
  root /data/www/wwwroot/linuxtone/test;
deny all;
}

转：http://www.phpchina.com/html/70/t-162870.html，http://idev.yo2.cn/go/19761.html

posted @ 2010-02-03 10:25 流浪汗阅读(12015) | 评论 (0) | 编辑收藏

linux下top命令参数解释

top命令是Linux下常用的性能分析工具，能够实时显示系统中各个进程的资源占用状况，类似于Windows的任务管理器。下面详细介绍它的使用方法。

top - 01:06:48 up 1:22, 1 user, load average: 0.06, 0.60, 0.48
Tasks: 29 total,   1 running, 28 sleeping,   0 stopped,   0 zombie
Cpu(s): 0.3% us, 1.0% sy, 0.0% ni, 98.7% id, 0.0% wa, 0.0% hi, 0.0% si
Mem:    191272k total,   173656k used,    17616k free,    22052k buffers
Swap:   192772k total,        0k used,   192772k free,   123988k cached

   PID USER      PR NI VIRT RES SHR S %CPU %MEM    TIME+ COMMAND
1379 root      16   0 7976 2456 1980 S 0.7 1.3   0:11.03 sshd
14704 root      16   0 2128 980 796 R 0.7 0.5   0:02.72 top
     1 root      16   0 1992 632 544 S 0.0 0.3   0:00.90 init
     2 root      34 19     0    0    0 S 0.0 0.0   0:00.00 ksoftirqd/0
     3 root      RT   0     0    0    0 S 0.0 0.0   0:00.00 watchdog/0

统计信息区
前五行是系统整体的统计信息。第一行是任务队列信息，同 uptime 命令的执行结果。其内容如下：

    01:06:48 当前时间
    up 1:22 系统运行时间，格式为时:分
    1 user 当前登录用户数
    load average: 0.06, 0.60, 0.48 系统负载，即任务队列的平均长度。
    三个数值分别为 1分钟、5分钟、15分钟前到现在的平均值。

第二、三行为进程和CPU的信息。当有多个CPU时，这些内容可能会超过两行。内容如下：

    Tasks: 29 total 进程总数
    1 running 正在运行的进程数
    28 sleeping 睡眠的进程数
    0 stopped 停止的进程数
    0 zombie 僵尸进程数
    Cpu(s): 0.3% us 用户空间占用CPU百分比
    1.0% sy 内核空间占用CPU百分比
    0.0% ni 用户进程空间内改变过优先级的进程占用CPU百分比
    98.7% id 空闲CPU百分比
    0.0% wa 等待输入输出的CPU时间百分比
    0.0% hi
    0.0% si

最后两行为内存信息。内容如下：

    Mem: 191272k total 物理内存总量
    173656k used 使用的物理内存总量
    17616k free 空闲内存总量
    22052k buffers 用作内核缓存的内存量
    Swap: 192772k total 交换区总量
    0k used 使用的交换区总量
    192772k free 空闲交换区总量
    123988k cached 缓冲的交换区总量。
    内存中的内容被换出到交换区，而后又被换入到内存，但使用过的交换区尚未被覆盖，
    该数值即为这些内容已存在于内存中的交换区的大小。
    相应的内存再次被换出时可不必再对交换区写入。

进程信息区
统计信息区域的下方显示了各个进程的详细信息。首先来认识一下各列的含义。

    序号列名含义
    a PID 进程id
    b PPID 父进程id
    c RUSER Real user name
    d UID 进程所有者的用户id
    e USER 进程所有者的用户名
    f GROUP 进程所有者的组名
    g TTY 启动进程的终端名。不是从终端启动的进程则显示为 ?
    h PR 优先级
    i NI nice值。负值表示高优先级，正值表示低优先级
    j P 最后使用的CPU，仅在多CPU环境下有意义
    k %CPU 上次更新到现在的CPU时间占用百分比
    l TIME 进程使用的CPU时间总计，单位秒
    m TIME+ 进程使用的CPU时间总计，单位1/100秒
    n %MEM 进程使用的物理内存百分比
    o VIRT 进程使用的虚拟内存总量，单位kb。VIRT=SWAP+RES
    p SWAP 进程使用的虚拟内存中，被换出的大小，单位kb。
    q RES 进程使用的、未被换出的物理内存大小，单位kb。RES=CODE+DATA
    r CODE 可执行代码占用的物理内存大小，单位kb
    s DATA 可执行代码以外的部分(数据段+栈)占用的物理内存大小，单位kb
    t SHR 共享内存大小，单位kb
    u nFLT 页面错误次数
    v nDRT 最后一次写入到现在，被修改过的页面数。
    w S 进程状态。
    D=不可中断的睡眠状态
    R=运行
    S=睡眠
    T=跟踪/停止
    Z=僵尸进程
    x COMMAND 命令名/命令行
    y WCHAN 若该进程在睡眠，则显示睡眠中的系统函数名
    z Flags 任务标志，参考 sched.h

默认情况下仅显示比较重要的 PID、USER、PR、NI、VIRT、RES、SHR、S、%CPU、%MEM、TIME+、COMMAND 列。可以通过下面的快捷键来更改显示内容。

更改显示内容
通过 f 键可以选择显示的内容。按 f 键之后会显示列的列表，按 a-z 即可显示或隐藏对应的列，最后按回车键确定。

按 o 键可以改变列的显示顺序。按小写的 a-z 可以将相应的列向右移动，而大写的 A-Z 可以将相应的列向左移动。最后按回车键确定。

按大写的 F 或 O 键，然后按 a-z 可以将进程按照相应的列进行排序。而大写的 R 键可以将当前的排序倒转。

命令使用

    1．工具（命令）名称
    top
    2．工具（命令）作用
    显示系统当前的进程和其他状况； top是一个动态显示过程,即可以通过用户按键来不断刷新当前状态.如果在前台执行该命令,它将独占前台,直到用户终止该程序为止. 比较准确的说,top命令提供了实时的对系统处理器的状态监视.它将显示系统中CPU最“敏感”的任务列表.该命令可以按CPU使用.内存使用和执行时间对任务进行排序；而且该命令的很多特性都可以通过交互式命令或者在个人定制文件中进行设定.
    3．环境设置
    在Linux下使用。
    4．使用方法
    4．1使用格式
    top [-] [d] [p] [q] [c] [C] [S] [s] [n]
    4．2参数说明
     d 指定每两次屏幕信息刷新之间的时间间隔。当然用户可以使用s交互命令来改变之。
     p 通过指定监控进程ID来仅仅监控某个进程的状态。
     q该选项将使top没有任何延迟的进行刷新。如果调用程序有超级用户权限，那么top将以尽可能高的优先级运行。
     S 指定累计模式
     s 使top命令在安全模式中运行。这将去除交互命令所带来的潜在危险。
     i 使top不显示任何闲置或者僵死进程。
     c 显示整个命令行而不只是显示命令名
    4.3其他
    　下面介绍在top命令执行过程中可以使用的一些交互命令。从使用角度来看，熟练的掌握这些命令比掌握选项还重要一些。这些命令都是单字母的，如果在命令行选项中使用了s选项，则可能其中一些命令会被屏蔽掉。
    　　Ctrl+L 擦除并且重写屏幕。
    　　h或者? 显示帮助画面，给出一些简短的命令总结说明。
    　　k 终止一个进程。系统将提示用户输入需要终止的进程PID，以及需要发送给该进程什么样的信号。一般的终止进程可以使用15信号；如果不能正常结束那就使用信号9强制结束该进程。默认值是信号15。在安全模式中此命令被屏蔽。
    　　i 忽略闲置和僵死进程。这是一个开关式命令。
    　　q 退出程序。
    　　r 重新安排一个进程的优先级别。系统提示用户输入需要改变的进程PID以及需要设置的进程优先级值。输入一个正值将使优先级降低，反之则可以使该进程拥有更高的优先权。默认值是10。
    　　S 切换到累计模式。
    　　s 改变两次刷新之间的延迟时间。系统将提示用户输入新的时间，单位为s。如果有小数，就换算成m s。输入0值则系统将不断刷新，默认值是5 s。需要注意的是如果设置太小的时间，很可能会引起不断刷新，从而根本来不及看清显示的情况，而且系统负载也会大大增加。
    　　f或者F 从当前显示中添加或者删除项目。
    　　o或者O 改变显示项目的顺序。
    　　l 切换显示平均负载和启动时间信息。
    　　m 切换显示内存信息。
    　　t 切换显示进程和CPU状态信息。
    　　c 切换显示命令名称和完整命令行。
    　　M 根据驻留内存大小进行排序。
    　　P 根据CPU使用百分比大小进行排序。
    　　T 根据时间/累计时间进行排序。
        W 将当前设置写入~/.toprc文件中。这是写top配置文件的推荐方法。

posted @ 2010-01-08 11:08 流浪汗阅读(746) | 评论 (0) | 编辑收藏

中文分词 mmseg4j-1.8 版发布

想发布新版的 mmseg4j 到现在已经有二个多月了。主要是因为这段时间忙其它事情了。现 Lucene 2.9 发布了，solr 1.4 也应该会比较快就要发布了。对 mmseg4j 兼容新版的 lucene/solr 也是个任务。

现 mmseg4j 发布新版 1.8，可以下载：mmseg4j-1.8.zip 包括了源码与词库，还有创建文件。下面说下此版的主要变更：

new:

1、有检测词典变更的接口，外部程序可以使用 wordsFileIsChange() 和 reload() 来完成检测与加载的工作. (内部不实现自动检测与加载，留给外部程序去做。)

2、添加 MMseg4jHandler 类，可以在solr中用url的方式来控制加载检测词库。

3、增加 CutLetterDigitFilter过虑器，切分“字母和数”混在一起的过虑器。比如：mb991ch 切为 "mb 991 ch"。

changes:

1、默认在 classpath 中加载 data 目录（词库目录），找不到再找 user.dir/data 目录。但是优先 mmseg.dic.path 系统属性指定的。

2、新词库，去除 sogou 高频无词性的词，合并 rmmseg 提供的词（是 mmseg4j 1.0 使用的词库），共计（14W 多词）。

3、数字或英文开头的数字或英文不独立分出。如 MB991CH/A 分为 mb991ch a，cq40-519tx 分为 CQ40 519TX

4、内置支持小写，不需要 LowerCaseFilter 了。MMSegAnalyzer 去除了小写过虑。

5、支持 solr 1.3/1.4、lucene 2.3/2.4/2.9

6、尝试加载 jar 里的 words.dic，并构建含有 words.dic 的 jar(mmseg4j-*-with-dic.jar)。

bugs:

1、Dictionary 添加 finalize 方法。修正 tomcat reload 时 OOM 的 bug: http://code.google.com/p/mmseg4j/issues/detail?id=4

2、MMSegTokenizer 在 lucene 2.4 编译的在 lucene 2.9 中会报 java.lang.NoSuchFieldError: input。bug: http://code.google.com/p/mmseg4j/issues/detail?id=5

详情：http://blog.chenlb.com/2009/10/chinese-segment-mmseg4j-1_8-release.html

posted @ 2009-10-19 09:28 流浪汗阅读(3442) | 评论 (1) | 编辑收藏

中文分词 mmseg4j 1.7.2 版发布

中文分词 mmseg4j 1.7.2 版发布，其实两天前就发布了，只是没有写博客而已。与引版本发布的还有 1.6.2，两者基本一样，只是词库的数据结构不同，1.7的是键树，1.6的是数组与二分查找。 mmseg4j 1.7.2 版的主要更新：

修复由 1.7-beta 升级到 1.7 版的 bug：添加 lowerCaseFilter 后的一个 bug: NullPointerException。
核发程序与 lucene 和 solr 扩展分开打包, 同时给出低版本的 lucene 扩展(lucene 1.9 到 2.2; lucene 2.3)

如何从源码编译：下载源码：mmseg4j-1.7.2-src 或 mmseg4j-1.6.2-src。解压到如：e:/mmseg4j-1.7.2-src。然后到这个目录，运行：

或

上面编译是在 solr 1.3 和 lucene 2.4 环境下的。如果您要在低版本的 lucene 中使用，到 e:/mmseg4j-1.7.2-src/contrib/lucene_1_9 或 e:/mmseg4j-1.7.2-src/contrib/lucene_2_3 运行：

说明：到 contrib 下的子项目中编译的话，先要编译 mmseg4j，contrib/lucene_1_9 可以支持到 2.2。

如果有任何疑问、建议，欢迎到论坛 http://groups.google.com/group/mmseg4j/topics?hl=zh_CN 讨论。或与我联系 chenlb2008#gmail.com。

还要感谢网友“苦涩可乐”提示 NullPointerException 的bug。

官方博客：mmseg4j，项目：google code mmseg4j

posted @ 2009-04-27 20:00 流浪汗阅读(2915) | 评论 (0) | 编辑收藏

此博客很少更新!

很久没有在此博客写东西了。但一个多月了，原因是我已经有自己的博客空间了，此博客很少更新，不过如果写得好文就转载到此博客。

posted @ 2008-10-25 11:54 流浪汗阅读(673) | 评论 (0) | 编辑收藏

试用 code highlight (SyntaxHighlighter)

一直找代码高亮显示，在wp上可以有coolcode但，觉得美中不足的是服务器解析，每请求一次做一次。今天偶然看到 Unmi的博客，他的代码好漂亮，看源码，知道shCore，把他的拿过来试用下。 java 代码

java 代码

groovy 代码
logo = { println "Closure"; } logo.call(); logo();

posted @ 2008-09-05 00:26 流浪汗阅读(1332) | 评论 (2) | 编辑收藏

linux 解压 tgz

.tgz 解压：

tar zxvf myfile.tgz

posted @ 2008-09-03 13:33 流浪汗阅读(46227) | 评论 (3) | 编辑收藏

solr分发问题 rsync:link_stat "snapshot.20080820124136/." (in solr) failed: No such file or directory (2)

solr分发问题。
用rsync同步目录里出现：rsync:link_stat "snapshot.20080820124136/." (in solr) failed: No such file or directory (2)

上一编配置得没什么问题：http://www.blogjava.net/chenlb/archive/2008/07/04/212398.html 。现竟然出错，郁闷。

网上找了下，说明路径有空格。http://bbs.chinaunix.net/viewthread.php?tid=1003058

二楼的回复：

带空格的文件/目录名不知道害死了多少人。

`rsync -av --progress $dir1 $dir2`;
用
`rsync -av --progress "$dir1" "$dir2"`;
代替。

其实 `` 虽然用着方便，
但不适合内插变量。
有变量作为参数的情况下，建议用 system。

此是解决那楼主的问题，可以本来就没有空格的问题，没解决到我的问题。仔细思索。

机子里有几个rsync服务，我部署的时候是复制相关的配置，rsync服务端口没改，子机同步这个服务的时候（子机同步端口与rsync一致，是错的，重复的），然后做同步的时候出现上面的问题。改了其它端口后就可以。

总的来讲，还是自己对linux了解不多。

posted @ 2008-09-02 16:14 流浪汗阅读(6513) | 评论 (0) | 编辑收藏

linux 解压 *.zip

用unzip

unzip myfile.zip

posted @ 2008-09-02 16:03 流浪汗阅读(820) | 评论 (0) | 编辑收藏

Hadoop 快速入门(二)--Fully-Distributed Mode

上一篇记录了本机模式我虚拟分布模式。http://www.blogjava.net/chenlb/archive/2008/08/11/221311.html

现我在虚拟机里开三台机子，分别命名为：master(172.16.249.210)，slave-1(172.16.249.211)，slave-2(172.16.249.212)。

master可以无密码登录到slave机。
每台机子都匹配ip对应名。

127.0.0.1       localhost       localhost

172.16.249.210  master
172.16.249.211  slave-1
172.16.249.212  slave-2

修改conf/masters文件和conf/slaves文件。
conf/masters文件：

master

conf/slaves文件：

slave-1
slave-2

格式化后可以启动了：

[chenlb@master hadoop-0.17.1]$ bin/start-all.sh

参考资料：
http://hadoop.apache.org/core/docs/r0.17.1/quickstart.html
http://hadoop.apache.org/core/docs/r0.17.1/cluster_setup.html

posted @ 2008-08-11 15:45 流浪汗阅读(796) | 评论 (0) | 编辑收藏

Hadoop 快速入门

Required Software

Java^TM 1.5.x
ssh与sshd

如果没有安装请自行安装。我以CentOS 4.6为例。

下载hadoop，http://apache.mirror.phpchina.com/hadoop/core/ 我下载的是0.17.1版本。

解压hadoop-0.17.1.tar.gz，然后conf/hadoop-env.sh 设置JAVA_HOME ，我是可JAVA_HOME 去注释，值自己的路径。如：

export JAVA_HOME=/usr/java/jdk1.6.0_06

如果不设置启动后用不了。

先从简单开始。

1、Local (Standalone) Mode ，叫单机模式。

[chenlb@master hadoop-0.17.1]$ bin/hadoop jar hadoop-0.17.1-examples.jar grep conf output 'dfs[a-z.]+'

[chenlb@master hadoop-0.17.1]$ cat output/*

如果，正常可以看到内容。像这样。

3       dfs.
3       dfs.class
2       dfs.period
2       dfs.replication
...    ...

2、Pseudo-Distributed Mode，虚拟分布模式。
vi conf/hadoop-site.xml

<configuration>
<property>
        <name>fs.default.name</name>
        <value>hdfs://master:9000/</value>
</property>
<property>
        <name>mapred.job.tracker</name>
        <value>hdfs://master:9001/</value>
</property>
<property>
        <name>dfs.replication</name>
        <value>1</value>
</property>
<property>
        <name>hadoop.tmp.dir</name>
        <value>/home/chenlb/hadoop-0.17.1/tmp/</value>
</property>
</configuration>

在/etc/hosts里添加本机ip对应master，例如我的：172.16.249.210 master
保证可以无密码登录。请看那一篇文章：http://www.blogjava.net/chenlb/archive/2008/07/03/212293.html

用ssh localhost试一下是否免密码登录。

格式化分布式文件系统：

[chenlb@master hadoop-0.17.1]$ bin/hadoop namenode -format

启动Hadoop：

[chenlb@master hadoop-0.17.1]$ bin/start-all.sh

默认可以在${HADOOP_HOME}/logs里看到日志。

可以用web看浏览NameNode和JobTracker

NameNode - http://localhost:50070/

JobTracker - http://localhost:50030/

把文件放到分布式文件系统里：

[chenlb@master hadoop-0.17.1]$ bin/hadoop dfs -put conf input

此时已经在分布文件系统里建立了input文件夹。而conf是本地的文件夹。

执行示例：

[chenlb@master hadoop-0.17.1]$ bin/hadoop jar hadoop-*-examples.jar grep input output 'dfs[a-z.]+'

这里input和output都是分布式文件系统的的文件夹，而且output在分布式文件系统里不存在，否则报错（也可以先删除它bin/badoop dfs -rmr output）。

耐心等待。结束后可以查看。

[chenlb@master hadoop-0.17.1]$ bin/hadoop dfs -get output output
[chenlb@master hadoop-0.17.1]$ cat output/*

也可以直接在分布式文件系统里查：

[chenlb@master hadoop-0.17.1]$ bin/hadoop dfs -cat output/*

成功运行后可以关闭它了：

[chenlb@master hadoop-0.17.1]$ bin/stop-all.sh

我在第2阶段，出了些问题：output已经存在，要先删除它（第二次运行前，可以不用output）。

下一篇讲：Fully-Distributed Mode http://www.blogjava.net/chenlb/archive/2008/08/11/221314.html

posted @ 2008-08-11 15:28 流浪汗阅读(4949) | 评论 (2) | 编辑收藏

Linux 重启网卡

在linux下改了ip地址后，不能立即生效。以前是重启机器，我觉得这样很傻，后来知道网卡可以重启。

/etc/init.d/network restart

posted @ 2008-08-11 09:34 流浪汗阅读(6064) | 评论 (1) | 编辑收藏

留言簿(14)

随笔分类

随笔档案

文章分类

文章档案

新闻分类

新闻档案

收藏夹

友情链接

同学链接

学习链接

最新随笔

搜索

积分与排名

最新评论

阅读排行榜

评论排行榜