|
2006年9月19日
摘要: Linuxのポート状況を確認する(netstat)
Linuxのポート状況を確認するには、netstatコマンドを使用します。
netstatコマンドが表示する情報には、ポート情報以外に、ルーティング
テーブル、IPマスカレードなど様々な情報を得ることができます。
netstatは表示できる情報が多いため、オプションを使い分けることで
必要な情報のみを表示する使い方が宜しいと思います。 阅读全文
摘要: JdkにSSLルート証明書をインストールする(例として、GeoTrustのRapidSSLSHA2(SHA256)) 阅读全文
摘要: 常用Maven plugin使用 阅读全文
摘要: 那如何查看进程的全路径呢?
其实每个进程启动之后在 /proc下面有一个于pid对应的路径
# ll /proc/31723
总用量 0
dr-xr-xr-x 2 root root 0 3月 19 18:13 attr
-r-------- 1 root root 0 3月 19 18:13 auxv
-r--r--r-- 1 root root 0 3月 19 18:04 cmdline
-rw-r--r-- 1 root root 0 3月 19 18:13 coredump_filter
-r--r--r-- 1 root root 0 3月 19 18:13 cpuset
lrwxrwxrwx 1 root root 0 3月 19 18:13 cwd -> /
-r-------- 1 root root 0 3月 19 18:13 environ
lrwxrwxrwx 1 root root 0 3月 19 18:13 exe -> /usr/sbin/htt 阅读全文
摘要: 1、 什么是SSL?
SSL 是一个安全协议,最初是由美国网景 Netscape Communication 公司设计开发的,全称为安全套接层协议 (Secure Sockets Layer) 。它采用公开密钥技术为传输通信提供如下帮助:
1. 信息传输的保密性;
2. 数据交换的完整性;
3. 信息的不可否认性;
4. 交易者身份确定性。
换句话说,服务器部署SSL证书后,其核心能就是确保服务器与浏览器之间的数据传输是加密传输的,在数据传输过程中不被篡改或被解密。浏览器上,用户可通过“金色锁型”标记,得知是否已处于SSL安全保护,如果更先进的VeriSign EV SSL证书,那么除了“锁型”标记外,浏览器的地址栏还会变成绿色。
阅读全文
摘要: linux如何查看端口被谁占用
使用 netstat 进行查看!
>netstat -noap | grep 80 | grep tcp
使用 lsof 进行查看!
>/usr/sbin/lsof -i tcp:8080
>/usr/sbin/lsof -i :22
>/usr/sbin/lsof -i | grep http
阅读全文
摘要: 想使用的端口又被谁给占用了,想确认一下被谁占用了吗。
首先打开命令行窗口CMD,使用 netstat 进行查看!
>netstat -aon | findstr 端口号
>tasklist | findstr PID
App Name PID Session ID Memory
----------------------------------------------------------------------- 阅读全文
摘要: Q:IBM has its own JVM called J9. Linux versions can be downloaded from DeveloperWorks, but not the Windows versions (except for one requiring IBM hardware). This is most likely a licensing issue. We develop against IBM non-x86 hardware with J9 so it is interesting to use the same JVM for development too.
What is the official way of getting IBM Java 7 for Windows? (and how expensive is it?) 阅读全文
摘要: ALTER SYSTEM SET
UTL_FILE_DIR='C:\oracle\oradata','C:\oracle\oradata\log'
SCOPE = SPFILE ;"
select name,value,description from V$PARAMETER where name like 'u%'; 阅读全文
摘要: mount -t cifs -o username=root,password=root //192.168.0.194/share /mnt/share_194
mount -t nfs 192.168.0.196:/home/share /mnt/share_196 阅读全文
摘要: Oracle 实在太强了,本篇文章详细介绍了Oracle的递归查询语法,利用此语法,可以方便地实现递归的双向查询:
-- Tirle : Recursion query for TREE with "connect by/start with"
-- Author : Rake Gao
-- Create Date : 2005-08-22
-- Version : 2.0
-- Last Modify : 2005-08-22
目 录
一、测试准备
二、实现各种查询要求
三、要点总结 阅读全文
摘要: 软件版本Beta,RC,Demo,Build等是什么意思呢? 阅读全文
摘要: 一、下载
1、PowerDesigner 12.5官方下载地址
http://download.sybase.com/eval/PowerDesigner/powerdesigner125_eval.exe
大小125 MB (132,006,349 字节)
二、破解
环境:Window 2003 Server Enterprise+sp1+PowerDesigner12.5_eval.exe(12.5.0.2169)
1、制作license.lic文件
拷贝以下内容,并保存为license.lic文件(注意扩展名是lic)
FEATURE PD_SHELL SYBASE 12.50 permanent uncounted 1 TS_OK HOSTID=ANY SIGN2=1
FEATURE PD_DEV SYBASE 12.50 permanent uncounted 1 TS_OK HOSTID=ANY SIGN2=2 阅读全文
摘要: nutch网上有不少有它的源码解析,但是采集这块还是不太让人容易理解.今天终于知道怎么,弄的.现在把crawl-urlfilter.txt文件贴出来,让大家一块交流,也给自己备忘录一个。 阅读全文
摘要: 解决搜索动态内容的问题:
需要注意在conf下面的2个文件:regex-urlfilter.txt,crawl-urlfilter.txt
# skip URLs containing certain characters as probable queries, etc.
-[?*!@=] (-改+)
这段意思是跳过在连接中存在? * ! @ = 的页面,因为默认是跳过所以,在动态页中存在?一般按照默认的是不能抓取到的。可以在上面2个文件中都修改成:
# skip URLs containing certain characters as probable queries, etc.
# -[?*!@=]
另外增加允许的一行
# accept URLs containing certain characters as probable queries, etc.
+[?=&]
意思是抓取时候允许抓取连接中带 ? = & 这三个符号的连接
注意:两个文件都需要修改,因为NUTCH加载规则的顺序是cr 阅读全文
摘要: 今天主要研究了Nutch中的html页面的解析问题,因为我的任务是从页面中提取特定的文本,因此首先要找到Nutch如何将html中的文本提取出来。Nutch提供了两种html解析器,nekohtml和tagsoup,我采用了neko的解析器,在看了代码后,发现其提取文本的方法在org.apache.nutch.parse.html中的DOMContentUtils文件中,主要的函数是getTextHelper。 阅读全文
摘要: 今天主要解决了Nutch中的一些小的问题,下面分别简述一下。
1.网页快照乱码问题
Nutch的网页快照是乱码,解决办法是修改tomcat/webapps/nutch目录下的cached.jsp文件,修改其中的第63行。
原来的代码是:content = new String(bean.getContent(details);
修改后的代码是:content = new String(bean.getContent(details),"gb2312");
阅读全文
摘要: 当某个插件需要被加载时, Nutch 会加载所有插件的相关接口到缓存,此后每个插件需要实例的时候,根据相关接口和相关接口实现实例在缓存内的记录,使用反射实现一个实例并返回,下面以 QueryFilter 的所有插件被加载例子进行说明。 阅读全文
摘要: 主要类分析:
一、 org.apache.nutch.crawl.Injector:
1,注入url.txt
2,url标准化
3,拦截url,进行正则校验(regex-urlfilter.txt)
4,对符URL标准的url进行map对构造 ,在构造过程中给CrawlDatum初始化得分,分数可影响url host的搜索排序,和采集优先级!
5,reduce只做一件事,判断url是不是在crawldb中已经存在,如果存在则直接读取原来CrawlDatum,如果是新host,则把相应状态存储到里边(STATUS_DB_UNFETCHED(状态意思为没有采集过))
二、org.apache.nutch.crawl.Generator: 阅读全文
摘要: 读者是没有耐心的,我也没有,所以先说结论:你可以不用编程序,只要鼠标点几下拖动些图标,改改参数,就能完成过亿数据的分布处理程序。
当然,这么理想的目标现在还没有达到,但路已经明明白白的展现在面前了,至少我们已经走了接近一半了。 阅读全文
摘要: 1. 介绍
MapReduce是google发明的一种编程模型。在这种编程模型下,用户通过定义一个map函数和一个reduce函数来解决问题。map函数对用户输入的键/值对(key/value pair)进行处理(处理时可能只有值这一项有用),生成一系列新的键/值对作为中间结果;系统(MapReduce的实现)对map函数生成的键/值对进行处理,将同属于一个键(key)的值(value)组合在一起,生成键/值列表((key/list of values) pair)对;reduce函数将键/值列表对作为输入,对同属于一个键的值列表进行处理,生成最终处理结果输出。
如果一个问题可以通过MapReduce编程模型来表达和解决,就可以通过MapReduce系统自动获得并行执行能力。程序员不需要有并行程序设计的经验,只需要定义map和reduce函数。 阅读全文
摘要: eclipse 起动后报JVM terminated. Exit code=127的解决办法 阅读全文
摘要: jnlp是什么?是java提供的一种让你可以通过浏览器直接执行java应用程序的途径,它使你可以直接通过一个网页上的url连接打开一个java应 用程序.好处就不用说了,如果你的java应用程序以jnlp 的方式发布,如果版本升级后,不需要再向所有用户发布版本,只需要更新服务器的版本,这就相当于让java应用程序有了web应用的优点了 阅读全文
摘要: 1.创建工作簿 (WORKBOOK)
HSSFWorkbook wb = new HSSFWorkbook();
FileOutputStream fileOut = new FileOutputStream("workbook.xls");
wb.write(fileOut);
fileOut.close();
2.创建工作表(SHEET)
HSSFWorkbook wb = new HSSFWorkbook();
HSSFSheet sheet1 = wb.createSheet("new sheet");
HSSFSheet sheet2 = wb.createSheet("second sheet");
FileOutputStream fileOut = new FileOutputStream("workbook.xls");
wb.write(fileOut);
fileOut.close(); 阅读全文
摘要: Nutch的内部网增量缩影是可以通过recrawl脚本(nutch的wiki上有发布)进行增量更新,但是对于对于全网爬取的URL如何做到增量更新,目前来说还没有相关的方法,尤其是对于上TB级别数据的索引更新和合并,直接把Nutch似乎还有相当多的问题需要解决(比如分布式大索引分割、合并等等,在Nutch的mailing list上大家讨论了非常多,但还是没有一个合理的解决方案),因此,作者期望通过解读源码的方式来对Nutch的索引构建机制和源码做一个较为初浅的解读,以期通过修改解决Nutch的索引面临的问题,期望能得到广大网友的意见。
考虑到笔者的需求是Nutch对于海量的数据的索引,因此基于集群的方式对Nutch的源码进行解读。
本文是针对Nutch1.0而写,Nutch1.0相比0.9更多的功能采用了Map/reduce算法结构,若不是先前对MapReduce有一番了解,看起来将是非常费解。
首先:补充一点最基础的知识,就是Nutch的文件目录所包含的内容: 阅读全文
摘要: 关键字: nutch 命令
Nutch采用了一种命令的方式进行工作,其命令可以是对局域网方式的单一命令也可以是对整个Web进行爬取的分步命令。主要的命令如下:
1. Crawl
Crawl是“org.apache.nutch.crawl.Crawl”的别称,它是一个完整的爬取和索引过程命令。
2. Readdb
Readdb命令是“org.apache.nutch.crawl.CrawlDbReader”的别称,返回或者导出Crawl数据库(crawldb)中的信息。
3. readlinkdb
它是"org.apache.nutch.crawl.LinkDbReader"的别称,导出链接库中信息或者返回其中一个URL信息。
4. inject
它是"org.apache.nutch.crawl.Injector"的别称,注入新URL到crawldb中。
5. generate
它是“org.apache.nutch.crawl.Generator”,从Cra 阅读全文
摘要: 一、 基本书写规范
1、所有的CSS的尽量采用外部调用
书写时重定义的最先,伪类其次,自定义最后(其中a:link a:visited a:hover a:actived 要按照顺序写)便于自己和他人阅读。
为了保证不同浏览器上字号保持一致,字号建议用点数pt和像素px来定义,pt一般使用中文宋体的9pt和11pt,px一般使用中文宋体12pt 和14.7px 这是经过优化的字号,黑体字或者宋体字加粗时,一般选用11pt和14.7px 的字号比较合适。
阅读全文
摘要: 一篇介绍如何编写和维护你的CSS文件的文档,非常值得学习。
Being a CSS expert is more than just memorizing selectors. It’s also working to improve the maintainability and efficiency of your stylesheets, planning for the future and mastering your workflow. In this article Jina Bolton gives 10 CSS tips culled from surveys with 12 top designers.
阅读全文
摘要: 序言
本文档规定了在项目实行过程中的CSS开发规范。全部开发人员在编写CSS代码时,应遵从该文档提出的规范,尽可能的提高可读性和可维护性。 阅读全文
摘要: 下载iText的亚洲语言包iTextAsian.jar,加入classpath中。同时也放入到ireport的lib目录里。
在ireport的Font选项中,PDF font name选择STSong-Light,PDF Encoding选择UniGB-UCS2-H。PDF Embedded选上。
这样出来的PDF就能显示中文。 阅读全文
摘要: ORACLE UPDATE 语句语法与性能分析的一点看法
为了方便起见,建立了以下简单模型,和构造了部分测试数据:
在某个业务受理子系统BSS中,
--客户资料表
create table customers
(
customer_id number(8) not null, -- 客户标示
city_name varchar2(10) not null, -- 所在城市
customer_type char(2) not null, -- 客户类型
...
阅读全文
摘要: 当下, 由于存储结构需要, 用多维数组, 顺便学习了一下, 将学习经过备忘如下:
GetUpperBound(0) 返回数组的第一维的索引上限,GetUpperBound(i)返回数组的i+1维的上限,GetUpperBound(Rank-1)返回数组的最后一维的上限,也就是列数-1
阅读全文
摘要: 当下, 由于存储结构需要, 用多维数组, 顺便学习了一下, 将学习经过备忘如下:
GetUpperBound(0) 返回数组的第一维的索引上限,GetUpperBound(i)返回数组的i+1维的上限,GetUpperBound(Rank-1)返回数组的最后一维的上限,也就是列数-1
阅读全文
摘要: ////
loginShell.setLocation(display.getClientArea().width / 2 - loginShell.getSize().x/2, display
.getClientArea().height / 2 - loginShell.getSize().y/2);
////
////
Monitor primary = loginShell.getMonitor();
Rectangle bounds = primary.getBounds();
Rectangle rect = loginShell.getBounds();
int x = bounds.x + (bounds.width - rect.width) / 2;
int y = bounds.y + (bounds.height - rect.height) / 2;
if (x < 0)
x = 0;
if (y < 0)
y 阅读全文
摘要: 如何查看、删除MsSql数据库的日志文件 阅读全文
摘要: FTP(文件传输协议)是TCP/IP中使用最广泛的应用之一,AS/400中的TCP/IP支持各种局域网、广域网连接类型:Ethernet、Token-Ring、SDDI、Wireless LAN、X.25 SVC 、PVC和Frame Relay。所有的计算机系统都非常重视文件操作,AS/400系统也不例外,本文件讨论FTP的理论、FTP的配置、FTP命令集和在AS/400上如何使用FTP。 阅读全文
摘要: XDeskCal v3.0 注册方法 阅读全文
摘要: 非域环境下的安装
问题:
系统提示“用户 'NT AUTHORITY\NETWORK SERVICE' 登录失败” 阅读全文
摘要: 1、打开记事本,然后将下面的代码复制到一个新文件中。
<%@ Page Language="C#" %><%Response.Write(System.Security.Principal.WindowsIdentity.GetCurrent().Name);%> 保存 my.aspx 到你的web目录 ,运行一下窗体显示 “ NT AUTHORITY\NETWORK SERVICE ”。成功!
加密 web.config 阅读全文
摘要: 不知道从什么时候开始,研究asp.net的人都比较推崇petshop。有人研究也有人重构。现在.net2.0来了,petshop4.0也来了。我今天也装了一个,但是,为了能让这个petshop4运行起来,费了不少劲。因为.net2.0对我来说太陌生了。
“/petshop”应用程序中的服务器错误。
--------------------------------------------------------------------------------
配置错误
说明: 在处理向该请求提供服务所需的配置文件时出错。请检查下面的特定错误详细信息并适当地修改配置文件。
分析器错误信息: 未能使用提供程序“RsaProtectedConfigurationProvider”进行解密。提供程序返回错误信息为: 打不开 RSA 密钥容器。 阅读全文
摘要: ASP.NET验证码生成方法
(3种哦) 阅读全文
摘要: 用javascript生成树型菜单,目前找到了比较好的三个实现.
1.xtree和xloadtree,总体来说,实现还不错,提供了一次性构建树,和动态加载树(生成指定格式的XML才可以),改变Style,功能中等,用法中等.
2.yui的treeview,这也是不错的实现,是Yahoo提供的,支持一次性构建,动态构建,改变Style,Menu样式等等,功能很多,但用法比较复杂
3.dtree,比较中规中矩的一个实现,用法简单,不支持动态加载,如果不用高级功能的话,用这个是不错的选择
如果只是想用一次构建树,就选择dtree,如果想用动态加载树,就用xtree+xloadtree和treeview,如果想用高级事件处理,menu样式就只能选择treeview了.
阅读全文
摘要: Jar使用说明
jar工具是个java应用程序,可将多个文件合并为单个JAR归档文件。jar是个多用途的存档及压缩工具,它基于ZIP和ZLIB压缩格式。然而,设计jar的主要目的是便于将java applet或应用程序打包成单个归档文件。将applet或应用程序的组件(.class 文件、图像和声音)合并成单个归档文件时,可以用java代理(如浏览器)在一次HTTP事务处理过程中对它们进行下载,而不是对每个组件都要求一个新连接。这大大缩短了下载时间。jar还能压缩文件,从而进一步提高了下载速度。此外,它允许applet的作者对文件中的各个项进行签名,因而可认证其来源。jar工具的语法基本上与tar命令的语法相同。 阅读全文
摘要: 文章将会涉及3个方面的内容:
第一部分:使用iReport制作报表的详细过程(Windows环境下)
第二部分:使用Jasperreport作为报表控件开发胖客户端报表应用
第三部分:使用Jasperreport作为报表控件开发Web报表应用
阅读全文
摘要: 1)它可以PDF,HTML,XML等多种形式产生报表或动态报表,在新版本还支持CSV,XLS,RTF等格式的报表;
2)它按预定义的XML文档来组织数据,来源多(如:关系数据库,Java容器对象(collection,arrays)等);
报表的填充过程:
先产生报表设计对象->序列化该对象->存储在磁盘或网络->产生XML文件(表格数据)。
表单的设计过程就是用定义于XML文件中的Java表达式来实现报表的设计。
3)它带数据一致性验证;
4)报表引擎必须先接受数据(通过参数等多种形式)来产生报表,更多的是来自数据源,引擎直接接收用于填充表格的数据源对象,或者通过自身提供的JDBC连接对象来处理数据库的数据;
5)报表最终要产生一个新的对象来进行填充操作,从而产生打印文档对象,这也是存储在磁盘或网络传输介质的序列化对象;
6)内置浏览器能直接查看结果,以PDF,HTML,XML导出;
阅读全文
摘要: 对于每个类型拥有的值范围以及并且指定日期何时间值的有效格式的描述见7.3.6 日期和时间类型。
这里是一个使用日期函数的例子。下面的查询选择了所有记录,其date_col的值是在最后30天以内:
mysql> SELECT something FROM table
WHERE TO_DAYS(NOW()) - TO_DAYS(date_col) <= 30;
DAYOFWEEK(date)
……
阅读全文
摘要: 在mysql的一次会话中,服务器收到客户端发来的指令后,大致要执行3个动作:
1、服务器认为收到的指令是按当前character_set_client环境变量所指定的字符集编码的,
2、然后再将其转换成character_set_connection所指定的字符集编码
3、分析、执行该指令。
4、 用character_set_results变量所指定的字符集返回服务器向客户端传输的数据
解决这个问题的关键点在于设置 default-character-set 变量。 阅读全文
摘要: 格式:
CONVERT(data_type,expression[,style])
说明:
此样式一般在时间类型(datetime,smalldatetime)与字符串类型(nchar,nvarchar,char,varchar)
相互转换的时候才用到.
例子:
SELECT CONVERT(varchar(30),getdate(),101) now
结果为:
now
---------------------------------------
|09/15/2001
…… 阅读全文
摘要: stringstr1 =string.Format("{0:N1}",56789); //result: 56,789.0
stringstr2 =string.Format("{0:N2}",56789); //result: 56,789.00
stringstr3 =string.Format("{0:N3}",56789); //result: 56,789.000
stringstr8 =string.Format("{0:F1}",56789); //result: 56789.0
stringstr9 =string.Format("{0:F2}",56789); //result: 56789.00
…… 阅读全文
摘要: 1 简介
1.1 Log4net的优点:
几乎所有的大型应用都会有自己的用于跟踪调试的API。因为一旦程序被部署以后,就不太可能再利用专门的调试工具了。然而一个管理员可能需要有一套强大的日志系统来诊断和修复配置上的问题。
……
阅读全文
摘要: MS SQL Server和Oracle的常用函数对比
摘自:中国IT实验室 阅读全文
摘要: I/O流,即输入/输出流(Input/Output Stream),是软件框架中的核心系统。对程序设计语言设计者来说,设计一个令人满意的I/O系统,是件极艰巨的任务,也是不可缺少的基础设施。C++的标准模板库已经提供一套很不错的I/O流库了,但是我还是喜欢Java和.Net框架提供的那样的使用简单且扩展性强的I/O系统,而且还需要自行做一些改进已融入到C++通用框架体系中,由于I/O系统是框架的基础设施,所以设计它是很关键的任务。 阅读全文
摘要: 使用Apache的Digester来解析XML文档 阅读全文
摘要: 本文主要描述Log4j的API的唯一特性和它的设计原理。Log4j是一个基于许多作者的开放源码的项目。它允许开发员以任意的间隔来控制日志的输出。它通过设在外部的配置文件而达到运行时灵活的设置。最重要的是,Log4j有一个平稳的学习曲线。注意:根据来自用户的反馈判断,它很容易使人上瘾 阅读全文
摘要: Log4J 最佳实践之全能配置文件(转) 阅读全文
摘要: 早在Java 1.2推出之时,Java平台中就引入了一个新的支持:java.lang.ThreadLocal,给我们在编写多线程程序时提供了一种新的选择。使用这个工具类可以很简洁地编写出优美的多线程程序,虽然ThreadLocal非常有用,但是似乎现在了解它、使用它的朋友还不多。 阅读全文
摘要: ORACLE SEQUENCE学习
在oracle中sequence就是所谓的序列号,每次取的时候它会自动增加,一般用在需要按序列号排序的地方。 阅读全文
摘要: 由List.contains(Object, obj)想到的 阅读全文
摘要: 关于struts中tld 文件里配置详解 阅读全文
摘要: 最近一个项目应日本客户的需求,我们在其中添加了一个共通报错的模块,对前后台的各种提示信息进行收集,并进行统一的处理,显示给系统的用户。 阅读全文
摘要: IBM® WebSphere® Studio Application Developer Version 5.1.2 for Windows®
在默认情况下,WSAD 5在启动的时候会弹出一个提示窗口让用户选择工作区。如果,如果你选中了窗口下方的“将此工作空间用作缺省值并且不再显示此对话框”,等下一次再运行WSAD的时候再再想更换工作区就没那么好办了。
阅读全文
摘要: log4j配置相对路径实现日志记录(转) 阅读全文
摘要: XPath由W3C的 XPath 1.0 标准 描述.本教程通过实例来展示XPath的一些特性.
基本的XPath语法类似于在一个文件系统中定位文件,如果路径以斜线 / 开始, 那么该路径就表示到一个元素的绝对路径 阅读全文
摘要: XPath is a language for finding information in an XML document. XPath is used to navigate through elements and attributes in an XML document.
Xpath是一种能够在XML文档中寻找信息的语言。它通过XML文档中的元素和属性来进行导航。 阅读全文
|