爱技术爱生活

爱生活

常用链接

统计

最新评论

2009年9月24日 #

html5在移动互联网中的应用及html5与html4的区别(附完整ppt)

     摘要: html5在移动领域的应用开始越来越火了,为了让更多的博友能够了解这块,本人特别整理了html5的各类应用ppt以及html5与html4的区别文档,以及html5新的API解释提供大家学习使用,希望能对大家学习html5有所帮助  阅读全文

posted @ 2012-08-11 10:12 吃奶的孩子 阅读(201) | 评论 (0)编辑 收藏

Lucene+Struts2+Spring+IBatis实现文档内部搜索代码

     摘要: Lucene作为一个全文检索引擎,其具有很多优点,最近用Lucene+Struts2+Spring+IBatis实现了一个企业文档内部搜索系统,将部分文档和代码和大家分享!  阅读全文

posted @ 2009-11-12 17:57 吃奶的孩子 阅读(581) | 评论 (0)编辑 收藏

CSDN版主推荐:小孔子开源OA系统部分功能源码已经发布

     摘要: 对于OA的意义,有100个人会说出100种不同层次、不同内容的解说;有100家单位会有100种不同层次、不同内容的应用需求!100个厂商会有100种不同技术类型、不同层次、不同定义的系统!本项目为一个通用系统,系统中的功能模块在各种企业中都有相同的需求。通过这些对这些需求的理解,能快速掌握企业级应用系统的开发流程。
知识范围:
需求分析,业务流程,角色权限,工作流,Ajax,JQuery等。  阅读全文

posted @ 2009-09-30 18:50 吃奶的孩子 阅读(2971) | 评论 (5)编辑 收藏

SilverLight3.0在搜索技术中的应用及SilverLight3.0新特征讲解

     摘要: 微软Silverlight是一个跨浏览器、跨客户平台的技术,能够设计、开发和发布有多媒体体验与富交互(RIA,Rich Interface Application)的网络交互程序。
  因为Silverlight提供了一个强大的平台,能够开发出具有专业图形、音频和视频的Web应用程序,增强了用户体验,所以SilverLight吸引了设计人员和开发人员的眼球。同时,Silverlight还提供了强大的工具来提高他们的工作效率。Silverlight能创建一种具有很高艺术性的应用程序,具有以下的特点:  阅读全文

posted @ 2009-09-26 09:47 吃奶的孩子 阅读(1168) | 评论 (0)编辑 收藏

Lucene从基础到实战高级应用(附带Lucene+Struts2+Spring+IBatis实现华电内部搜索项目案例)

本课程在线学习地址:http://v.youku.com/v_show/id_XMTE5Mjk5MzQ0.html

课程特色:
理论结合实践!每讲前部分先将理论,然后用代码去完全理论的实践

Lucene课程大纲:
1. Lucene概述
1.1 课程概述
1.2 认识Lucene
1.3 Lucene的经典应用
1.4 Lucene基本开发环境配置
2. Lucene系统架构
2.1 Lucene的特点
2.2 核心包及其功能介绍
2.3 Lucene核心索引类介绍
2.4 Lucene核心搜索类介绍
2.5 Lucene与关系数据库
2.6 Lucene内部实现原理
3. 索引
3.1 为什么要用索引
3.2 Lucene索引的优越性
3.3 Lucene索引建立
3.4 利用Lucene组件建立索引
3.5 删除Document
3.6 恢复删除
3.7 Document更新操作
3.8 使用RamDirectory
3.9 Document的Boost设置
3.10 索引优化
4. 搜索
4.1 简单搜索的实现
4.1.1 指定字段的搜索
4.1.2 ScoreDoc的运用
4.2 Query类的使用
4.2.1 搜索中使用TermQuery
4.2.2 搜索中使用RangeQuery
4.2.3 搜索中使用PreFixQuery
4.2.4 搜索中使用FuzzyQuery
4.2.5 搜索中使用WilcardQuery
4.2.6 搜索中使用BooleanQuery
4.4分页搜索的实现
4.3 QueryParser类的使用
4.3.1 默认的字段中检索
4.3.2 搜索中运用逻辑运算
4.3.3 前缀搜索和模糊搜索
4.3搜索的总结
5 分词
5.1 分词的基本原理
5.2 Lucene分词器的使用
5.3 中文分词
5.3.1 中文分词的基本原理
5.3.2 优秀中文分词器介绍
5.3.3在搜索中使用中文分词器
6. 解析文档
6.1 XML文件的索引
6.1.1 了解XPath
6.1.2 XML解析
6.2 PDF文档的索引
6.1 使用PDFBox处理PDF文档 
6.2 使用xpdf来处理中文PDF文档 
6.3 HTML文档索引
6.3.1 获取HTML源文档
6.3.2 使用JTidy
6.3.2 使用NekoHTML
6.3.3 使用HttpClient
6.3.4 使用HTMLParser
6.4 Word文档的索引
6.4.1 POI对Word的处理类 
6.4.2 使用Jacob来处理Word文档 
7. 高亮
7.1 高亮的基本原理
7.2 在搜索中使用高亮
8. 网络爬虫Heritrix 
8.1 Heritrix使用入门 
8.2 Heritrix的架构 
8.3 Heritrix的应用 
9项目实战-华电企业内部文档搜索系统(项目截图稍后公布)
9.1 需求说明
9.2 系统架构介绍
9.2.1 技术方案的选择
9.2.2 使用Ibatis
9.3 系统模块分析
9.4 系统开发

项目涉及技术点和内容:
知识范围:
全文检索,倒排索引,中文分词,爬虫,文档解析,ibatis等
技术选型:
Lucene+Struts2+Spring+IBatis
项目价值:
本项目是企业级的搜索系统,既可以自成体系,拿出来作为一个单独的系统里来使用;也可以集成到其他现有的系统中,成为其他系统的一个重要的模块(现在很多网站内部都集成了一个全文检索系统,很多OA系统都有一个全文检索系统)。

项目配套截图:

 

posted @ 2009-09-24 17:54 吃奶的孩子 阅读(3001) | 评论 (2)编辑 收藏