Lucene从基础到实战高级(实现华电内部搜索项目)
课程目录
1. Lucene概述
1.1 课程概述
1.2 认识Lucene
1.3 Lucene的经典应用
1.4 Lucene基本开发环境配置
2. Lucene系统架构
2.1 Lucene的特点
2.2 核心包及其功能介绍
2.3 Lucene核心索引类介绍
2.4 Lucene核心搜索类介绍
2.5 Lucene与关系数据库 * b+ ], v+ ]6 J! R6 N, m6 l
2.6 Lucene内部实现原理 / |5 K! H' I. F7 l
3. 索引
3.1 为什么要用索引
3.2 Lucene索引的优越性 - G, u+ m( p w4 Z: s! e: j
3.3 Lucene索引建立 # I) B! X C; [- b/ s" R! X" W, ^
3.4 利用Lucene组件建立索引
3.5 删除Document
3.6 恢复删除
3.7 Document更新操作
3.8 使用RamDirectory 5 [0 H! i& u9 i8 G D8 _
3.9 Document的Boost设置 + M3 o, C3 w* Y' W1 x6 }: E
3.10 索引优化 # T1 C) {' [" \1 ^# ^" Z' v b+ W$ C" I# z
4. 搜索 + e( }# p& ~" U3 `
4.1 简单搜索的实现 6 r" ~4 [) V/ |' r8 _& ^2 T* A$ h- N
4.1.1 指定字段的搜索
4.1.2 ScoreDoc的运用
4.2 Query类的使用 0 {; f' l6 g2 y' e
4.2.1 搜索中使用TermQuery / K% q. {# i6 h* p
4.2.2 搜索中使用RangeQuery
4.2.3 搜索中使用PreFixQuery
4.2.4 搜索中使用FuzzyQuery 8 d9 b4 z, C9 U
4.2.5 搜索中使用WilcardQuery
4.2.6 搜索中使用BooleanQuery
4.4分页搜索的实现 : F0 S! n8 Z; Q, Q1 t4 i7 J/ t
4.3 QueryParser类的使用 5 n. @5 B* _( j. M- ?
4.3.1 默认的字段中检索 3 ^- E8 @- v7 ?
4.3.2 搜索中运用逻辑运算 ( p2 F \: }% X/ r
4.3.3 前缀搜索和模糊搜索 $ {0 I7 u0 A3 K) J. E6 S- ]
4.3搜索的总结
5 分词
5.1 分词的基本原理
5.2 Lucene分词器的使用
5.3 中文分词 $ o! p8 V) X) [* u" C
5.3.1 中文分词的基本原理
5.3.2 优秀中文分词器介绍 1 l2 y- J) m2 e5 h
5.3.3在搜索中使用中文分词器 ! R5 l9 n) w; [- p$ J9 ^, N
6. 解析文档 1 n+ p' h# Q4 K4 Q
6.1 XML文件的索引
6.1.1 了解XPath ( P* H- ~/ V% C
6.1.2 XML解析 9 q. }9 D& @: u7 R8 t' f3 H
6.2 PDF文档的索引
6.1 使用PDFBox处理PDF文档
6.2 使用xpdf来处理中文PDF文档
6.3 HTML文档索引
6.3.1 获取HTML源文档 ; Z" n* R) ~% u; |
6.3.2 使用JTidy 3 l; I) L8 _9 K
6.3.2 使用NekoHTML
6.3.3 使用HttpClient 0 v6 [! ^5 j% ]; z
6.3.4 使用HTMLParser % {! n( z) s/ m# U3 h% `3 x
6.4 Word文档的索引
6.4.1 POI对Word的处理类
6.4.2 使用Jacob来处理Word文档
7. 高亮
7.1 高亮的基本原理 * x: f; c1 {0 g3 I# c
7.2 在搜索中使用高亮 & e: j ]; l) ?
8. 网络爬虫Heritrix 2 E1 v# [, _* b) U5 t- H+ j
8.1 Heritrix使用入门
8.2 Heritrix的架构 5 g/ P% s7 ]$ h5 Y3 U( m! e
8.3 Heritrix的应用
9. 项目实战-华电企业内部文档搜索系统(项目截图稍后公布) ! [# r* I% g6 {' k* S& ]
9.1 需求说明
9.2 系统架构介绍 9 b" l' G1 P, j% D: e( M
9.2.1 技术方案的选择 ' s9 H& ]7 W7 q2 J4 |+ _
9.2.2 使用Ibatis 6 \* x) w$ u+ i6 S1 x
9.3 系统模块分析
9.4 系统开发
下载地址回复可见:
|