Lucene检索文件包裹txt,jsp,html格式(如果是word和pdf格式需要进行格式转化)
建立索引文件的代码如下:
import org.apache.lucene.index.*;
import org.apache.lucene.analysis.standard.*;
import org.apache.lucene.document.*;
import java.io.*;
/**
* @author Eric Zhang
*/
public class IndexFiles {
public static void main(String[] args) {
try{
IndexWriter writer = new IndexWriter("myindex", new StandardAnalyzer(), true);
File files = new File("mydoc");
String[] Fnamelist = files.list();
for (int i = 0; i < Fnamelist.length; i++){
File file = new File(files,Fnamelist[i]);
Document doc = new Document();
Field fld = Field.Text("path", file.getPath());
doc.add(fld);
fld = Field.Keyword("modified", DateField.timeToString(file.lastModified()));
doc.add(fld);
FileInputStream in = new FileInputStream(file);
Reader reader = new BufferedReader(new InputStreamReader(in));
fld = Field.Text("contents", reader);
doc.add(fld);
writer.addDocument(doc);
System.out.println("Added : " + doc.get("path"));
}
writer.optimize();
writer.close();
System.out.println("Has Added Total: " + Fnamelist.length);
}catch(Exception e){
System.out.println(e);
}
}
}
检索索引的java代码如下:
import org.apache.lucene.analysis.*;
import org.apache.lucene.analysis.standard.*;
import org.apache.lucene.search.*;
import org.apache.lucene.queryParser.*;
import org.apache.lucene.document.*;
//import com.augmentum.hrms.*;
import java.util.Date;
/**
* @author Eric Zhang
*/
public class SearchFile {
public static void main(String[] args) {
//XMap a = new XMap("");
Analyzer anlzr = new StandardAnalyzer();
try{
Query q = QueryParser.parse("数据库", "contents", anlzr);
System.out.println("Searching for : " + q.toString("contents"));
Searcher serch = new IndexSearcher("myindex");
Hits hts = serch.search(q);
for(int i=0; i<hts.length(); i++){
Document doc = hts.doc(i);
String path = doc.get("path");
System.out.println("Find: " +i+": "+ path);
System.out.println("Find: " + doc.get("modified"));
System.out.println("Find: " + doc.get("path"));
}
System.out.println("Find Total: " + hts.length());
}catch(Exception e){
System.out.println(e);
}
}
}
分享到:
相关推荐
基于Lucene5.5的检索代码,不包括Lucene包。包含高亮展示以及其他索引创建等操作代码,供参考
基于struts2的全文检索系统,实现了文件上传和下载,并实现对上传的文件进行检索。
利用Lucene接口编写简单的信息检索系统,实现对本地目录建立索引和搜索功能。代码包含两个JSP页面,放入tomcat的webapp目录中即可在浏览器中运行程序。选择文档路径时如若涉及浏览器权限问题,可直接输入。
基于SpringBoot编写的一个Lucene测试Demo把匹配到的结果高亮摘要显示在前端jsp上
(1)支持桌面文件搜索,格式包括txt、doc、xls和ppt; (2)支持分词查询 (3)支持全文搜索 (4)能够高亮显示搜索关键字 (5)显示查询所用的时间 (6)显示搜索历史、过滤关键字 数据库:SQL Server 使用...
对学习lucene开发的人员来说这个项目非常有价值 值得参考">项目的页面都存在WebRoot WEB INF jsp下 网上搜索博客园网页的地址 输入到相应搜索框 该项目可以自动对博客园网站中的文章 项目中限制了文章数量 建立...
我们深入探讨了深度学习的基本原理、神经网络的应用、自然语言处理、语言模型、文本分类、信息检索等领域。更有深度学习、机器学习、自然语言处理和计算机视觉的实战项目源码,助您从理论走向实践,如果您已有一定...
整体思路 在实现新闻信息检索系统时首先进行了信息采集,信息采集结束之后使用 Lucene 提供的 api 构建索引库, 前端使用 jsp 接收用户查询,在后台使用 servlet 对用户查询进 行分词处理,之后到索引库中进行文档匹配, ...
这个系统是专为毕业设计或课程设计而设计的,其中包含了完整的JSP或Java源代码文件包,方便学习和使用。该系统利用了Lucene强大的全文搜索引擎功能,能够对大量的公交信息进行有效的索引和搜索,提供快速准确的查询...
地精搜索一个简单的检索系统,使用了jsp,lucene等技术,实现的功能很简陋,但是代码还算清爽,适合初学者交流学习。简述:从知识的网上上获取了500篇文章的标题录,是关于马克思主义哲学领域的,检索词为:“马克思...
使用lucene索引,要求index文件夹文件不能被破坏,但可以在里面增加文件(不能覆 盖),不推荐使用名字和lucene索引文件一样名字的文件 2.2运行环境 JVM tomcatwin2000或更高 2.2.1支持软件 需求环境 JDK, lucene包 ...
用Lucene包提供的接口,实现了一个简单的搜索引擎,供大家参考
BIZOSS-CMS就解决了这一系列的烦恼,只需要了解一些BIZOSS-CMS的模板标记,只要懂HTML,就能随意对模板文件进行修改,而且每次升级只需要更新模板文件即可,做到了程序和页面很大程度上的分离 特点: 基于JAVA的轻...
解决jsp中假死机的问题Lucene是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎。Lucene以其方便使用、快速实施以及灵活性受到广泛的关注。它可以方便地嵌入到各种应用中实现针对应用的全文索引、检索功能...
Web信息检索与处理课程实验1——一个简易的搜索引擎 实验内容 利用Lucene等工具建立简单的搜索引擎: 1.网页预处理 2.创建索引(使用中科院中文分词工具ICTCLAS) 3.查询(实现简单的查询界面) 实验环境 编译...
主要技术:SpringMVC3.2、Spring3.2、JPA2.0、JSP2.0、Freemarker2.3、Spring Data JPA,QueryDSL、Shiro、Lucene等。 技术亮点:JPA、Spring Data JPA、QueryDSL组成的无比简洁高效的持久化技术;Shiro安全框架;...
基于 Lucene 的全文检索技术,搜索性能优异 采用 DIV + CSS 设计网站模板页面,使用户可灵活定义博客模板 插件式开发架构,可持续扩展 URL结构优化,利于搜索引擎收录 静态化信息,分布式部署,性能可控
本项目旨在通过Lucene库的强大功能,实现一个高效、精准的搜索引擎。该引擎能够对海量文档进行快速索引和检索,提供全文搜索、关键词高亮显示、多条件过滤等实用功能。同时,系统支持用户自定义搜索规则,满足不同...
使用Lucene全文检索框架进行文件的搜索,MyCat中间件处理分布式数据库和分布式事务问题等问题,OpenOfiice技术对office文件转换为swf文件时数据内容的提取,页面采用JSP+HTML+CSS+DIV等技术,Ajax进行请求的异步发送...
Java访问权限控制,为Java操作文件、写入文件分配合适的权限,定义写到文件的信息、定义文件,输出到c:/hello.txt、写信息到文件、关闭输出流。 Java绘制图片火焰效果 1个目标文件 摘要:Java源码,图形操作,火焰...