lucene

java-如何在Lucene中将RAMDirectory集成到FSDirectory2019-11-05 20:14:04

我现在有一个问题,关于Lucene.我试图制作一个lucene源代码,可以做索引并将其首先存储在内存中使用RAMDirectory,然后将该内存中的索引刷新到磁盘中使用FSDirectory.我已经对此代码做了一些修改,但是徒劳无功.也许有些人可以帮助我. 那么,将RAMDirectory集成到此源代码中的最佳方式
Lucene搜索/索引过程笔记2019-11-04 16:55:49

lucene索引文档过程： > 初始化IndexWriter> 构建Document> 调用IndexWriter.addDocument执行写入 > 初始化DocumentWriter。参数指定写出位置为内存 > 生成自增段ID > 调用DocumentWriter.addDocument(); 执行写入 > 写出FieldInfos到内存 > 写出FieldValu
java-休眠搜索在索引中存储byte []2019-11-02 05:02:34

我的POJO中有以下配置： @Field(index = Index.NO, store = Store.YES) private byte[] file; 启动我的Apps容器时,出现以下异常： Caused by: org.hibernate.search.SearchException: Unable to guess FieldBridge for file at org.hibernate.search.bridge.BridgeFactory.
lucene standardanalyzer是否删除停用词并具有词干功能？2019-11-01 15:14:16

我已经使用indexWriter测试了standardanalyzer,发现它会自动删除停用词,但是,我没有添加停用词列表,因为以下代码是我使用的代码 StandardAnalyzer analyzer = new StandardAnalyzer(Version.LUCENE_35); IndexWriterConfig config =new IndexWriterConfig(Version.LUCEN
java-如何在相关实体中搜索(休眠搜索)2019-10-31 20:03:14

我无处可试.我的要求是按记录名称搜索记录以下是我的相关课程： RecordFolderAnalysis.java @Indexed public class RecordFolderAnalysis extends AuditableEntity implements Serializable { @ManyToOne @JoinColumn(name = "arrivalId", nullable = false) @Contai
java-Solr：当使用多个单词查询字段时,默认的OR运算符返回不相关的结果2019-10-31 06:04:41

如果所有搜索关键字都出现在任何搜索字段中的任何位置,则需要使基于Solr的搜索返回结果. 目前的情况：搜索查询示例：关键字：“柏林房子约翰”名称：“柏林房子约翰”名称”作者：“柏林房子约翰”名称” 让我们假设只有一个结果,其中keyword =“ house”,name =“ berlin”和author =“ jo
java-在Lucene中关闭词干2019-10-29 16:00:34

我需要关闭EnglishAnalyzer或其他类似分析器的词干(例如,ItalianAnalyzer等).我正在使用Lucene 3.6.2,我发现只能指定一组不应词干的单词使用此构造函数： EnglishAnalyzer documentation – stemExclusionSet 我能怎么做？解决方法:通常,当您使用特定于语言的分析时,这是因为您想要词
在Java / MySQL / Hibernate Search / Lucene环境中建议标签2019-10-29 13:24:31

我正在开发一个基于Web的应用程序,该应用程序使我们的用户可以发布典型的博客/微博客/论坛类型的帖子,而我们遇到的一个问题是我们的用户并不是经常标记其内容.由于标签在我们的应用中非常重要,原因有几个,因此我们希望带动用户走向标签行为. 我们实施了哈希标记,这似乎起到了一定
何时使用Lucene /休眠搜索2019-10-29 04:24:11

我正在开发一个具有不同类型搜索的应用程序,其中一些是对MYSQL数据库中多个列的全文搜索,并且我正在使用Hibernate Search(内部使用Lucene)进行搜索. 现在我的问题是在简单的数据库搜索不是全文的情况下该怎么办. select * from table1,table2 where table1.col1='testval' and ta
java-Hibernate Search 5.X是否可以对@Id字段使用数字编码2019-10-28 02:01:21

从4.5版升级到Hibernate Search 5之前,我们的系统将所有文档ID索引为数字字段： @Entity public class Staff { @Id @NumericField protected Long id; // other fields } 这使我们可以使用数字范围查询.在Hibernate 5中,所有文档ID都被索引为字符串,并且上面的注
java-如何执行多字段-Lucene中的词组搜索？2019-10-23 14:03:49

标题问了这一切…我想在Lucene中进行多字段词组搜索. 例如：我的字段为String s [] = {“ title”,“ author”,“ content”};我想搜索所有领域的哈利波特.我该怎么办？有人可以提供示例片段吗？解决方法:>使用MultiFieldQueryParser,它是一个QueryParser,它构造查询以搜索多个字段.>
什么是全文检索2019-10-21 09:54:03

全文检索技术被广泛的应用于搜索引擎，查询检索等领域。我们在网络上的大部分搜索服务都用到了全文检索技术。对于数据量大、数据结构不固定的数据可采用全文检索方式搜索，比如百度、Google等搜索引擎、论坛站内搜索、电商网站站内搜索等。什么是全文检索呢？先看一下百度百科的专业
Lucene&Solr框架之第一篇2019-10-20 18:03:14

2.信息检索信息检索是计算机世界中非常重要的一种功能。信息检索不仅仅是指从数据库检索数据，还包括从文件、网页、邮件、用户手输入的内容中检索数据。通过怎样的高效方式将用户想要的信息快速提取出来，是计算机技术人员研究的重点方向之一。 2.1.数据分类我们生活中的数据
Lucene&Solr框架之第三篇2019-10-20 18:01:21

1、SolrCore的配置 a)schma.xml文件 b)配置中文分析器 2、配置业务域和批量索引导入 a)配置业务域 b)批量索引导入 c)Solrj复杂查询（用Query页面复杂查询、用程序实现） 3、京东案例（简单的站内搜索实现） 2.SolrCore的配置(
Lucene&Solr框架之第二篇2019-10-20 18:00:26

2.1.开发环境准备 2.1.1.数据库jar包我们这里可以尝试着从数据库中采集数据，因此需要连接数据库，我们一直用MySQL，所以这里需要MySQL的jar包 2.1.2.MyBatis的jar包（可选）从数据库采集数据就需要查询数据库，我们可以用jdbc原生的写DAO，还可以使用我们之前
Lucene2019-10-18 10:52:04

一. 什么是全文检索数据分类我们生活中的数据总体分为两种：结构化数据和非结构化数据。结构化数据：指具有固定格式或有限长度的数据，如数据库，元数据等。非结构化数据：指不定长或无固定格式的数据，如邮件，word文档等磁盘上的文件有序列表项二有序列表项三有序列表项一有序列
Lucene笔记2019-10-14 13:01:41

Lucene是什么 Lucene是一个开源的全文检索引擎工具包, 但它不是一个完整的全文检索引擎, 而是一个全文检索引擎的架构, 提供了完整的查询引擎和搜索引擎以及部分文本分析引擎。可以把它理解成一个信息检索程序库, 而不是应用产品, 具体的功能需要使用者自己去以代码实现。 Luce
java-从Lucene搜索结果中显示示例文本2019-10-14 00:03:29

当前,我正在使用Lucene 3.0.2版创建类似于字典的搜索应用程序.我要显示的对象之一是一种“示例”,其中Lucene将在书中寻找一个单词,然后显示使用该单词的句子. 我一直在阅读《 Lucene in Action》一书,其中提到了类似的内容,但通过浏览我找不到其他提及.这是Lucene可以做的事情吗？如
Elasticsearch 学习笔记1-基本概念2019-10-12 19:55:28

Elasticsearch 是一个分布式的搜索和分析引擎，可以用于全文检索、结构化检索和分析，并能将这三者结合起来。Elasticsearch 基于 Lucene 开发，是 Lucene 的封装，提供了 REST API 的操作接口，开箱即用。现在是使用最广的开源搜索引擎之一，Wikipedia、Stack Overflow、GitHub 等都基于 El
java-Lucene与EclipseLink的集成2019-10-12 12:00:37

我正在尝试将Lucene与EclipseLink结合使用,并想知道那里是否有任何好的集成库？我已经看过太阳耀斑,看起来像石灰,它可以满足我的要求,但是它已经过时了(尽管我使用的是EclipseLink的较旧版本,但我使用的是Lucene 4.10)这可能有用,但是我找不到任何文档,有关如何使用它的示例或教程.
经常更新索引的FieldCache2019-10-11 20:01:32

你好我的Lucene索引经常用新记录更新,索引中有5,000,000条记录,并且正在使用FieldCache缓存我的一个数字字段.但是在更新索引之后,需要花费一些时间来重新加载FieldCache(即重新加载缓存,导致文档说DocID不可靠),所以我如何通过仅将新添加的DocID添加到FieldCache来最小化此开销,
c-使用整数列表文档进行全文搜索的最佳方法2019-10-09 19:17:25

我正在基于相似性的C / Qt图像检索系统上进行工作,其工作方式如下(我将尽量避免不相关或偏离主题的细节)：我收集图像并使用OpenCV函数从图像中建立索引.之后,对于每个图像,我得到一个代表每个图像所属的重要“类”的整数值列表.两个图像的共同点越多,它们被认为越相似. 因此,当我要
java-如何在Lucene中仅标记某些单词2019-10-09 16:05:10

我正在为项目使用Lucene,并且需要自定义分析器. 代码是： public class MyCommentAnalyzer extends Analyzer { @Override protected TokenStreamComponents createComponents( String fieldName, Reader reader ) { Tokenizer source = new StandardTokenizer( Version
java – Lucene区分大小写和不敏感的搜索2019-10-08 01:03:01

我有一个Lucene索引,目前区分大小写.我想添加一个不区分大小写的搜索选项作为后备.这意味着与案例匹配的结果将获得更多权重并将首先出现.例如,如果结果数量限制为10,并且有10个匹配我的情况,这就足够了.如果我只找到7个结果,我可以从不区分大小写的搜索中添加3个结果. 我的情况实
如何使用TermVector Lucene 4.02019-10-04 11:10:06

在索引方法中,我使用以下行： Field contentsField = new Field("contents", new FileReader(f), Field.TermVector.YES); 但是,在Lucene 4.0中,不推荐使用此构造函数,而应使用新的TextField而不是新的Field. 但是TextField的问题在于它在构造函数中不接受TermVector. 有没有办法在

首页 < 5 6 7 8 > 尾页

ICode9

java-如何在Lucene中将RAMDirectory集成到FSDirectory2019-11-05 20:14:04

Lucene搜索/索引过程笔记2019-11-04 16:55:49

java-休眠搜索在索引中存储byte []2019-11-02 05:02:34

lucene standardanalyzer是否删除停用词并具有词干功能？2019-11-01 15:14:16

java-如何在相关实体中搜索(休眠搜索)2019-10-31 20:03:14

java-Solr：当使用多个单词查询字段时,默认的OR运算符返回不相关的结果2019-10-31 06:04:41

java-在Lucene中关闭词干2019-10-29 16:00:34

在Java / MySQL / Hibernate Search / Lucene环境中建议标签2019-10-29 13:24:31

何时使用Lucene /休眠搜索2019-10-29 04:24:11

java-Hibernate Search 5.X是否可以对@Id字段使用数字编码2019-10-28 02:01:21

java-如何执行多字段-Lucene中的词组搜索？2019-10-23 14:03:49

什么是全文检索2019-10-21 09:54:03

Lucene&Solr框架之第一篇2019-10-20 18:03:14

Lucene&Solr框架之第三篇2019-10-20 18:01:21

Lucene&Solr框架之第二篇2019-10-20 18:00:26

Lucene2019-10-18 10:52:04

Lucene笔记2019-10-14 13:01:41

java-从Lucene搜索结果中显示示例文本2019-10-14 00:03:29

Elasticsearch 学习笔记1-基本概念2019-10-12 19:55:28

java-Lucene与EclipseLink的集成2019-10-12 12:00:37

经常更新索引的FieldCache2019-10-11 20:01:32

c-使用整数列表文档进行全文搜索的最佳方法2019-10-09 19:17:25

java-如何在Lucene中仅标记某些单词2019-10-09 16:05:10

java – Lucene区分大小写和不敏感的搜索2019-10-08 01:03:01

如何使用TermVector Lucene 4.02019-10-04 11:10:06