ICode9

精准搜索请尝试: 精确搜索
  • java-如何在Lucene中将RAMDirectory集成到FSDirectory2019-11-05 20:14:04

    我现在有一个问题,关于Lucene.我试图制作一个lucene源代码,可以做索引并将其首先存储在内存中 使用RAMDirectory,然后将该内存中的索引刷新到磁盘中使用FSDirectory.我已经对此代码做了一些修改,但是徒劳无功.也许有些人可以帮助我. 那么,将RAMDirectory集成到此源代码中的最佳方式

  • Lucene搜索/索引过程笔记2019-11-04 16:55:49

    lucene索引文档过程: > 初始化IndexWriter> 构建Document> 调用IndexWriter.addDocument执行写入 > 初始化DocumentWriter。参数指定写出位置为内存 > 生成自增段ID > 调用DocumentWriter.addDocument(); 执行写入 > 写出FieldInfos到内存 > 写出FieldValu

  • java-休眠搜索在索引中存储byte []2019-11-02 05:02:34

    我的POJO中有以下配置: @Field(index = Index.NO, store = Store.YES) private byte[] file; 启动我的Apps容器时,出现以下异常: Caused by: org.hibernate.search.SearchException: Unable to guess FieldBridge for file at org.hibernate.search.bridge.BridgeFactory.

  • lucene standardanalyzer是否删除停用词并具有词干功能?2019-11-01 15:14:16

    我已经使用indexWriter测试了standardanalyzer,发现它会自动删除停用词,但是,我没有添加停用词列表,因为以下代码是我使用的代码 StandardAnalyzer analyzer = new StandardAnalyzer(Version.LUCENE_35); IndexWriterConfig config =new IndexWriterConfig(Version.LUCEN

  • java-如何在相关实体中搜索(休眠搜索)2019-10-31 20:03:14

    我无处可试.我的要求是按记录名称搜索记录 以下是我的相关课程: RecordFolderAnalysis.java @Indexed public class RecordFolderAnalysis extends AuditableEntity implements Serializable { @ManyToOne @JoinColumn(name = "arrivalId", nullable = false) @Contai

  • java-Solr:当使用多个单词查询字段时,默认的OR运算符返回不相关的结果2019-10-31 06:04:41

    如果所有搜索关键字都出现在任何搜索字段中的任何位置,则需要使基于Solr的搜索返回结果. 目前的情况: 搜索查询示例:关键字:“柏林房子约翰”名称:“柏林房子约翰”名称”作者:“柏林房子约翰”名称” 让我们假设只有一个结果,其中keyword =“ house”,name =“ berlin”和author =“ jo

  • java-在Lucene中关闭词干2019-10-29 16:00:34

    我需要关闭EnglishAnalyzer或其他类似分析器的词干(例如,ItalianAnalyzer等).我正在使用Lucene 3.6.2,我发现只能指定一组不应词干的单词使用此构造函数: EnglishAnalyzer documentation – stemExclusionSet 我能怎么做?解决方法:通常,当您使用特定于语言的分析时,这是因为您想要词

  • 在Java / MySQL / Hibernate Search / Lucene环境中建议标签2019-10-29 13:24:31

    我正在开发一个基于Web的应用程序,该应用程序使我们的用户可以发布典型的博客/微博客/论坛类型的帖子,而我们遇到的一个问题是我们的用户并不是经常标记其内容.由于标签在我们的应用中非常重要,原因有几个,因此我们希望带动用户走向标签行为. 我们实施了哈希标记,这似乎起到了一定

  • 何时使用Lucene /休眠搜索2019-10-29 04:24:11

    我正在开发一个具有不同类型搜索的应用程序,其中一些是对MYSQL数据库中多个列的全文搜索,并且我正在使用Hibernate Search(内部使用Lucene)进行搜索. 现在我的问题是在简单的数据库搜索不是全文的情况下该怎么办. select * from table1,table2 where table1.col1='testval' and ta

  • java-Hibernate Search 5.X是否可以对@Id字段使用数字编码2019-10-28 02:01:21

    从4.5版升级到Hibernate Search 5之前,我们的系统将所有文档ID索引为数字字段: @Entity public class Staff { @Id @NumericField protected Long id; // other fields } 这使我们可以使用数字范围查询.在Hibernate 5中,所有文档ID都被索引为字符串,并且上面的注

  • java-如何执行多字段-Lucene中的词组搜索?2019-10-23 14:03:49

    标题问了这一切…我想在Lucene中进行多字段词组搜索. 例如 : 我的字段为String s [] = {“ title”,“ author”,“ content”};我想搜索所有领域的哈利波特.我该怎么办? 有人可以提供示例片段吗?解决方法:>使用MultiFieldQueryParser,它是一个QueryParser,它构造查询以搜索多个字段.>

  • 什么是全文检索2019-10-21 09:54:03

    全文检索技术被广泛的应用于搜索引擎,查询检索等领域。我们在网络上的大部分搜索服务都用到了全文检索技术。 对于数据量大、数据结构不固定的数据可采用全文检索方式搜索,比如百度、Google等搜索引擎、论坛站内搜索、电商网站站内搜索等。 什么是全文检索呢?先看一下百度百科的专业

  • Lucene&Solr框架之第一篇2019-10-20 18:03:14

    2.信息检索 信息检索是计算机世界中非常重要的一种功能。信息检索不仅仅是指从数据库检索数据,还包括从文件、网页、邮件、用户手输入的内容中检索数据。通过怎样的高效方式将用户想要的信息快速提取出来,是计算机技术人员研究的重点方向之一。 2.1.数据分类 我们生活中的数据

  • Lucene&Solr框架之第三篇2019-10-20 18:01:21

    1、SolrCore的配置 a)schma.xml文件 b)配置中文分析器 2、配置业务域和批量索引导入 a)配置业务域 b)批量索引导入 c)Solrj复杂查询(用Query页面复杂查询、用程序实现) 3、京东案例(简单的站内搜索实现) 2.SolrCore的配置(

  • Lucene&Solr框架之第二篇2019-10-20 18:00:26

    2.1.开发环境准备 2.1.1.数据库jar包 我们这里可以尝试着从数据库中采集数据,因此需要连接数据库,我们一直用MySQL,所以这里需要MySQL的jar包 2.1.2.MyBatis的jar包(可选) 从数据库采集数据就需要查询数据库,我们可以用jdbc原生的写DAO,还可以使用我们之前

  • Lucene2019-10-18 10:52:04

    一. 什么是全文检索 数据分类 我们生活中的数据总体分为两种:结构化数据和非结构化数据。 结构化数据:指具有固定格式或有限长度的数据,如数据库,元数据等。 非结构化数据:指不定长或无固定格式的数据,如邮件,word文档等磁盘上的文件 有序列表项 二 有序列表项 三 有序列表项 一 有序列

  • Lucene笔记2019-10-14 13:01:41

    Lucene是什么 Lucene是一个开源的全文检索引擎工具包, 但它不是一个完整的全文检索引擎, 而是一个全文检索引擎的架构, 提供了完整的查询引擎和搜索引擎以及部分文本分析引擎。可以把它理解成一个信息检索程序库, 而不是应用产品, 具体的功能需要使用者自己去以代码实现。 Luce

  • java-从Lucene搜索结果中显示示例文本2019-10-14 00:03:29

    当前,我正在使用Lucene 3.0.2版创建类似于字典的搜索应用程序.我要显示的对象之一是一种“示例”,其中Lucene将在书中寻找一个单词,然后显示使用该单词的句子. 我一直在阅读《 Lucene in Action》一书,其中提到了类似的内容,但通过浏览我找不到其他提及.这是Lucene可以做的事情吗?如

  • Elasticsearch 学习笔记1-基本概念2019-10-12 19:55:28

      Elasticsearch 是一个分布式的搜索和分析引擎,可以用于全文检索、结构化检索和分析,并能将这三者结合起来。Elasticsearch 基于 Lucene 开发,是 Lucene 的封装,提供了 REST API 的操作接口,开箱即用。现在是使用最广的开源搜索引擎之一,Wikipedia、Stack Overflow、GitHub 等都基于 El

  • java-Lucene与EclipseLink的集成2019-10-12 12:00:37

    我正在尝试将Lucene与EclipseLink结合使用,并想知道那里是否有任何好的集成库?我已经看过太阳耀斑,看起来像石灰,它可以满足我的要求,但是它已经过时了(尽管我使用的是EclipseLink的较旧版本,但我使用的是Lucene 4.10)这可能有用,但是我找不到任何文档,有关如何使用它的示例或教程.

  • 经常更新索引的FieldCache2019-10-11 20:01:32

    你好 我的Lucene索引经常用新记录更新,索引中有5,000,000条记录,并且正在使用FieldCache缓存我的一个数字字段.但是在更新索引之后,需要花费一些时间来重新加载FieldCache(即重新加载缓存,导致文档说DocID不可靠),所以我如何通过仅将新添加的DocID添加到FieldCache来最小化此开销,

  • c-使用整数列表文档进行全文搜索的最佳方法2019-10-09 19:17:25

    我正在基于相似性的C / Qt图像检索系统上进行工作,其工作方式如下(我将尽量避免不相关或偏离主题的细节): 我收集图像并使用OpenCV函数从图像中建立索引.之后,对于每个图像,我得到一个代表每个图像所属的重要“类”的整数值列表.两个图像的共同点越多,它们被认为越相似. 因此,当我要

  • java-如何在Lucene中仅标记某些单词2019-10-09 16:05:10

    我正在为项目使用Lucene,并且需要自定义分析器. 代码是: public class MyCommentAnalyzer extends Analyzer { @Override protected TokenStreamComponents createComponents( String fieldName, Reader reader ) { Tokenizer source = new StandardTokenizer( Version

  • java – Lucene区分大小写和不敏感的搜索2019-10-08 01:03:01

    我有一个Lucene索引,目前区分大小写.我想添加一个不区分大小写的搜索选项作为后备.这意味着与案例匹配的结果将获得更多权重并将首先出现.例如,如果结果数量限制为10,并且有10个匹配我的情况,这就足够了.如果我只找到7个结果,我可以从不区分大小写的搜索中添加3个结果. 我的情况实

  • 如何使用TermVector Lucene 4.02019-10-04 11:10:06

    在索引方法中,我使用以下行: Field contentsField = new Field("contents", new FileReader(f), Field.TermVector.YES); 但是,在Lucene 4.0中,不推荐使用此构造函数,而应使用新的TextField而不是新的Field. 但是TextField的问题在于它在构造函数中不接受TermVector. 有没有办法在

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有