Developer
未读
借助Docker技术的Solr集群实现
在本项目中,为了更好的模拟真实的生产环境,对于SolrCloud技术不采用伪集群方式,而是真正实现一个搜索集群,当然由于笔者只是学生,没有资金租用多台服务器来搭建集群,因此借助于Docker的容器技术在一台服务器上虚拟出逻辑上的六台主机。 <!--more--> 在阅读本节之前,需要对Docker技
Developer
未读
SolrCloud基础
本节是SolrCloud基础理论知识,我也是从网上学习到,这里只是进行一些整理。参考的博客比本文更好,更有深度,有耐心的请看参考的原文-- SolrCloud之分布式索引及与Zookeeper的集成 SolrCloud基本概念 SolrCloud模式下有Cluster,Node,Collection
Developer
未读
Solr空间搜索配置及实践
前面讲了空间搜索的两个常用原理,应该还算是比较容易理解的,毕竟只是算法,并不需要我们来实现,我们通过简单地配置就可以用上Solr的空间搜索的功能。下面就来讲讲如何配置空间搜索。 <!--more--> 前面说的GeoHash和Cartesian Tiers原理,在Solr中对应的是实现分别是Geoh
Developer
未读
Solr5配置文件参数解析
Solr5的主要配置文件有solrconfig.xml和managed-schema,另外一些还有solr.xml,数据导入配置,ZooKeeper配置等。 这里详细介绍两个主要的配置文件。 <!--more--> solrconfig.xml solrconfig.xml文件是solr的主配置文件
Developer
未读
Solr整合中文分词器mmseg4j
分词的基础概念 为什么要进行分词 中文分词(Chinese Word Segmentation) 指的是将一个汉字序列切分成一个一个单独的词。 分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。我们知道,在英文的行文中,单词之间是以空格作为自然分界符的,而中文只是字、句和段能通过明显的分界
Developer
未读
Solr5.5集成到Tomcat8
也许你不熟悉Jetty,或者觉得它性能不行,你想在Tomcat上运行Solr,没问题,理论上只要是servlet容器都可以运行Solr。不过问题是从solr5开始官方不再支持Tomcat的集成,所以可以有些配置问题需要自己来解决。于是我进行了一次尝试,solr4本来是比较容易的,Solr5就出现一些
Developer
未读
【总述】用Solr构建垂直搜索引擎
用Solr构建垂直搜索系列文章 入门知识部分 垂直搜索引擎基础知识 Solr基础知识及安装 Solr5.5 集成 Tomcat8 搜集信息部分 使用Heritrix抓取数据
Developer
未读
导入Mysql数据到Solr中
一般存储数据都会用到数据库,之前十几年关系型数据库大行其道,现在非关系性数据库(NoSql)如日中天,随着数据越来越来越多,人们发现关系型数据库的性能已经不能满足需要,经历了一番挣扎,从主-从(读-写)分离,到分库分表,虽然维持了一段时间,但是数据量很快就上来了,于是NoSql越来越显示出其在大数据