Developer
未读
Solr5.5集成到Tomcat8
也许你不熟悉Jetty,或者觉得它性能不行,你想在Tomcat上运行Solr,没问题,理论上只要是servlet容器都可以运行Solr。不过问题是从solr5开始官方不再支持Tomcat的集成,所以可以有些配置问题需要自己来解决。于是我进行了一次尝试,solr4本来是比较容易的,Solr5就出现一些
Developer
未读
使用Heritrix抓取数据
Heritrix 是一个由 java 开发的、开源的网络爬虫,用户可以使用它来从网上抓取想要的资源。其最出色之处在于它良好的可扩展性,方便用户实现自己的抓取逻辑。最重要是对于一般的抓取,你是不用碰任何代码的,只要写好配置文件就可以了,简直就是某些人的福音。不过对于一个真正的程序员,代码可是他们的整个
Developer
未读
Solr基础知识及安装
Solr的身世 引用Solr官网的slogan,blazing-fast一词可见一斑。 Solr is the popular, blazing-fast, open source enterprise search platform built on Apache Lucene™. 再来看看它的特
Developer
未读
垂直搜索引擎基础知识
引言/废话 搜索引擎是大家平时使用最广泛的网络应用之一,它是普通网民接触互联网的入口,也是网络信息的搜集系统,其重要性不言而喻。我认为一个优秀的搜索服务应该实现一些基本的要求: 准确回应用户搜索目的 提供公正的结果排序 然而,目前最大的中文搜索引擎,在经历了血友病吧事件、魏则西事件之后,网民已经失去
Developer
未读
【总述】用Solr构建垂直搜索引擎
用Solr构建垂直搜索系列文章 入门知识部分 垂直搜索引擎基础知识 Solr基础知识及安装 Solr5.5 集成 Tomcat8 搜集信息部分 使用Heritrix抓取数据
Developer
未读
基于Docker的开源视频分享系统解决方案
序言: 学校之前有个视频分享站点,用的是CC视频的系统,买的源码,后来服务器被黑掉了,存储服务器被格了,好几T的视频都没了,挺心疼人的。绊倒还是要站起来的,准备重新搭建视频系统,可是CC的系统已经太老了,对环境要求很苛刻,要求系统是redhat 5.4,php版本不能大于5.2,还有mysql也有特
Developer
未读
导入Mysql数据到Solr中
一般存储数据都会用到数据库,之前十几年关系型数据库大行其道,现在非关系性数据库(NoSql)如日中天,随着数据越来越来越多,人们发现关系型数据库的性能已经不能满足需要,经历了一番挣扎,从主-从(读-写)分离,到分库分表,虽然维持了一段时间,但是数据量很快就上来了,于是NoSql越来越显示出其在大数据
Developer
未读
解决新疆地区百度网盘分享链接不能用
写在前面 新疆的网络封锁,我在之前一篇 Github在新疆用不了的问题 中也讲过了,政治问题不再重提。可是我们只能看内地的小伙伴快乐地分享文件,我们只能出来 Error400,岂不痛哉!!下面方法要求有一定的 接入国际互联网 的技能。 Fuck 百度云盘 那么怎么才能正确打开百度云的分享链接呢? <
Developer
未读
Ghost博客系统的一些笔记
我决定将博客分开,主站 用Ghost,是技术无关的内容,记录一些生活、想法,而Payne's Blog 是用的Hexo,都是我的原创技术博客。 简单写一下,有时间再详细补充 <!--more--> Node.js更新到4.2.x 我用的是nvm(Node Version Manager)来更新的,还
Developer
未读
github在新疆用不了的问题
新疆一直是GFW的实验区,甚至国内的很多网站也跟着遭殃,百度网盘分享链接、酷我、唱吧、github挂掉,再接着CSDN、cnblog相继挂掉,这里也不想探讨原因,大家都懂的。可怜了在新疆上学的孩子,本来新疆的师资力量都够烂了,还要增高学生的信息获取门槛。虽然我就要离开这个地方,但依然为在新疆上学的孩