elasticsearch和analysis-ik的安装使用

2019-04-30 11:23:36

参考地址 elasticsearch和analysis-ik的安装使用

全文搜索和中文分词主要介绍了两组全文搜索加中文分词方案;
TNTSearch+jieba-php这套组合对于博客这类的小项目基本够用了;
但是如果最求性能追求更强大的功能的话;
那更优的选择就非 elasticsearch 莫属了;
elasticsearch 需要 java8 以上;
这里安装最新版的 java10 ;
下载 jdk

wget --no-cookies --no-check-certificate --header "Cookie: gpw_e24=http:%2F%2Fwww.oracle.com%2F; oraclelicense=accept-securebackup-cookie" "http://download.oracle.com/otn-pub/java/jdk/10.0.1+10/fb4372174a714e6b8c52526dc134031e/jdk-10.0.1_linux-x64_bin.rpm"

Bash

Copy

因为版本会一直升级;
如果执行上面这段代码返回了 ERROR 404: Not Found ;
那说明有新版本了;
那就自己去官网复制最新的下载链接;
http://www.oracle.com/technetwork/java/javase/downloads/jdk10-downloads-4416644.html ;


选中 Accept License Agreement 然后在 jdk-10.0.1_linux-x64_bin.rpm 上右键复制链接地址;
替换上面命令中的下载链接;


安装 jdk 注意文件名要跟链接中的保持一直;

sudo rpm -ivh jdk-10.0.1_linux-x64_bin.rpm

Bash

Copy

能查看到版本号则表示安装成功;

java -version

Bash

Copy

下载 elasticsearch ;

wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-6.2.4.rpm

Bash

Copy

安装 elasticsearch ;

sudo rpm -ivh elasticsearch-6.2.4.rpm

Bash

Copy

安装完成后编辑配置项

vim /etc/elasticsearch/elasticsearch.yml

Bash

Copy

去掉下面三行的注释;

bootstrap.memory_lock: truenetwork.host: 192.168.0.1
http.port: 9200

Bash

Copy

然后把 network.host 改成 localhost


启动 elasticsearch ;

sudo systemctl daemon-reloadsudo systemctl enable elasticsearch.servicesudo systemctl start elasticsearch

Bash

Copy

稍等片刻给 elasticsearch 个启动的时间;
因为 elasticsearch 启动的略慢;
后续涉及到重启 elasticsearch 的时候也都记得稍等片刻;

然后查看 9200 端口检查是否成功启动;

netstat -plntu

Bash

Copy


如果半天过后仍然没有启动起来;
可能是内存不够出错;

vim /etc/elasticsearch/jvm.options

Bash

Copy

把内存改为自己服务器内存的一半以下;
比如说这里改为 512M ;


尝试启动;


sudo systemctl restart elasticsearch

Bash

Copy

查看状态是否正常;

curl 'localhost:9200'

Bash

Copy


至此 elasticsearch 算是安装完成了;
但是如果想用来搜索中文;
还需要安装中文分词;
怎么算分词呢?
全文搜索和中文分词 文章中已经简单介绍过了;
这里我们从 elasticsearch 实战一遍;
比如说 白俊遥技术博客 这句话;
elasticsearch内置的分词器对中文相当不友好;
只会一个只一个字的分;

curl -H 'Content-Type: application/json'  -XGET 'localhost:9200/_analyze?pretty' -d '{"text":"白俊遥技术博客"}'

Bash

Copy


所以我们需要一个中文分词器;
这里选择和 elasticsearch 配套的 ik-analyzer ;

安装 ik-analyzer ;

/usr/share/elasticsearch/bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.2.4/elasticsearch-analysis-ik-6.2.4.zip

Bash

Copy

如果报下面这种错误的话可能是网络不好;

Exception in thread "main" java.net.ConnectException: Connection timed out (Connection timed out)at java.base/jdk.internal.reflect.NativeConstructorAccessorImpl.newInstance0(Native Method)

Bash

Copy

沐浴更衣大念帅白最帅;
再试几次即可;

然后重新启动下服务;

sudo systemctl restart elasticsearch

Bash

Copy

看下 ik-analyzer 的效果;

curl -H 'Content-Type: application/json'  -XGET 'localhost:9200/_analyze?pretty' -d '{"analyzer":"ik_max_word","text":"白俊遥技术博客"}'

Bash

Copy


我们可以看到 技术 和 博客 两个词语已经成功组合到了一起;
然而本博主 白俊遥 的名字被硬生生的拆成了3个字这怎么忍;


还好强大的 analysis-ik 支持自定义词库;
增加自定义词库;

vim /etc/elasticsearch/analysis-ik/IKAnalyzer.cfg.xml

Bash

Copy


增加一个 白俊遥 到词库;


echo '白俊遥' > /etc/elasticsearch/analysis-ik/baijunyao.dic

Bash

Copy

重新启动下服务;

sudo systemctl restart elasticsearch

Bash

Copy

再看下分词效果 ;

curl -H 'Content-Type: application/json'  -XGET 'localhost:9200/_analyze?pretty' -d '{"analyzer":"ik_max_word","text":"白俊遥技术博客"}'

Bash

Copy


  • 2020-03-16 15:57:53

    nuxtjs中单独引入Message组件的问题

    // 引入elementUIimport { Message } from 'element-ui';//由于Message组件并没有install 方法供Vue来操作的,是直接返回的,因此按照官方文档单独引入的方法是//会报错的,需要给 Message 添加 install 方法Message.install = function (Vue, options) {Vue.prototype.$message = Message}Vue.use(Message )//消息提示

  • 2020-03-16 16:03:20

    css的var()函数

     随着sass,less预编译的流行,css也随即推出了变量定义var函数。var()函数,就如同sass和less等预编译软件一样,可以定义变量并且进行对应的使用。

  • 2020-03-16 16:52:05

    对icomoon的误解,以及最快速的使用

    此时需要注意顶部第一个选项,Quick Usage,一定要打开,Enable Quick Usage,谁让咱英语不好呢,这个时候会出现一个css连接,直接引用就好了,就可以随意使用图标了,引入这一个css就能实现我们的功能,省区引入太多文件的烦恼,你可以在浏览器打开这个css,可以看到里面把我们所用的文件整成base64了。所以挺好用的。

  • 2020-03-17 09:47:05

    video标签视频不自动播放的问题

    添加 muted 属性,就可以通过地址栏进入网页的时候自动播放了,手机端还是有的有限制的,比如iphone浏览器,就不行,苹果手机为了保护用户的流量和用户的意愿,是禁止自动播放的,必须有手动触发。

  • 2020-03-17 14:21:31

    nuxt+pm2 自动化部署及打包后文件自动上传阿里云 oss(精华)

    部署nuxtjs,这一篇文章就够了,pm2 代码自动发布依赖于 git 工具,先将 ssh 密钥配置再你的代码仓库(github 或者 gitLab),具体操作自行 google 或者点击github 配置 ssh。 使用 ssh 密钥链接服务器 s $ ssh-copy-id root@1.2.3.4 # 把本机的 SSH 秘钥添加至服务器,配置成功后,以后就不需要再执行这条 SSH 命令了

  • 2020-03-18 21:15:34

    使用canvas画布解决百度地图自定义图层全球连续显示问题

        基于百度地图的Web API进行自定义图层叠加时,默认的图层只能叠加到全球范围以内,即经度范围为[-180, 180],而无法将图层叠加到默认的全球范围以外,即经度范围超出了[-180, 180]之后,经纬度坐标会自动回归到(0, 0),而导致在地图拖拽时全球以外无法连续显示想要的图层,此时可以基于百度地图的自定义图层将经纬度坐标转为像素点使用画布canvas来解决该问题。解决后效果如下图所示: ———————————————— 版权声明:本文为CSDN博主「宏伟杰作」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。 原文链接:https://blog.csdn.net/u011284073/article/details/80549950

  • 2020-03-18 21:18:01

    node-canvas实现百度地图个性化底图绘制

    随着nodejs的推出,node的并发和异步的强大能力,越来越多的得到应用,而且取得了非常不错的效果。 作为一个前端工程师对node.js自然有着一份更深的感情,跃跃欲试的心情,总希望能将它应用到产品中来。