温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

如何在elasticsearch中导入数据

发布时间:2020-06-11 17:03:15 来源:亿速云 阅读:279 作者:元一 栏目:编程语言

ElasticSearch

ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。

1.工具安装

elasticsearch-jdbc是一个将关系型数据库(RDBMS)数据导入到ElasticSearch库中的一个工具包,支持mysql、oracle、postgrey、csv等存储列式数据的容器。目前最新的版本是2.3.4.1,支持的ElasticSearch的版本为2.3.4。

下载数据导入工具包 elasticsearch-jdbc-2.3.4.1-dist.zip,可以到官方网站上下载,

由于github上是只有原代码,没有编译好的可执行包,可以到版本库上[下载] (http://xbib.org/repository/org/xbib/elasticsearch/importer/elasticsearch-jdbc/) 相应的版本

注意elasticsearch-jdbc版本与 elasticsearch要对应上,具体版本对应可以到github上看

https://github.com/jprante/elasticsearch-jdbc

下载

wget http://xbib.org/repository/org/xbib/elasticsearch/importer/elasticsearch-jdbc/

如果这种方式下载慢,也可以本地下载后上传

得到的elasticsearch-jdbc-2.3.4.1-dist.zip 的包可以解压到任何目录,elasticsearch-jdbc是一个独立的项目,并不是原来的老版本需要导入elasticsearch的plugins目录中,作为elasticsearch的插件安装

unzip elasticsearch-jdbc-2.3.4.1-dist.zip

解压得到目录

/bin

/lib

这样就安装成功了

注意如果你导入的数据库不是mysql数据库,那你需要在lib目录中放入相应数据库的驱动包,因为elasticsearch-jdbc默认就有mysql的驱动,所以数据库是mysql就不用了

2.编写导入脚本

可以进入bin目录下,里面很多数据导入脚本的范例脚本,可以稍做修改就可以用了,例如mysql-blog.sh  就是mysql数据库导入的例子

我的导入脚本如下

#!/bin/sh bin=/opt/elasticsearch-jdbc-2.3.4.1/bin lib=/opt/elasticsearch-jdbc-2.3.4.1/lib echo ' {     "type" : "jdbc",     "jdbc" : {         "url" : "jdbc:mysql://10.3.5.21:3306/998pz?useUnicode=true&characterEncoding=utf-8",         "user" : "root",         "password" : "roottest",         "sql" : "select p.name,p.type from prompt p;",         "index" : "prompt",         "type" : "prompt",         "metrics": {             "enabled" : true         },         "elasticsearch" : {          "cluster" : "es-cluster",              "host" : "10.3.32.83",              "port" : 9300          }        } } ' | java \     -cp "${lib}/*" \     -Dlog4j.configurationFile=${bin}/log4j2.xml \     org.xbib.tools.Runner \     org.xbib.tools.JDBCImporter

该脚本将表prompt的数据导入到索引prompt中去

注意:导入的字段名一定要跟索引的字段名一样

脚本编辑完成后需要赋予文件相应的执行权限

chmod 777 prompt.sh

如果导入脚本是你本地windows上编辑好上传到服务器,可能会因为windows编码与linux编码不一致,出现莫名其妙的错误,可以用vi编辑进入文件

在命令模式下,转换相应的编码

set ff=unix

3.导入地理坐标数据

索引

"location": {"store": true,"type": "geo_point"}

脚本

#!/bin/sh bin=/opt/elasticsearch-jdbc-2.3.4.1/bin lib=/opt/elasticsearch-jdbc-2.3.4.1/lib echo ' {     "type" : "jdbc",     "jdbc" : {         "url" : "jdbc:mysql://10.3.5.21:3306/998pz?useUnicode=true&characterEncoding=utf-8",         "user" : "root",         "password" : "roottest",         "sql" : "SELECT bh.,bh.name as nameSuggest,bh.latitude AS \"location.lat\", bh.longitude as \"location.lon\" FROM bd_hospital bh;",         "index" : "hospital2",         "type" : "hospital2",         "metrics": {             "enabled" : true         },         "elasticsearch" : {          "cluster" : "es-cluster",              "host" : "10.3.32.83",              "port" : 9300          }        } } ' | java \     -cp "${lib}/" \     -Dlog4j.configurationFile=${bin}/log4j2.xml \     org.xbib.tools.Runner \     org.xbib.tools.JDBCImporter

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI