这篇文章主要讲解了“Elasticsearch基础知识点有哪些”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Elasticsearch基础知识点有哪些”吧!
分布式搜索和分布式引擎
全文检索,结构化检索,数据分析
对海量数据进行近实时的分析
维基百科的搜索
新闻网站
stack overflow的异常搜索
github的所有
日志数据分析 ELK
电商网站的搜索
商品价格监控网站,用户设定商品的价格阈值,当低于该阈值时候,发送通知给用户
BI系统,数据挖掘,数据分析
站内的搜索(电商。招聘。门户)
可以作为大型分布式集群(数百台服务器)技术,处理PB级别的数据,也可以运行单个服务器,服务小公司
Elasticsearch不是新技术,只是将全文检索、数据服务和分布式技术合在一起才形成了es
对用户而言 开箱即用,非常简单
es是对传统服务器的一个补充和扩展
主要还是基于Lucene做的封装,隐藏了其复杂的的api
NRT(Near Realtime) 近实时,从两个方面理解:从写入数据到被查询出来有一个延迟(大约1秒);基因es的数据的搜索和分析可以达到秒级
Cluster,集群,包含多个节点,每个节点属于哪个集群是通过一个配置来决定的
Node,节点,节点的名称很重要,如果节点的名称是默认随机的话,默认节点会去加入一个名称为“elasticsearch”的集群,如果直接启动一堆节点,那么他们会自动组装成一个elasticsearch集群,当然一个节点也可以组成elasticsearch集群
Document,文档,es的最小数据单元。一个document可以是一条商品户数据、用户信息等,通常使用json数据结构表示,
Index:索引,包含有一推相似数据结构的文档数据,比如可以有客户的索引,商品的索引,订单索引,在往细了说可以分为服装的索引,日常索引,五金索引等等
Type:类型。一个索引可以含有一个或者多个type,type是index中的逻辑分类,一个type下的document含有相同的field,比如,一个博客索引下面可以含有用户数据的type,博客的type,用户评论的type
shard(primary shard),分片,单机无法存储大量的数据,es可以将一个索引中的数据切分成多个shard,分布在多个服务器上存储,有了shard就可以横向的扩展,存储更多的数据,让搜索和分析等操作分布到多台服务器上面并行执行,提升系统的吞吐量和性能,每个shard都是一个lucene index
replica(replica shard) 备份,复制。任何一个服务器都有可能宕机或者故障,那么此时shard就有可能丢失数据,因此可以为每一个shard创建多个replica副本,replica可以在shard故障的时候提供备用服务,保证数据的不丢失,提高高可用性,多个replica还可以提高搜索操作的吞吐量和性能,primary shard建立索引的时候一次设置,不能修改,默认为5个,replica shared随时修改,默认1个,默认中每一个索引有10个shard,分别为5个parimary shard,5个replica shard,最小的高可用配置为2台服务器,互为主备
以mysql为例
Elasticsearch | Mysql |
---|---|
field | 字段 |
Document | 行 |
Type | 表 |
Index | 库 |
在 7.0 以及之后的版本中 Type 被废弃了。(其实还可以用,但是已经不推荐了)
一个MySQL实例中可以创建多个 Database,一个Database中可以创建多个Table。
Elasticsearch | Mysql |
---|---|
field | 字段 |
Document | 行 |
Index | 表(Table ) |
es的实例 | 库(Database) |
感谢各位的阅读,以上就是“Elasticsearch基础知识点有哪些”的内容了,经过本文的学习后,相信大家对Elasticsearch基础知识点有哪些这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是亿速云,小编将为大家推送更多相关知识点的文章,欢迎关注!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。