shard

es 容错机制2019-09-20 19:50:23

1、图解Elasticsearch容错机制：master选举，replica容错，数据恢复（1）9 shard，3 node（2）master node宕机，自动master选举，red（3）replica容错：新master将replica提升为primary shard，yellow（4）重启宕机node，master copy replica到该node，使用原有的shard并同步宕机后的修改，green
Elasticsearch 顶尖高手(10)—图解横向扩容过程，如何超出扩容极限，以及如何提升容错性2019-09-14 18:51:27

1.图解横向扩容过程，如何超出扩容极限，以及如何提升容错性primary&replica自动负载均衡，6个shard，3个primary，3个replica每个node有更多的shard，IO/CPU/Memory资源给每个shard分配更多，每个shard性能更好扩容的极限，6个shard(3 primary，3 replica)，最多扩容到6台机器，每个shard可以占用单台服
sql脚本函数编写postgresql数据库2019-09-11 20:53:35

postgresql创建Long自增函数 CREATE SEQUENCE global_id_sequence; CREATE OR REPLACE FUNCTION seq_id(OUT result bigint) AS $$ DECLARE our_epoch bigint := 1314220021721; seq_id bigint; now_millis bigint; -- the id of this DB shard, must be set for
Elasticsearch系统学习（三）-基本操作2019-09-01 21:03:50

一、document数据格式（1）应用系统的数据结构都是面向对象的，复杂的（2）对象数据存储到数据库中，只能拆解开来，变为扁平的多张表，每次查询的时候还得还原回对象格式，相当麻烦（3）ES是面向文档的，文档中存储的数据结构，与面向对象的数据结构是一样的，基于这种文档数据结构，es可以提供复杂的索引，全文
es 写一致性解析2019-08-25 16:03:44

我们都知道，es存储的时候分主副分片来提高高可用，那es是如何确定写一致性的呢，下面我们一起了解一下。我们在发送任何一个增删改操作的时候，比如说put /index/type/id，都可以带上一个consistency参数，指明我们想要的写一致性是什么 es有三种一致性参数： 1.one：要求我们这个写操作，
mongo does not contain shard key2019-08-13 14:57:00

　　如标题，在执行数据更新时，如果存在数据，则更新文档，不存在，则插入这个新文档。　　本人在python3.6.3下使用pymongo 3.7.2进行操作。 q_filter= {"_id": “id”} collection.update_one(q_filter, {"$set": mydict}, upsert= True) 　　将upsert设置为True，但是执行时报错了，如下
Elasticsearch: The Definitive Guide Chapter 2 Life inside a Cluster2019-08-06 16:01:52

Add an Index In reality, an index is just a logical namespace that points to one or more pyhsical shards. A shard is a single instance of Lucence, and is a complete search engine in its own right. Coping with Failure
面试之MongoDB2019-07-30 21:09:29

你说的 NoSQL 数据库是什么意思?NoSQL 与 RDBMS 直接有什么区别?为什么要使用和不使用 NoSQL 数据库?说一说 NoSQL 数据库的几个优点? NoSQL 是非关系型数据库，NoSQL = Not Only SQL。关系型数据库采用的结构化的数据，NoSQL 采用的是键值对的方式存储数据。在处理非结构化/
ElasticSearch 数据路由原理+增删改查内部原理+写一致性原理以及quorum机制2019-07-30 11:01:51

一.document数据路由原理（1）document路由到shard上是什么意思？（2）路由算法：shard = hash(routing) % number_of_primary_shards 举个例子，一个index有3个primary shard，P0，P1，P2 每次增删改查一个document的时候，都会带过来一个routing number，默认就是这个document的_id（可能是手动指定，也
面试系列10 es生产集群的部署架构2019-07-28 14:56:57

如果你确实干过es，那你肯定了解你们生产es集群的实际情况，部署了几台机器？有多少个索引？每个索引有多大数据量？每个索引给了多少个分片？你肯定知道！但是如果你确实没干过，也别虚，我给你说一个基本的版本，你到时候就简单说一下就好了（1）es生产集群我们部署了5台机器，每台机器是6核64G的，集
理解 AWS Shuffle Sharding 大规模&神奇的故障隔离2019-07-20 14:57:11

一、引言一次抽4 张扑克牌，有 30 万种组合，如果放回去后重新抽一次，将低于 1/300,000 的几率才能抽到相同组合的牌，几乎不可能了二、概念 infima: infima provides a Lattice container framework that allows you to categorize each endpoint along one or more fault-isolation d
处理 unassigned shard2019-07-19 11:06:53

#查看第一个unassigned shard的原因 GET /_cluster/allocation/explain #查看iis_qr_2019-07索引中所有分片分配情况GET /_cat/shards?index=iis_Log_2019-07 #查看unassigned原因：curl noahes.isec.oa.com/_cluster/allocation/explain?pretty -d '{"index":"index-name",&q
搜索引擎2019-07-14 19:00:41

搜索引擎搜索引擎一. 什么是收索引擎搜索引擎（Search Engine）是指：根据一定的策略、运用特定的计算机程序从互联网上搜集信息，在对信息进行组织和处理后，为用户提供检索服务，将用户检索相关的信息展示给用户的系统。比如百度就是一款比较流行的搜索引擎。二.常用的收索引擎有
ES学习之路2019-07-09 18:02:38

ES目标（1）从零开始，逐步搭建出一个大型可扩展、高性能、监控体系完善、管理体系健全的分布式集群（2）开发复杂的es搜索/分析系统之外，从零开始搭建一个分布式的大型es集群，并制定完善的监控，运维，管理，优化等方案主要目标两个应用领域垂直搜索引擎，实时数据分析什么
自定义实现一个loghub(或kafka)的动态分片消费者负载均衡？2019-07-01 16:03:10

　　一般地，像kafka之类的消息中间件，作为一个可以保持历史消息的组件，其消费模型一般是主动拉取方式。这是为了给消费者足够的自由，回滚或者前进。　　然而，也正是由于将消费消息的权力交给了消费者，所以，消费者往往需要承担更多的责任。比如：需要自行保存消费偏移量，以便后续可以知道从哪
浅析分布式搜索引擎2019-06-28 22:04:08

1. 基础知识 1.1 认识Lucene 维基百科的定义： Lucene是一套用于全文检索和搜索的开放源码程序库，由Apache软件基金会支持和提供。Lucene提供了一个简单却强大的应用程序接口，能够做全文索引和搜索，在Java开发环境里Lucene是一个成熟的免费开放源代码工具；就其本身而论，Lucene是现在并且是
剖析Elasticsearch的基础分布式架构2019-06-20 16:47:52

目录一、Elasticsearch对复杂分布式机制的透明隐藏特性二、Elasticsearch的垂直扩容与水平扩容三、增减或减少节点时的数据rebalance 四、master节点五、节点平等的分布式架构一、Elasticsearch对复杂分布式机制的透明隐藏特性 Elasticsearch是一套分布式的系统，分布式是为
ElasticSearch 调优2019-06-12 14:40:47

第一部分：调优索引速度第二部分-调优搜索速度第三部分：通用的一些建议英文原文：https://www.elastic.co/guide/en/elasticsearch/reference/current/how-to.htmlES发布时带有的默认值，可为es的开箱即用带来很好的体验。全文搜索、高亮、聚合、索引文档等功能无需用户修改即可使用,当你
面试请不要再问我分布式搜索引擎的架构原理2019-05-04 14:49:07

来源：https://juejin.im/post/5c49ae25f265da613d7c6635 （1）倒排索引到底是啥？要了解分布式搜索引擎，先了解一下搜索这个事儿吧，搜索这个技术领域里最入门级别的一个概念就是倒排索引。我们先简单说一下倒排索引是个什么东西。假如说你现在不用搜索引擎，单纯使用数据库来存放和
【原创】《从0开始学Elasticsearch》—集群健康和索引管理2019-05-01 20:37:59

内容目录 1.搭建Kibana2.集群健康3.索引操作 1.搭建Kibana 正如《Kibana 用户手册》中所介绍，Kibana 是一款开源的数据分析和可视化平台，因此我们可以借助 Kibana 来与Elasticsearch（简称ES）交互。下载并解压： cd /usr/localwget https://artifacts.elastic.co/downloads/kibana/kib
ElasticSearch里面一些小坑笔记2019-04-30 08:52:29

最近线上的es报了一个异常，核心信息如下：我们的es索引是嵌套索引，上面的这个异常大致意思是说在某个shard里面嵌套结构里面 k1.k2.time这个字段不存在数据，所以排序失败。我们知道在ES里面可以分shard和索引，大多数时候我们es索引都是自动按某个规则创建的，比如说按天，按月，按年，这个
ElasticSearch评分分析 explian 解释和一些查询理解2019-04-18 20:47:39

ElasticSearch评分分析 explian 解释和一些查询理解按照es-ik分析器安装了ik分词器。创建索引：PUT /index_ik_test。索引包含2个字段：content和nick，如下： GET index_ik_test/_mapping { "index_ik_test": { "mappings": { "fulltext": { "properties":
数据库Sharding的基本思想和切分策略2019-04-17 15:47:39

本文着重介绍sharding的基本思想和理论上的切分策略，关于更加细致的实施策略和参考事例请参考我的另一篇博文：数据库分库分表(sharding)系列(一) 拆分实施策略和示例演示一、基本思想 Sharding的基本思想就要把一个数据库切分成多个
Solr-全文检索工具简介2019-04-11 16:51:50

一.Solr的简介 Solr 是Apache下的一个顶级开源项目，采用Java开发，它是基于Lucene的全文搜索服务。Solr可以独立运行在Jetty、Tomcat等这些Servlet容器中。都是Web服务器，Servlet容器，报文，JSON 格式字符串， XML格式字符串。Solr是一个可以独立运行的搜索服务器，使用solr进行
ElasticSearch是如何实现分布式的？2019-03-25 14:41:58

面试题 es 的分布式架构原理能说一下么（es 是如何实现分布式的啊）？面试官心理分析在搜索这块，lucene 是最流行的搜索库。几年前业内一般都问，你了解 lucene 吗？你知道倒排索引的原理吗？现在早已经 out 了，因为现在很多项目都是直接用基于 lucene 的分布式搜索引擎—— ElasticSearch，简称

首页 < 3 4 5 6 > 尾页

ICode9

es 容错机制2019-09-20 19:50:23

Elasticsearch 顶尖高手(10)—图解横向扩容过程，如何超出扩容极限，以及如何提升容错性2019-09-14 18:51:27

sql脚本函数编写postgresql数据库2019-09-11 20:53:35

Elasticsearch系统学习（三）-基本操作2019-09-01 21:03:50

es 写一致性解析2019-08-25 16:03:44

mongo does not contain shard key2019-08-13 14:57:00

Elasticsearch: The Definitive Guide Chapter 2 Life inside a Cluster2019-08-06 16:01:52

面试之MongoDB2019-07-30 21:09:29

ElasticSearch 数据路由原理+增删改查内部原理+写一致性原理以及quorum机制2019-07-30 11:01:51

面试系列10 es生产集群的部署架构2019-07-28 14:56:57

理解 AWS Shuffle Sharding 大规模&神奇的故障隔离2019-07-20 14:57:11

处理 unassigned shard2019-07-19 11:06:53

搜索引擎2019-07-14 19:00:41

ES学习之路2019-07-09 18:02:38

自定义实现一个loghub(或kafka)的动态分片消费者负载均衡？2019-07-01 16:03:10

浅析分布式搜索引擎2019-06-28 22:04:08

剖析Elasticsearch的基础分布式架构2019-06-20 16:47:52

ElasticSearch 调优2019-06-12 14:40:47

面试请不要再问我分布式搜索引擎的架构原理2019-05-04 14:49:07

【原创】《从0开始学Elasticsearch》—集群健康和索引管理2019-05-01 20:37:59

ElasticSearch里面一些小坑笔记2019-04-30 08:52:29

ElasticSearch评分分析 explian 解释和一些查询理解2019-04-18 20:47:39

数据库Sharding的基本思想和切分策略2019-04-17 15:47:39

Solr-全文检索工具简介2019-04-11 16:51:50

ElasticSearch是如何实现分布式的？2019-03-25 14:41:58