ICode9

精准搜索请尝试: 精确搜索
  • es基本概念2021-04-29 08:32:50

    电商实时数据分析平台需要学些什么?  [运营指标,流量指标,销售转化指标,客户价值指标,商品指标,营销指标,风险控制指标,市场竞争指标]等电商指标数据。 检索,数据更新,排序,分词,query等缓存机制,热启动机制,防雪崩机制,自动降级。 ​ es的功能 1.分布式的搜索引擎和数据分析引擎 2.全文检索,

  • Dyno-queues 分布式延迟队列 之 辅助功能2021-04-26 10:56:36

    本系列我们会以设计分布式延迟队列时重点考虑的模块为主线,穿插灌输一些消息队列的特性实现方法,通过分析Dyno-queues 分布式延迟队列的源码来具体看看设计实现一个分布式延迟队列的方方面面。Dyno-queues 分布式延迟队列 之 辅助功能目录Dyno-queues 分布式延迟队列 之 辅助功能8.1

  • mongodb-shard-分片-原理2021-04-24 11:30:06

    文章目录 0 mongo查询简图(mongos-->config servers --> shard)1 分片是什么?为什么要用分片?2 分片分为几类?3 分片键的限制 和 选择逻辑4 分片后会对查询,写入等造成什么样的影响参考链接: 0 mongo查询简图(mongos–>config servers --> shard) 实现分片集群时,MongoDB 引入 Co

  • [原创干货]Oracle Sharding实施教程来袭!!!2021-04-15 07:01:13

    公有云服务我所欲也,Oracle分布式数据库Sharding亦我所欲也,而且基于云服务能力的快速部署能力,我们还可更容易的发挥分布式数据库的无限扩展能力。这两项的关键技术,第一是,在oracle 12cR2 中最引人注目的是sharding技术,第二是公有云上的IaaS服务能力。如果小伙伴们急切地想体验一下 sh

  • 云计算运维学习---MongoDB中balancer操作2021-04-12 20:30:50

    本文基于MongoDB 3.2系列, 最新版本的MongoDB的balancer流程,应该会和3.2有不一致的地方 前言 MongoDB Balancer 是一个运行在 mongos 中的后台线程,该线程的主要作用就是监控 shard 上的 chunk 数量。如果发现某个 shard 上的 chunk 达到一定的数量,则 balancer 会自动的将部分 c

  • Elasticsearch 最佳运维实践 - 总结(一)2021-04-10 19:51:39

     对于Elasticsearch的学习,需要清楚的明白它的每个核心概念,由浅入深的了解,才能更好的掌握这门技术。下面先简单罗列下Elasticsearch的核心概念:一、Elasticsearch数据组织1.  逻辑组织如下图所示,Elasticsearch使用index和doc_type来组织数据。doc_type中的每条数据称为一个document

  • 2021-03-302021-03-30 14:58:11

    OpenTSDB基于HBase对维度值进行了全局字典编码优化,Druid采用列式存储并实现了Bitmap索引以及局部字典编码优化,InfluxDB和Beringei都将时间线挑了出来,大大降低了Tag的冗余。在这几种时序数据库中,InfluxDB无疑显的更加专业。接下来笔者将会针对InfluxDB的基本概念、内核实现等进

  • ElasticSearch 写入数据过程(增删改查)2021-03-16 11:32:35

    ElasticSearch (以下简称es) ES写数据过程 当客户端对一个node发出写入请求这个node可以称为协调节点协调节点会将document路由到实际节点node的primary shard上,当主分片成功处理这个请求,将请求并行发给备份分片, (primary shard 对应的replica shard ,备份分片可能不止一个,主

  • MongoDB分片集群 Shard Cluster 搭建2021-03-15 23:01:07

    一、为什么要分片 1.存储容量需求超出单机磁盘容量。 2.活跃的数据集超出单机内存容量,导致很多请求都要从磁盘读取数据,影响性能。 3.IOPS超出单个MongoDB节点的服务能力,随着数据的增长,单机实例的瓶颈会越来越明显。 4.副本集具有节点数量限制。 垂直扩展:增加更多的CPU和存储

  • ElasticSearch数据分片-数据路由2021-03-15 18:33:12

    什么是node ES集群中每一个节点就是一个node,或者一个Elasticsearch实例就是一个节点。 node分类: a、主节点: 主节点不接受客户端的请求,他主要控制Elasticsearch集群,负责集群中的操作,比如创建/删除一个索引,跟踪哪些节点是群集的一部分,并决定哪些分片分配给相关的节点。主节点处理

  • 「分布式技术专题」副本机制2021-03-05 17:32:51

    副本放置算法 1、raft协议原理 raft 2、单个shard的复制 raft-single 3、Raft group组 raft-group 在一定情况下,copyset的数量不是越多越好,在恢复时间确定的情况下,找到合适的copyset的数量可以降低数据丢失的概率。为了提高存储系统数据可靠性,首先在系统允许的成本范围内

  • Elasticsearch简介、倒排索引、文档基本操作、分词器2021-02-22 02:01:35

    lucene、Solr、Elasticsearch 1、倒排序索引 2、Lucene是类库 3、solr基于lucene 4、ES基于lucene 一、Elasticsearch 核心术语 特点: 1、es可以支持空格查询,多个关键字 2、空格支持 3、拆词查询 4、搜索内容可以高亮 5、海量数据查库 ES 可以对照着 数据库 来理解: 索引inde

  • ES笔记三:集群管理2021-02-19 12:04:03

    1. 集群中的节点角色 Ingest Node 如何分配? 如何避免脑裂问题? 2. 分片及副本 3. 集群健康及监控 3.1 cat API 3.2 Cluster API 3.2.1 _cluster 3.2.2 _nodes 3.2.3 _remote 3.2.4 _tasks 3.3 X-Pack 4. 扩容 5. 故障转移 6. Thread Pool 1. 集群中的节点角色 每当启

  • 【ElasticSearch】ES 读数据,写数据与搜索数据的过程2021-02-18 18:05:08

    ES读数据的过程:   1.ES客户端选择一个node发送请求,该请求作为协调节点(coordinating node);   2.corrdinating node 对 doc id 对哈希,找出该文档对应所在的shards,将请求转发到对应的node,   此时会使用round-robin 随机轮询算法,在primary shard 和 replica shard 之中选择一

  • 【ElasticSearch】shards,replica,index之间的关系2021-02-08 18:02:34

    1.index 包含多个shard ,在创建index的时候可以自定义shards和replica的数量 例如: 新增一个index,手动指定shard和replica的数量 PUT demo_index { "settings": { "number_of_shards": 3, "number_of_replicas": 1 } } 添加完成后 GET demo_index 查询index的信息: {

  • ServerSAN系统元数据管理设计2021-02-06 20:03:35

    本文首先就ServerSAN系统的元数据管理做一般的探讨,然后重点以PureFlash为例说明元数据管理的实践。 元数据,也就是数据的说明书。当一块硬盘插到电脑上,电脑就看到一个块设备,这个块设备从LBA 0开始到LBA N,顺序编址,无比平滑。然而我们知道在物理上HDD实际是按Cylinder(柱面),Header(

  • ES7.5 下动态扩大索引的shard数量2021-01-29 21:02:29

    在老版本的ES(例如2.3版本)中, index的shard数量定好后,就不能再修改,除非重建数据才能实现。 从ES6.1开始,ES 支持可以在线操作扩大shard的数量(注意:操作期间也需要对index锁写) 从ES7.0开始,split时候,不再需要加参数 index.number_of_routing_shards   需要注意的是: 这个split的过程中,

  • 中华石杉Java面试突击第一季笔记二(分布式搜索引擎ES)2021-01-25 20:33:52

    分布式搜索引擎的底层元礼 业内分布式搜索引擎一般大家都是用ElasticSearch(原来的话使用的是Solr),elasticsearch 基于 lucene,隐藏了 lucene 的复杂性,提供了简单易用的 restful api / Java api 接口(另外还有其他语言的 api 接口)。 分布式的文档存储引擎分布式的搜索引擎和分析引擎

  • 初探 MongoDB 分片集群2021-01-03 20:03:07

    MongoDB 是一个非关系型数据库(NoSQL),也称文档型数据库。由于其良好的性能以及易用性在业内很是流行。在如今随处可见高并发读写,海量数据存储需求的背景下。数据库的容量越来越是个问题。提高容量一般有两个途径:1.垂直扩容、2.水平扩容。垂直扩容就是提高单机的容量(增加内存,CPU,磁盘

  • elasticsearch学习(1)2020-12-30 15:30:35

    安装 elasticsearch ,操作elasticsearch的工具kibana, (1)在kibana中输入GET _cluster/health查看es的健康状况(2)在kibana中输入 GET /_cat/health?v 查看es具体信息 epoch      timestamp cluster       status node.total node.data shards pri relo init unassign

  • clickhouse分布式表实践和原理2020-12-20 21:58:46

    分布式表 一个逻辑上的表, 可以理解为数据库中的视图, 一般查询都查询分布式表. 分布式表引擎会将我们的查询请求路由本地表进行查询, 然后进行汇总最终返回给用户. 本地表: 实际存储数据的表 1 多切片单副本分布式表  conf.xml中的开启远程连接配置/etc/metrika.xml文件

  • ES大批量写入提高性能的策略2020-12-18 16:01:07

    转载:https://blog.csdn.net/qq_37910578/article/details/81778359 1、用bulk批量写入 你如果要往es里面灌入数据的话,那么根据你的业务场景来,如果你的业务场景可以支持让你将一批数据聚合起来,一次性写入es,那么就尽量采用bulk的方式,每次批量写个几百条这样子。 bulk批量写入的性能

  • ElasticSearch原理总结2020-12-10 13:33:20

    ES原理总结 —ES写数据: ES里写的流程,有四个底层的核心概念:refresh、flush、translog、merge —ES读数据的过程 查询—GET到某一条数据 (1)可以通过 doc id 来查询,会根据 doc id 进行 hash,判断出来当时把 doc id 分配到了哪个 shard 上面去,从那个 shard 去查询。 (2)客户端发送请

  • 深度解读 MongoDB 最全面的增强版本 4.4 新特性2020-11-26 15:57:57

    MongoDB 在今年正式发布了新的 4.4 大版本,这次的发布包含众多的增强 Feature,可以称之为是一个维护性的版本,而且是一个用户期待已久的维护性版本,MongoDB 官方也把这次发布称为「User-Driven Engineering」,说明新版本主要是针对用户呼声最高的一些痛点,重点进行了改进。 而阿里云

  • 深度解读 MongoDB 最全面的增强版本 4.4 新特性2020-11-26 09:58:54

    MongoDB 在今年正式发布了新的 4.4 大版本,这次的发布包含众多的增强 Feature,可以称之为是一个维护性的版本,而且是一个用户期待已久的维护性版本,MongoDB 官方也把这次发布称为「User-Driven Engineering」,说明新版本主要是针对用户呼声最高的一些痛点,重点进行了改进。 而阿里云

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有