Kafka

大数据技术之Kafka 第1章 Kafka概述2022-06-06 02:31:06

1.1 Kafka定义 Kafka是一个分布式的基于发布/订阅模式的消息队列（Message Queue），主要应用于大数据实时处理领域。 1.2 消息队列 1.2.1 传统消息队列的应用场景使用消息队列的好处 1）解耦允许你独立的扩展或修改两边的处理过程，只要确保它们遵守同样的接口约束。 2）可恢复性系统的一
Pulsar解决的问题2022-06-04 22:32:29

1.提供一个实时处理消息队列以及大规模数据流处理的平台 2.当前大多数的流处理平台，都无法简单的上云平台进行弹性伸缩扩展，比如Kafka，扩展node或者topic的分区，都要触发rebalance，rebalance期间是无法进行数据读写的。
KAFKA 入门：【六】能否深入聊一下 ISR 的伸缩过程？2022-06-04 14:04:54

大家好，这是一个为了梦想而保持学习的博客。这个专题会记录我对于 KAFKA 的学习和实战经验，希望对大家有所帮助，目录形式依旧为问答的方式，相当于是模拟面试。一、前言可能有些朋友发现之前空缺了第六节，是因为之前写了没来得及完善就一直搁置了，因此在这儿后续补上。二、概述我
KAFKA 进阶：【十四】能否说一下 kafka 的负载均衡机制？2022-06-04 14:04:18

大家好，这是一个为了梦想而保持学习的博客。这个专题会记录我对于 KAFKA 的学习和实战经验，希望对大家有所帮助，目录形式依旧为问答的方式，相当于是模拟面试。一、概述对于消息中间件来说，负载均衡是非常重要的，不能说我部署了 10 台机器，结果就 2 台忙的要死而其余 8 台都非常空闲，
KAFKA 进阶：【十三】能否说一下 kafka 分区数过多后存在哪些问题？2022-06-04 14:03:39

大家好，这是一个为了梦想而保持学习的博客。这个专题会记录我对于 KAFKA 的学习和实战经验，希望对大家有所帮助，目录形式依旧为问答的方式，相当于是模拟面试。一、概述在对 kafka 有了基础的认知之后，回过头来看看，当前 kafka 的存储架构还存在哪些问题呢？很多地方有提到 kafka
KAFKA 进阶：【十六】能否说一下 kafka 中 zk 有哪些作用？2022-06-04 14:03:17

大家好，这是一个为了梦想而保持学习的博客。这个专题会记录我对于 KAFKA 的学习和实战经验，希望对大家有所帮助，目录形式依旧为问答的方式，相当于是模拟面试。一、概述我们知道，在 2.8 版本之前，kafka 都是强依赖于 zk 的；哪怕是目前的 2.8 版本去 zk 也只是试用功能，官方也不推荐在
KAFKA 入门：【十七】说一说 kafka 的生产者客户端架构？2022-06-04 14:02:52

大家好，这是一个为了梦想而保持学习的博客。这个专题会记录我对于 KAFKA 的学习和实战经验，希望对大家有所帮助，目录形式依旧为问答的方式，相当于是模拟面试。什么是生产者的？生产者的概念其实非常简单，一句话概括就是：负责生产消息发送到 kafka 的服务端。但是为什么要单独拎出来放
KAFKA 实践：【二十】如何保证消息顺序？消息不丢失？消息不重复？2022-06-04 14:02:15

大家好，这是一个为了梦想而保持学习的博客。这个专题会记录我对于 KAFKA 的学习和实战经验，希望对大家有所帮助，目录形式依旧为问答的方式，相当于是模拟面试。前言我们在前面几个文章，知道了 kafka 的生产者 / 消费者的基本原理，这里就让我们来思考一些常见的生产问题，例如标题中的那
Kafka 主题解析2022-06-03 11:03:12

一、主题管理使⽤kafka-topics.sh脚本时可用的配置：选项说明 --config <String: name=value> 为创建的或修改的主题指定配置信息。⽀持下述配置条⽬：cleanup.policycompression.typedelete.retention.msfile.delete.delay.msflush.messagesflush.msfollower.replication.t
kafka+flink任务级顺序保证2022-06-02 17:35:21

顺序保证难点本文主要分析 CDC 业务场景中任务级顺序保证，技术选型为：debezium、kafka、flink，其构成了顺序保证中至关重要的每一环，应该充分考虑、分析各组件的对于顺序的支持。首先 debezium 作为采集组件，其分别为 schema topic 和 data topic 提供了不同的时间字段，如下图 schema
flink+kafka的端到端一致性2022-06-02 17:33:55

上一篇中提到flink+kafka如何做到任务级顺序保证，而端到端一致性即为实现用户数据目标端与源端的准确一致，当源端数据发生更改时，保证目标端及时、正确、持久的写入更改数据。为实现端到端一致性应在顺序保证的基础上，实现一致性语义exactly once的保证。纵观各底层组件：Debezium、Kafk
Kafka的安装2022-06-02 14:03:18

安装sbt 1.下载并解压至/usr/local 赋予权限并将bin目录下的sbt-launch.jar复制到sbt 安装目录下创建shell脚本文件，启动sbt 增加可执行权限，并查看sbt版本信息 Kafka的安装解压至/usr/local，改名为kafka并赋予权限打开终端，启动Zookeeper
Apache Pulsar 与 Apache Kafka 2022 基准测试2022-05-30 15:32:01

我们很高兴分享 Apache Pulsar 与 Apache Kafka 2022 基准测试。由 StreamNative CTO、Pulsar PMC 主席 Matteo Merli 领导，李鹏辉，Apache Pulsar PMC，担任工程主管的工程团队使用 Linux Foundation Open Messaging 基准进行了基准研究。该团队在吞吐量和延迟方面测量了 Pulsar 的
Kafka到底有多高可靠？（RNG NB）2022-05-30 09:03:13

在聊Kafka高可靠之前，先在评论区来波RNG NB好不好！什么叫可靠性？大家都知道，系统架构有三高：「高性能、高并发和高可用」，三者的重要性不言而喻。对于任意系统，想要同时满足三高都是一件非常困难的事情，大型业务系统或者传统中间件都会搭建复杂的架构来保证。除以上三种模式之外，还有一
Kafka2022-05-30 03:32:54

Kafka简介 Apache Kafka 是一个开源分布式事件流平台，被数千家公司用于高性能数据管道、流分析、数据集成和任务关键型应用程序。 Kafka本质上是一个 MQ（Message Queue），使用消息队列的好处：解耦：允许我们独立的扩展或修改队列两边的处理过程。可恢复性：即使一个处理消息的进程挂掉，加
Kakfa Kraft模式部署2022-05-30 02:00:07

下载包官网https://www.apache.org/dyn/closer.cgi?path=/kafka/3.2.0/kafka_2.12-3.2.0.tgz 解压 tar -xzf kafka_2.13-3.2.0.tgz cd kafka_2.13-3.2.0 可以查看config/kraft/README.md了解一下生成集群ID bin/kafka-storage.sh random-uuid > uuid cat uuid 单机版部署修
Kafka 消费者解析2022-05-28 19:31:44

一、消费者相关概念 1.1 消费组&消费者消费者：消费者从订阅的主题消费消息，消费消息的偏移量保存在Kafka的名字是__consumer_offsets的主题中消费者还可以将⾃⼰的偏移量存储到Zookeeper，需要设置offset.storage=zookeeper 推荐使⽤Kafka存储消费者的偏移量。因为Zookeeper不适合
Kafka - 生产调优之硬件配置选择2022-05-27 23:31:44

一、峰值计算二、购买多少服务器三、磁盘选择四、内存选择 kafka的内存 = 堆内存（kafka内部配置）+ 页内存（服务器内存）如果生产环境数据量很大，可以设置为10G-15G 查看kafka GC情况 YGC，年轻代GC次数，这里是36次可以接受查看
启动HDFS, Zookeeper，Kafka，hbase2022-05-26 15:32:54

启动HDFS，start-all.sh 启动Zookeeper，myzk.sh start /opt/zookeeper-3.4.10/bin/zkServer.sh $1 启动Kafka，mykafka.sh start /opt/kafka_2.11-2.4.1/bin/kafka-server-start.sh -daemon /opt/kafka_2.11-2.4.1/config/server.properties
kafka使用场景案例2022-05-26 15:00:07

借鉴博客：https://blog.csdn.net/qq_40454136/article/details/121097161 大概描述一下kafka在项目中的使用场景。 kafka是消息中间件的一种，那到底在项目中用它干嘛呢？　　消息中间件那肯定跟消息的处理有关，以下有几个使用场景：　　　　其实它就是为了解决一些高并发的场
大数据Hadoop之——Kafka 图形化工具 EFAK（EFAK环境部署）2022-05-26 00:31:42

目录一、概述二、EFAK架构三、EFAK数据采集原理四、安装Kafka1）Kafka下载2）配置环境变量3）创建logs目录4）修改kafka配置5）修改zookeeper配置6）配置Zookeeper myid7）开启Kafka JMX监控8）将kafka目录推送到其它节点9）启动服务五、安装EFAK1）下载EFAK2）创建数据库2）设置环境变量3）配置4）调整启动参
【搬运】kafka相关2022-05-24 13:33:46

原文地址【侵删】：https://blog.51cto.com/fengyuzaitu/2496201 以下为搬运内容： 1）环境软件版本2.0.0 Released July 30, 2018 Release Notes Source download: kafka-2.0.0-src.tgz (asc, sha512) Binary downloads
【kafka】生产者和消费者代码2022-05-24 13:32:55

Producer static void Main(string[] args) { Console.WriteLine("请输入消息内容"); using (var producer = new KafkaProducer()) { while (true) { string messag
如何为微服务选择正确的消息队列2022-05-24 07:31:55

微服务及消息队列简史自从 Peter Rodgers 博士 2005 年在 Web Services Edge 会议上首次提出 Micro-Web-Services 一词后，IT 行业慢慢地从单体架构转向了微服务。 2009 年，Netflix 决定把其单体架构拆分为微服务。 2010 年，Best Buy 开始把它们的单体架构转变为微服务
kafka核心知识简略版整理2022-05-23 13:02:59

1.是什么？ Kafka是一个分布式、支持分区、多副本的，基于zookeeper协调的分布式消息中间件 2 使用场景核心的场景、原因有 3 个：解耦、异步、削峰。具体：日志收集消息系统：解耦和生产者和消费者、缓存消息等。用户活动跟踪：用户的各种活动，如浏览、搜索、点击等活动，发布到kafka的top

首页 < 6 7 8

ICode9

大数据技术之Kafka 第1章 Kafka概述2022-06-06 02:31:06

Pulsar解决的问题2022-06-04 22:32:29

KAFKA 入门：【六】能否深入聊一下 ISR 的伸缩过程？2022-06-04 14:04:54

KAFKA 进阶：【十四】能否说一下 kafka 的负载均衡机制？2022-06-04 14:04:18

KAFKA 进阶：【十三】能否说一下 kafka 分区数过多后存在哪些问题？2022-06-04 14:03:39

KAFKA 进阶：【十六】能否说一下 kafka 中 zk 有哪些作用？2022-06-04 14:03:17

KAFKA 入门：【十七】说一说 kafka 的生产者客户端架构？2022-06-04 14:02:52

KAFKA 实践：【二十】如何保证消息顺序？消息不丢失？消息不重复？2022-06-04 14:02:15

Kafka 主题解析2022-06-03 11:03:12

kafka+flink任务级顺序保证2022-06-02 17:35:21

flink+kafka的端到端一致性2022-06-02 17:33:55

Kafka的安装2022-06-02 14:03:18

Apache Pulsar 与 Apache Kafka 2022 基准测试2022-05-30 15:32:01

Kafka到底有多高可靠？（RNG NB）2022-05-30 09:03:13

Kafka2022-05-30 03:32:54

Kakfa Kraft模式部署2022-05-30 02:00:07

Kafka 消费者解析2022-05-28 19:31:44

Kafka - 生产调优 之 硬件配置选择2022-05-27 23:31:44

启动HDFS, Zookeeper，Kafka，hbase2022-05-26 15:32:54

kafka使用场景案例2022-05-26 15:00:07

大数据Hadoop之——Kafka 图形化工具 EFAK（EFAK环境部署）2022-05-26 00:31:42

【搬运】kafka相关2022-05-24 13:33:46

【kafka】生产者和消费者代码2022-05-24 13:32:55

如何为微服务选择正确的消息队列2022-05-24 07:31:55

kafka核心知识简略版整理2022-05-23 13:02:59

Kafka - 生产调优之硬件配置选择2022-05-27 23:31:44