ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

Kafka笔记7(构建数据管道)

2019-01-31 17:41:00  阅读:321  来源: 互联网

标签:转换 任务 笔记 Kafka 管道 构建 连接器 数据 ETL


 构建数据管道需要考虑的问题:

    及时性  可靠性 高吞吐量和动态吞吐量   数据格式  转换    安全性   故障处理能力  耦合性与灵活性

    数据管道的构建分为2个阵营,ETL和ELT

  ETL:提取-转换-加载   当数据流经管道时,数据管道负责处理他们

  ELT:提取-加载-转换:数据管道只做少量的转换,高保真

 

  数据管道最重要的作用是解耦数据源和数据池

    发生耦合情况: 临时数据管道    元数据丢失    末端处理

 

 

 

Connect工作原理

  连接器和任务

    连接器实现了ConnectorAPI ,API 包含以下2部分:

      连接器负责以下3件事: 决定运行多少任务,按照任务拆分数据复制,从worker进程获取任务配置并将其传递下去

    任务:负责将数据移入/移出Kafka

  work进程

    

  转化器和Connect数据模型

    

  偏移量管理器

    

  

标签:转换,任务,笔记,Kafka,管道,构建,连接器,数据,ETL
来源: https://www.cnblogs.com/zy1234567/p/10342913.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有