ICode9

精准搜索请尝试: 精确搜索
  • 【Windows】Flink环境搭建2022-05-28 12:03:40

    Flink下载 本次以Flink 1.9.0版本为例。 下载 flink-1.9.0-bin-scala_2.12.tgz 下载后解压到 D:\flink\flink-1.9.0 目录 如果需要其他版本,可以访问链接下载:https://archive.apache.org/dist/flink/ 运行Flink 注:运行 Flink 需要安装 Java 7.x 或更高的版本,操作系统需要 Win 7 或

  • Flink概述2022-05-28 09:31:56

    Flink产生缘由 随着大数据时代的发展,海量数据和多种业务的实时处理需求激增,比如: 实时监控报警系统; 实时风控系统; 实时推荐系统等等。 传统的批处理方式和早期的流式处理框架因其自身的局限性,难以在延迟性、吞吐量、容错能力,以及使用便捷性等方面满足业务日益苛刻的要求。 在这种

  • Flink简介2022-05-28 09:00:48

    Apache Flink是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算。Flink设计为在所有常见的集群环境中运行,以内存速度和任何规模执行计算。 架构 处理无界和有界数据 任何类型的数据都是作为事件流产生的。信用卡交易,传感器测量,机器日志或网站或移动应用程序上的用

  • 【技术干货】代码示例:使用 Apache Flink 连接 TDengine2022-05-27 20:01:08

    小 T 导读:想用 Flink 对接 TDengine?保姆级教程来了。   0、前言 TDengine 是由涛思数据开发并开源的一款高性能、分布式、支持 SQL 的时序数据库(Time-Series Database)。 除了核心的时序数据库功能外,TDengine 还提供缓存、数据订阅、流式计算等大数据平台所需要的系列功能。但是很

  • Flink1.15.0 ON YARN集群安装2022-05-23 20:01:26

    安装准备: hadoop3.2.2, flink1.15.0 在成功安装hadoop3.2.2的基础上,采用YARN模式安装Flink1.15。 1.在/etc/profile文件中追加配置: export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop 2.修改hadoop相关配置: 在conf文件夹中hadoop-env.sh文件中,添加配置: export HADOOP_CONF_DIR

  • 初识大数据2022-05-23 03:00:07

      最近总算是抽出一些时间来了解和学习什么是大数据,百度了一下得出的答案是:   大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。具体详情可见百度:https://ba

  • 罗强:腾讯新闻如何处理海量商业化数据?2022-05-22 14:31:35

    导读: 随着信息化时代的来临,信息呈现出爆炸式的增长。尤其是在移动互联网的推动下,每天大量信息涌入让人们应接不暇,腾讯新闻客户端的出现,就是以帮助用户寻找有用信息而出现。这时,面对海量的数据、繁多的业务,如何处理手中的数据,利用数据赋能是今天会议讨论的重点。 今天的介绍会围绕

  • 国产开源优秀新一代MPP数据库StarRocks入门之旅-数仓新利器(下)2022-05-19 23:00:07

    数据导入 总览 概述 数据导入功能是将原始数据按照相应的模型进行清洗转换并加载到StarRocks中,方便查询使用。StarRocks提供了多种导入方式,用户可以根据数据量大小、导入频率等要求选择最适合自己业务需求的导入方式。 离线数据导入,如果数据源是Hive/HDFS,推荐采用Broker Load导入

  • Flink-初识(特点、与sparkstreaming的比较)2022-05-18 22:04:03

    1.初识 Flink 起源于 Stratosphere 项目,Stratosphere 是在 2010~2014 年由 3 所地处柏林的大学和欧洲的一些其他的大学共同进行的研究项目,2014 年 4 月 Stratosphere 的代 码 被 复 制 并 捐 赠 给 了 Apache 软 件 基 金 会 , 参 加 这 个 孵 化 项 目 的 初 始 成 员 是Stratosph

  • Flink 状态编程2022-05-16 14:03:49

    概念 在Flink架构体系中,有状态计算可以说是Flink非常重要的特性之一 Flink优势: 支持高吞吐、低延迟、高性能 支持事件时间Event_time概念 支持有状态计算 有状态计算是指: 在程序计算过程中,在Flink程序内部存储计算产生的中间结果,并提供给后续Function或算子计算结果使用。(如下

  • Flink Time2022-05-14 23:35:42

    基础概念 支持两种时间概念: Processing Time 时间递增 Event Time 支持一定程度的乱序 上一个 checkpoint 或者 savepoint 进行重放,是不是希望结果完全相同。如果希望结果完全相同,就只能用 Event Time;如果接受结果不同,则可以用 Processing Time。 watermark 一个watermark 代表

  • 开源项目丨 Taier 1.1 版本正式发布,新增功能一览为快2022-05-10 13:00:22

    2022 年 5 月 8 日,Taier 1.1 版本正式发布!   本次版本更新对 Flink 的支持升级到 Flink1.12,支持多种流类型任务,新版本的使用文档已在社区中推送,大家可以随时下载查阅。   github 地址: https://github.com/DTStack/Taier gitee 地址: https://gitee.com/dtstack_dev_0/taier

  • Kafka - Kafka集成Flink, Spark, SpringBoot, Flume2022-05-10 00:34:13

    前言 这四个组件,都既能做kafka的生产者,也能做消费者。 这里挑flink和springBoot详细介绍。其他两个详见视频教程。   一、与Flink的集成 1.1 Flink生产者   引入maven包     写FlinkKafkaProducer1类 注意:系统本身已经有了FlinkKafkaProducer类了...因此这里非常容易冲突,要在

  • FlinkWordCount【Java】2022-05-08 20:35:16

    1、IDEA创建Maven项目添加如下依赖 <properties> <maven.compiler.source>18</maven.compiler.source> <maven.compiler.target>18</maven.compiler.target> <flink.version>1.13.0</flink.version> <jav

  • 大数据Hadoop之——搭建本地flink开发环境详解(window10)2022-05-08 17:31:42

    目录一、下载安装IDEA二、搭建本地hadoop环境(window10)三、安装Maven四、新建项目和模块1)新建maven项目2)新建flink模块五、配置IDEA环境(scala)1)下载安装scala插件2)配置scala插件到模块或者全局环境3)创建scala项目4)DataStream API配置1、Maven配置2、示例演示5)Table API & SQL配置1、

  • 使用kafka-clients依赖后报错2022-05-06 11:03:35

    一、报错信息如下: java.lang.NoSuchMethodError: org.apache.kafka.clients.producer.internals.TransactionalRequestResult.<init>(Ljava/lang/String;)V at org.apache.flink.streaming.connectors.kafka.internal.FlinkKafkaInternalProducer.enqueueNewPartitions(Fl

  • 畅游Flink之API-Part1(Java版)2022-05-06 08:31:54

    1.Transform 1.1.基本转换算子 map/flatMap/filter map 把数组流中的每一个值,使用所提供的函数执行一遍,一一对应。得到元素个数相同的数组流 flatmap flat是扁平的意思。它把数组流中的每一个值,使用所提供的函数执行一遍,一一对应。得到元素相同的数组流。只不过,里面的元素也

  • Apache Flink系列-⑤应用程序构建块2022-05-01 00:34:39

    应用程序构建块 有状态函数为构建事件驱动的应用程序提供了一个框架。这里,我们将解释有状态函数体系结构的重要方面。 事件入口 有状态函数应用程序直接位于事件驱动的空间中,因此自然要从将事件引入系统开始。   在有状态函数中,将记录接收到系统中的组件称为事件入口。这可以是

  • PEB断链隐藏模块2022-04-30 13:33:18

    结构体介绍 _LDR_DATA_TABLE_ENTRY包含三个双向链表的结构体 1 typedef struct _PEB_LDR_DATA 2 { 3 ULONG Length; 4 BOOLEAN Initialized; 5 PVOID SsHandle; 6 LIST_ENTRY InLoadOrderModuleList; //模块加载顺序 7 LIST_ENTRY

  • 某算法工程知识结构以及学习资料2022-04-28 10:32:22

    什么是算法工程? 进可攻算法, 退可守工程. 以工程思想为基础, 以项目理解为基础, 涉及算法. 技术栈: 在线: 微服务服务器 + Redis + MySql 离线: Hive + Kafka + Flink + MySql + Redis 模型: Python + deep & wide 学习资料: Flink: Streaming Systems, 基于Apache Flink的流

  • Flink知识点总结2022-04-27 21:31:14

    Flink简介 Flink 是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算。并且 Flink 提供了数据分布、容错机制以及资源管理等核心功能。Flink提供了诸多高抽象层的API以便用户编写分布式任务:DataSet API、DataStream API、Table API等 Flink跟Spark Streaming的区别

  • Apache Flink系列-③什么是Apache Flink?2022-04-21 02:01:10

    Apache Flink 是一个针对无界和有界数据流进行有状态计算的框架。由于许多流应用程序旨在以最短的停机时间连续运行,因此流处理器必须提供出色的故障恢复能力,以及在应用程序运行期间进行监控和维护的工具。 Apache Flink 非常注重流数据处理的可运维性。因此在这一小节中,我们将详细

  • How to Configure RocksDB Logging for Advanced Troubleshooting2022-04-19 20:04:03

    Question RocksDB's LOG file comes in handy when troubleshooting Flink with RocksDB. How can I configure RocksDB logging?   Answer Note: This section applies to Flink 1.10 - 1.14 By default, Flink uses the log level HEADER_LEVEL for RocksDB. This esse

  • Apache Flink系列-②什么是Apache Flink?2022-04-19 00:34:30

    Apache Flink是一个在无界和有界数据流上进行有状态计算的框架。Flink提供了不同抽象级别的多个API,并为常见用例提供了专用库。 在这里,我们介绍Flink易于使用且富有表现力的API和库。 流媒体应用的构建块 流处理框架可以构建和执行的应用程序类型取决于该框架对流、状态和时间的控

  • 报错:Flink Hadoop is not in the classpath/dependencies2022-04-18 11:03:10

    报错背景 安装Flink on yarn集群,Flink集群无法启动。 版本: flink-1.14.4 hadoop-3.2.3 报错现象 2022-04-18 10:22:31,395 ERROR org.apache.flink.runtime.entrypoint.ClusterEntrypoint [] - Could not start cluster entrypoint StandaloneSessionClusterEntrypoint.

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有