flink

大数据

Flink 使用场景

Apache Flink 功能强大，支持开发和运行多种不同种类的应用程序。它的主要特性包括：批流一体化、精密的状态管理、事件时间支持以及精确一次的状态一致性保障等。Flink 不仅…

1天前

CDC 数据入湖方案：Kafka Connect + Schema Registry + Avro ＞ Kafka ＞ Hudi ( Flink Connector )

本方案的技术链路为：使用 Kafka Connect 的 Debezium MySQL Source Connector 将 MySQL 的 CDC 数据（Avro 格式）接入到…

大数据 1天前

后端

Flink实时数仓同步：快照表实战详解

一、背景在大数据领域，初始阶段业务数据通常被存储于关系型数据库，如MySQL。然而，为满足日常分析和报表等需求，大数据平台采用多种同步方式，以适应这些业务数据的不同存储需求。这些…

1天前

大数据

Flink学习-时间和窗口

在流数据处理应用中，一个很重要、也很常见的操作就是窗口计算。所谓的“窗口”，一般就是划定的一段时间范围，也就是“时间窗”；对在这范围内的数据进行处理，就是所谓的窗口计算。所以窗…

1天前

大数据

Flink 流处理流程 API详解

流处理API的衍变 Storm：TopologyBuilder构建图的工具，然后往图中添加节点，指定节点与节点之间的有向边是什么。构建完成后就可以将这个图提交到远程的集群或者本地的…

1天前

数据库

Flink 1.18.1 部署与配置[CentOS7]

静态IP设置 # 修改网卡配置文件 vim /etc/sysconfig/network-scripts/ifcfg-ens33 # 修改文件内容 TYPE=Ethernet PR…

1天前

Flink调优与性能指标

1.背景介绍 Flink是一个流处理框架，用于处理大规模数据流。它可以处理实时数据流，并提供一系列的数据处理功能，如数据分组、窗口操作、连接操作等。Flink的性能是非常重要的，因…

大数据 1天前

Flink与ApacheKafka集成

1.背景介绍在大数据领域，流处理和事件驱动架构已经成为关键技术。Apache Flink 和 Apache Kafka 是流处理和事件驱动架构的两个重要组件。Flink 是一个流…

大数据 1天前

大数据

Flink + Iceberg打造流批一体的数据湖架构

一、背景 1、数据仓库架构从Hive表出仓到外部系统（ClickHouse、Presto、ES等）带来的复杂性和存储开发等额外代价，尽量减少这种场景出仓的必要性。…

1天前

实时Flink的基本数据结构与类型

1.背景介绍在大数据处理领域，实时数据处理是一项至关重要的技术。Apache Flink是一个流处理框架，可以用于实时数据处理和分析。在Flink中，数据结构和类型是关键的组成部…

大数据 1天前

大数据

Flink CEP实现10秒内连续登录失败用户分析

1、什么是CEP？ Flink CEP即 Flink Complex Event Processing，是基于DataStream流式数据提供的一套复杂事件处理编程模型。你可以把他…

1天前

Flink中的流式Window和RollingWindow

1.背景介绍在大数据处理领域，流式计算是一种实时处理数据的方法，它可以处理大量数据流，并在数据到达时进行实时分析和处理。Apache Flink是一个流式计算框架，它支持大规模数…

大数据 1天前

Apache NiFi and Apache Flink: A Deep Dive into RealTime Stream Processing

1.背景介绍随着数据量的增长，实时数据处理变得越来越重要。实时流处理是一种处理大规模实时数据流的技术，它可以在数据到达时进行处理，而不是等待所有数据收集后进行批量处理。这种技术在…

大数据 1天前

Flink 内容分享(二十七)：Hadoop vs Spark vs Flink——大数据框架比较

大数据开发离不开各种框架，我们通过学习 Apache Hadoop、Spark 和 Flink 之间的特征比较，可以从侧面了解要学习的内容。众所周知，Hadoop vs Spark…

大数据 1天前

大数据

FlinkSQL对接MySQL CDC写入数据到Hive

环境搭配想要针对公司集群环境学习一下Flink对接MySQL CDC写入Hive的方法，并对过程进行记录。公司环境为CDH 6.3.2搭建的集群，MySQL使用的是AWS RDS…

1天前