大数据 | 第3页 | 协通编程

大数据

Flink多流转换（2）—— 双流连结

双流连结（Join）：根据某个字段的值将数据联结起来，“配对”去做处理窗口联结（Window Join）可以定义时间窗口，并将两条流中共享一个公共键（key）的数据放在窗口中进…

1天前

大数据在能源与环境领域的应用与影响

1.背景介绍大数据在各个领域的应用已经广泛，能源与环境领域也不例外。在这篇文章中，我们将深入探讨大数据在能源与环境领域的应用与影响。 1.1 能源与环境的重要性能源是现代社会的…

大数据 1天前

Flink CDC整库同步（多表异构同步）

前言 flinkcdc单表同步比较简单，按照官方案例基本都能成功，多表异构同步、整库同步这块一直想尝试一下，社区说使用API可以做到，但是一直没能白嫖到可行方案（代码），然后自己动…

大数据 1天前

大数据

linux环境下ES的单机和集群部署，kibana的安装部署，cerebro的安装部署

ES下载安装我选择的是7.13.0的版本，可以在官网下载对应的版本之后再上传到我们自己的Linux虚拟机上。或者可以在自己本地linux虚拟机上执行如下命令下载es的压缩包。 …

1天前

大数据

基于Python的电子产品销售数据可视化分析 (大数据专业毕设)

目录研究目的：数据分析：研究意义：研究过程：研究结果：研究内容：需求分析：可行性分析：功能分析：算法：研究目的：本研究的目的是利用Python编程语言对电…

1天前

Jave

java.net.NoRouteToHostException No route to host的排查与解决思路分享

相信很多朋友曾经都遇到过这个问题，最近也是被这个错误折磨的怀疑人生。在执行HiveSQL的时候总是时不时报错，could not find status of job 然后进入ya…

1天前

大数据

Hive06

HIVE 查询语句 1 查询语句语法： SELECT [ALL | DISTINCT] select_expr, select_expr, … FROM table_refer…

1天前

物理系统的计算能力：如何应对大数据挑战

1.背景介绍大数据是当今世界面临的一个重大挑战，它需要我们设计高效、高性能的计算系统来处理和分析。物理系统的计算能力在这个领域发挥着关键作用。本文将探讨如何利用物理系统的计算能力…

大数据 1天前

大数据

【大数据技术攻关专题】「Apache-Flink零基础入门」手把手+零基础带你玩转大数据流式处理引擎Flink（特点和优势分析+事件与时间维度分析）

手把手+零基础带你玩转大数据流式处理引擎Flink（特点和优势分析+事件与时间维度分析）总体介绍状态容错精确的一次性处理模式简单场景的精确一次容错方法分布式状态容错容错…

1天前

大数据

大数据的关键技术之——大数据采集

大数据的关键技术之——大数据采集本文目录：一、写在前面的话二、大数据采集概念三、大数据采集步骤 3.1、大数据采集步骤（总体角度） 3.2、大数据采集步骤（数据集角度） 3…

1天前

大数据

Flink学习13-Flink CDC

一、CDC简介 cdc全称 Change Data Capture 变更数据捕获。通俗来讲只要能捕获到变更的数据的技术都可以称为cdc。常见的开源技术有以下几种： canal：ht…

1天前

大数据

Flink 1.17.0集群搭建

集群角色分配 Hostname IP Role hadoop01 192.168.126.132 JobManager TaskManager hadoop02 192.168.1…

1天前

大数据

数据库系统原理与应用教程（014）—— 关系数据库练习题（一）

数据库系统原理与应用教程（014）—— 关系数据库练习题（一）一、简答题 1、试述关系模型的三要素和关系操作语言的特点。答案：关系模型的三要素为数据结构、关系操作和完整性约束…

1天前

大数据

2024.1.11 Kafka 消息队列,shell命令,核心原理

目录一 . 消息队列二. Kafka 三 . 启动命令四 . Kafka的Shell 命令五 . Kafka的核心原理 1. Topic的分区和副本机制 2 . 消息存…

1天前

大数据

Hadoop从入门到宕机

Hadoop 1.介绍&概览 Hadoop是一个开源的分布式计算平台，用于存储和处理大规模数据集。它的核心组件包括HDFS（Hadoop分布式文件系统）用于存储大数据集，Y…

1天前