大数据 | 第45页 | 协通编程

大数据

Hadoop—20.网站日志分析项目案例（详解）

目录一、导入数据 1、启动hadoop 2、在hdfs下创建文件夹hadoop_class 3、查询文件夹是否创建成功 4、在hadoop_class下创建一个文件夹存放总数据…

1天前

大数据

【大数据】Flink CDC 的概览和使用

Flink CDC 的概览和使用 1.什么是 CDC 2.什么是 Flink CDC 3.Flink CDC 前生今世 3.1 Flink CDC 1.x 3.2 Flink CD…

1天前

Flink的流中的自定义排序操作

1.背景介绍在大数据处理领域，流处理是一种实时的数据处理方法，用于处理大量的、高速的、实时的数据流。Apache Flink是一个流处理框架，可以用于实现流处理任务。在Flink…

大数据 1天前

大数据

flink作业 windowAll 转换window

一. windowAll 和window介绍 datastream 流中没有使用keyby需要使用windowAll函数，使用了keyby的需要使用window函数 Keyed W…

1天前

【大数据入门核心技术-Doris】（三）Doris基本Shell和数据模型

一、环境准备参考【大数据入门核心技术-Doris】（二）Doris安装部署_forest_long的博客-CSDN博客二、基本增删改查语句一、DCL 1、登录 mysql …

大数据 1天前

人工智能

stata回归？固定效应模型（组内变换OR LSDV最小二乘法）

面板数据分析与Stata应用笔记整理自慕课上浙江大学方红生教授的面板数据分析与Stata应用课程，笔记中部分图片来自课程截图。笔记内容还参考了陈强教授的《高级计量经济学及Stat…

1天前

大数据

文献回顾 | 你还在这样使用工业企业数据库吗?

你还在这样使用工业企业数据库吗？编者按：本文根据聂辉华、江艇、杨汝岱三位学者的《中国工业企业数据库的使用现状与潜在问题》（世界经济，2012）总结而成。众所周知的是，中国工业企…

1天前

大数据

大数据StarRocks(三) StarRocks数据表设计

1. 列式存储 1.1 列式存储方式有以下几个优点： 1.快速的数据查询由于数据是按照列进行存储的，所以查询某个列时只需要读取该列所在的块，而不是整行数据，从而大大提高了查询效率…

1天前

大数据篇Kafka消息队列指定Topic打印Key、Value、Offset和Partition

1、概念简介说到Apache Kafka消息传递系统时，以下是一些关键概念的解释： Key（键）：Kafka消息由Key和Value组成。Key是一个可选的字段，它通常用于消息的…

大数据 1天前

大数据与人工智能：改变交通运输行业的未来

1.背景介绍交通运输行业是现代社会的重要组成部分，它为人们提供了方便快捷的出行方式。然而，随着人口增长和城市发展，交通拥堵、交通事故、交通拥堵等问题日益严重，对于交通运输行业的发…

大数据 1天前

大数据

kafka启用SASL认证后使用kafka-consumer-groups.sh查看消费组报错的问题

解决SASL认证类型kafka在使用kafka-consumer-groups.sh查看消费组数据时，报以下异常的问题 Error: Executing consumer grou…

1天前

Hudi源码|Insert源码分析总结（一）(整体流程)

前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站：https://www.captainai.net/dongkelun 前言 Ap…

大数据 1天前

大数据

大数据Doris（四十八）：Doris的动态分区示例与查看动态分区表调度情况

文章目录 Doris的动态分区示例与查看动态分区表调度情况一、示例

1天前

大数据

大数据采集技术与预处理学习一：大数据概念、数据预处理、网络数据采集

目录大数据概念： 1.数据采集过程中会采集哪些类型的数据？ 2.非结构化数据采集的特点是什么？ 3.请阐述传统的数据采集与大数据采集的区别？ 4.大…

1天前

大数据

深入理解 Flink（三）Flink 内核基础设施源码级原理详解

深入理解 Flink 系列文章已完结，总共八篇文章，直达链接：深入理解 Flink （一）Flink 架构设计原理深入理解 Flink （二）Flink StateBacken…

1天前