大数据 | 第18页 | 协通编程

大数据

Flink进阶篇-CDC 原理、实践和优化&采集到Doris中

简介基于doris官方用doris构建实时仓库的思路，从flinkcdc到doris实时数仓的实践。原文 Apache Flink X Apache Doris 构建极速易用…

1天前

深入解析java.lang.IllegalStateException异常

异常概述什么是异常异常是程序在执行过程中遇到的错误或异常情况。在Java中，异常是指在程序运行期间发生的错误，它可以打破程序的正常流程，并且可能导致程序终止。异常的分类异常…

Jave 1天前

数据库

Elasticsearch之聚合查询介绍与使用（附RestAPI代码案例）

前言：大家好，我是小威，24届毕业生，在一家满意的公司实习。本篇文章将介绍Elasticsearch搜索引擎之聚合查询的介绍与使用，这块内容不作为面试中的重点。如果文章有什么需要…

1天前

Hadoop的任务调度与资源管理

1.背景介绍 Hadoop是一个分布式文件系统和分布式计算框架，由Google的MapReduce和Google File System(GFS)技术启发。Hadoop的核心组件有…

大数据 1天前

大数据

Flink进阶篇-CDC 原理、实践和优化&采集到Doris中

简介基于doris官方用doris构建实时仓库的思路，从flinkcdc到doris实时数仓的实践。原文 Apache Flink X Apache Doris 构建极速易用…

1天前

ES-聚合查询

1. 概念聚合（aggs）不同于普通查询，是目前学到的第二种大的查询分类，第一种即“query”，因此在代码中的第一层嵌套由“query”变为了“aggs”。用于进行聚合的字段必…

大数据 1天前

Hive 的 UDF 函数（Python 版本）

Hive 的 UDF 函数（Python 版本）一、UDF 是什么 Hive 中支持很多的函数，可以极大的方便我们的工作。但是系统内置的函数虽然很多，却不能满足我们所有的需求。在…

大数据 1天前

Hadoop分布式集群安装

上一篇大数据文章讲解了在单机上搭建Hadoop-Yarn 伪分布式集群的安装方法，方便大家学习，真实环境不可能只有一台机器，肯定是多节点的集群，大单位还会建设很多H…

大数据 1天前

Log4j2 配置日志记录发送到 kafka 中

前言 log4j2 在 2.11.0 之后的版本，已经内置了 KafkaAppender 支持可以将打印的日志直接发送到 kafka 中，在这之前如果想要集中收集应用的日志，就需要…

大数据 1天前

大数据

【大数据】Flink 架构（一）：系统架构

《Flink 架构》系列（已完结），共包含以下 6 篇文章： Flink 架构（一）：系统架构 Flink 架构（二）：数据传输 Flink 架构（三）：事件时间处理 Flink …

1天前

信息论与大数据：挖掘大数据中的价值

1.背景介绍大数据是当今信息时代的一个重要话题，它指的是由于互联网、通信技术、计算机技术等的发展，使得数据量大、高速增长、不断变化的数据集。大数据的特点是五个V：量、速度、变化、…

大数据 1天前

大数据

数据资产入表，这泼天的富贵大数据团队怎样才能接住？

“ 大数据团队是成本中心还是价值中心？数据资产入表，国家是怎么说的？数据平台应具备哪些能力，才能助力企业最大化数据资产价值？” 2022年12月，国务院发文关于发挥数据要素作…

1天前

人工智能

大数据前馈神经网络解密：深入理解人工智能的基石

文章目录大数据前馈神经网络解密：深入理解人工智能的基石一、前馈神经网络概述什么是前馈神经网络前馈神经网络的工作原理应用场景及优缺点二、前馈神经网络的基本结构输入层、隐…

1天前

大数据

【spark】

一、Spark是什么 Spark是一种基于内存的快速、通用、可扩展的大数据分析计算引擎。 Spark是基于Scala语言开发的。整个Spark框架模块包含：Spark Core、…

1天前

大数据

Flink、Yarn架构，以Flink on Yarn部署原理详解

Flink、Yarn架构，以Flink on Yarn部署原理详解 Flink 架构概览 Apache Flink是一个开源的分布式流处理框架，它可以处理实时数据流和批处理数据。F…

1天前