数据仓库
-
【数据仓库与联机分析处理】多维数据模型
目录 一、数据立方体 二、数据模型 (一)星形模型 (二)雪花模式 (三)事实星座模式 三、多维数据模型中的OLAP操作 (一)下钻 (二)上卷 (三)切片 (四)切块 (五)转轴…
-
Hive的几种排序方式、区别,使用场景
一、几种排序和区别 Hive 支持两种主要的排序方式:ORDER BY 和 SORT BY。除此之外,还有 DISTRIBUTE BY 和 CLUSTER BY 语句,它们也在排…
-
数据仓库的数据仓库灾备与恢复:保证数据仓库的可用性和稳定性
1.背景介绍 数据仓库是企业中大量的历史数据的集中存储和管理系统,它的数据量巨大,数据更新频繁,对企业业务的稳定运行具有重要的支持作用。因此,保证数据仓库的可用性和稳定性是企业业务…
-
【数据仓库与联机分析处理】数据仓库工具Hive
目录 一、Hive简介 (一)什么是Hive (二)优缺点 (三)Hive架构原理 (四)Hive 和数据库比较 二、MySQL的安装配置 三、Hive的安装配置 1、下载安装包 …
-
【数据库原理】(38)数据仓库
数据仓库(Data Warehouse, DW)是为了满足企业决策分析需求而设计的数据环境,它与传统数据库有明显的不同。 一.数据库仓库概述 定义: 数据仓库是一个面向主题的、集成…
-
熟悉 Hive 的基本操作
4、实验步骤 (一)创建一个内部表 stocks,字段分隔符为英文逗号,表结构下所示。 col_name data_type exchange string symbol stri…
-
数据仓库表级血缘应用
数仓血缘应用(一):表血缘热度 文章目录 数仓血缘应用(一):表血缘热度 前言 一、价值衡量指标——应用层 二、血缘节点应用——热度 1、指标透传(应用层——>数仓) 2、指…
-
【大数据】Doris 构建实时数仓落地方案详解(一):实时数据仓库概述
本系列包含: Doris 构建实时数仓落地方案详解(一):实时数据仓库概述 Doris 构建实时数仓落地方案详解(二):Doris 核心功能解读 Doris 构建实时数仓落地方案详…
-
Apache Doris 2.0.4 版本正式发布
亲爱的社区小伙伴们,Apache Doris 2.0.4 版本已于 2024 年 1 月 26 日正式发布,该版本在新优化器、倒排索引、数据湖等功能上有了进一步的完善与更新,使 A…
-
数据仓库内容分享(四):滴滴大数据成本治理实践
目录 01 滴滴大数据成本治理总体框架 1. 滴滴数据体系 2. 滴滴大数据资产管理平台 3. 滴滴大数据成本治理总体框架 02 Hadoop 成本治理实践 03 ES 成本治理实…
-
数据仓库-相关概念
简介 数据仓库是一个用于集成、存储和管理大量数据的系统。它用于支持企业决策制定过程中的数据分析和报告需求。数据仓库从多个来源收集和整合数据,并将其组织成易于查询和分析…
-
今天又get到一个小技能,collect
collect_set函数 今天又get到一个小技能,掌握了hive一个关于列转行专用函数 collect_set函数。 在这里做个学习笔记。 collect_set是Hive内置…
-
ClickHouse与数据仓库集成
1.背景介绍 在当今的数据驱动经济中,数据仓库是企业和组织中非常重要的组件。数据仓库用于存储、管理和分析大量的结构化和非结构化数据,以支持决策和业务操作。随着数据的增长和复杂性,数…
-
构建高效数据生态:数据库、数据仓库、数据湖、大数据平台与数据中台解析
在数字化的浪潮中,一套高效的数据管理系统是企业竞争力的核心。从传统的数据库到现代的数据中台,每一种技术都在数据的旅程中扮演着关键角色。本文将深入探讨数据库、数据仓库、数据湖、大数据…
-
hive中map相关函数总结
目录 hive官方函数解释 示例 实战 hive官方函数解释 hive官网函数大全地址: hive官网函数大全地址 Return Type Name Description map…
