数据仓库
-
Hive之lead函数详解
例如如下语句: drop table if exists temp03; create table temp03 as select card_no, deal_date, dea…
-
一百八十八、Hive——HiveSQL查询表中的日期是星期几(亲测,附截图)
一、目的 指标需要查询以工作日和周末维度的数据统计,因此需要根据数据的日期判断这一天属于星期几,周一到周五为工作日,周六到周日为周末 二、SQL查询 (一)SQL语句 select…
-
浅识数据库与数据仓库的区别
通常我们会认为数据库与数据仓库都是用来存储数据的一个库,好像并没有什么明显区别,下面就从几个方面简单认识一下两者的区别。 从名称角度区分 数据库(Database):用来存储一些基…
-
开源、云原生且实时分析型的现代数据仓库DataBend的介绍,及其与其它开源文件存储的结合使用实例
DataBend介绍 Databend 是一个开源、云原生且实时分析型的现代数据仓库,旨在提供高效的数据存储和处理能力。它采用 Rust 语言开发,并支持 Apache Arrow…
-
Spark代码案例
一、SparkSQL案例(电影数据统计) 数据源:http://files.grouplens.org/datasets/movielens/ml-100k/u.data 复制网页…
-
Hive实战:学生信息排序
文章目录 一、实战概述 二、提出任务 三、完成任务 (一)准备数据 1、在虚拟机上创建文本文件 2、上传文件到HDFS指定目录 (二)实现步骤 1、启动Hive Metastore…
-
【第十一届泰迪杯数据挖掘挑战赛】A 题:新冠疫情防控数据的分析 思路+代码(持续更新)
【第十一届泰迪杯数据挖掘挑战赛】A 题:新冠疫情防控数据的分析 思路+代码(持续更新) 问题背景 解决问题 代码下载 数据分析 Task1 Task2 Task3 Task4 问题…
-
Hive 的日志和监控工具
1.简介 在大数据领域中,Hive 是一个非常常用的数据仓库解决方案。在实际生产环境中,为了保障 Hive 的稳定运行和及时发现问题,日志和监控工具是必不可少的组成部分。本章节将详…
-
DBeaver连接hive(详细图解)
文章目录 DBeaver 简介 使用DBeaver连接hive (1)配置Maven仓库 (2)配置hive驱动 (3)创建hive连接 (4)连接测试 DBeaver 简介 db…
-
Hive复杂数据类型(array类型、map类型、struct类型)
目录 一、array类型 1.查询array内包含的指定词信息 2.查询array中元素的个数 3.查询array内指定序号信息 …
-
SparkSQL和Hive语法差异
SparkSQL和Hive语法差异 1、仅支持Hive SparkSQL关联条件on不支持函数rand() 创建零时表时,Spark不支持直接赋值null Spark无法读取字段类…
-
Flink+Paimon多流拼接性能优化实战
目录 (零)本文简介 意外收获: (一)背景 (二)探索梳理过程 (三)源码改造 (四)修改效果 1、JOB状态 2、Level5的dataFile总大小 3、数据延迟 4、关联率…
-
hive语法
DDL 1.数据库操作 (1)创建库 create database db_hive1; (2)显示库 show databases; show database like …
-
hive框架与数据类型
hive Hive是一个基于Hadoop的数据仓库工具,它提供了类似于SQL的查询语言HiveQL来查询和分析大规模数据。Hive将结构化的数据文件映射为一张数据库表,并提供了SQ…
-
【数据库原理 | MySQL】 前世今生(入坑篇)
🤵♂️ 个人主页: @计算机魔术师 👨💻 作者简介:CSDN内容合伙人,全栈领域优质创作者。 文章目录 一、Mysql 概述 1…
