数据仓库
-
Hive表操作
1.表操作语法和数据类型 1.创建数据库表语法 –库创建查看命令 show databases; –表创建查看命令 show tables; –查看表的基本结构 desc t…
-
hive解析json
目录 一、背景 二、hive 解析 json 数据函数 1、get_json_object 2、json_tuple 3、使用嵌套子查询(explode+regexp_repla…
-
hive里因为列名用了关键字导致建表失败
代码 现象 ParseException line 6:4 cannot recognize input near ‘percent’ ‘Str…
-
hivesql 将json格式字符串转为数组
hivesql 将json格式字符串转为数组 完整过程SQL在文末 json 格式字符串 本案例 json 字符串参考格式,请勿使用本数据 { “data”: [ { “provi…
-
拉链表详解
目录 一、拉链表概念 二、拉链表对应的业务需求 三、代码实现 3.1 数据初始化: 3.2 创建ods层增量表: 3.3 创建dwd层拉链表 3.4 数据更新 ,将数据日期为…
-
hive中struct相关函数总结
目录 hive官方函数解释 示例 实战 hive官方函数解释 hive官网函数大全地址:添加链接描述 Return Type Name Description struct str…
-
数据湖-hudi概述
前言 数据湖是目前比较热的一个概念,许多企业都在构建或者计划构建自己的数据湖。 数据湖是一个集中式存储库,允许您以任意规模存储所有结构化和非结构化数据。您可以按原样存储数据(无需先…
-
大数据导论期末复习知识汇总
目录 一、大数据概述 (一)数据和信息 (二)数据的组织形式和生命周期: (三)数据转化为信息的过程: (四)数据的价值 (五)大数据的内涵 (六)大数据的5V特性 (七)数据产生…
-
Hive09
HIVE函数 系统内置函数 1)查看系统自带的函数 hive> show functions; 2)显示自带的函数的用法 hive> desc function upp…
-
【hive】hive修复分区或修复表 以及msck命令的使用
【hive】hive修复分区或修复表 以及msck命令的使用 文章目录 【hive】hive修复分区或修复表 以及msck命令的使用 问题原因: 解决方法: msck命令解析: 例…
-
如何使用 Hive 进行自然语言处理
1.背景介绍 自然语言处理(NLP,Natural Language Processing)是人工智能领域的一个重要分支,其主要目标是让计算机能够理解、生成和翻译人类语言。自然语言…
-
数据仓库与Hadoop:如何实现大规模数据处理
1.背景介绍 数据仓库和Hadoop都是处理大规模数据的重要技术,它们在现代数据科学和人工智能中发挥着至关重要的作用。数据仓库是一种用于存储和管理大量历史数据的系统,主要用于数据分…
-
Hive的四种排序方法
Hive的四种排序方法 hive排序方法,hive的排序方式 hive有四种排序方法: ORDER BY 、SORT BY 、DISTRIBUTE BY 、CLUSTER BY 0…
-
Hive数据仓库应用课后题及答案
《Hive数据仓库应用》课后习题 Hive简介 一、填空题 1.数据仓库的目的是构建面向分析的集成化数据环境。 2.Hive是基于Hadoop的一个数据仓库工具。 3.数据仓库分…
-
2023.11.16-hive sql高阶函数lateral view,与行转列,列转行
目录 0.lateral view简介 1.行转列 需求1: 需求2: 2.列转行 解题思路: 0.lateral view简介 hive函数 lateral view 主要…
