hive | 协通编程

大数据

hive–给表名和字段加注释

1.建表添加注释 CREATE EXTERNAL TABLE `test`( `loc_province` string comment ‘省份’, `loc_city` stri…

1天前

大数据

用户行为分析遇到的问题-ubantu16,hadoop3.1.3

用户行为分析传送门我的版本 ubantu16 hadoop 3.1.3 habse 2.2.2 hive3.1.3 zookeeper3.8.3 sqoop 1.46/1.47 …

1天前

大数据

HIVE 中INSERT INTO 和 INSERT OVERWRITE 的区别，以及OVERWRITE哪些隐藏的坑

HIVE 中INSERT INTO 和 INSERT OVERWRITE 的区别，以及 overwrite 在分区表和非分区表中使用时的注意事项。概要 1.hive中insert…

1天前

大数据

Hive简述

Hive的产生背景数据库擅长事务性的工作，但不擅长分析型的工作，所以应要求就产生了数据仓库。数据仓库相当于集成化数据管理的平台，从多个数据源抽取有价值的数据，在仓库内转换和流动…

1天前

大数据

基于大数据的地域职位需求和薪资分析

目录摘要 I ABSTRACT II 第 1 章项目引言 1 1.1项目背景 1 1.2国内研究现状 1 1.3研究内容 2 1.4论文结构 2 第 2 章项目框架 3 …

1天前

【数据开发】Hive 多表join中的条件过滤与指定分区

1、条件过滤 left join 中 on 后面加条件 where 和 and 的区别 1、 on条件是在生成临时表时使用的条件，它不管and中的条件是否为真，都会保留左边表中的全…

大数据 1天前

大数据

Hive分区表实战 – 多分区字段

文章目录一、实战概述二、实战步骤（一）创建学校数据库（二）创建省市分区的大学表（三）在本地创建数据文件 1、创建四川成都学校数据文件 2、创建四川泸州学校数据文件 3、创…

1天前

大数据

Hive06

HIVE 查询语句 1 查询语句语法： SELECT [ALL | DISTINCT] select_expr, select_expr, … FROM table_refer…

1天前

大数据

大数据之使用Spark增量抽取MySQL的数据到Hive数据库（1）

目录前言题目：一、读题分析二、处理过程 1.采用SparkSQL使用max函数找到最大的日期然后转换成时间类型在变成字符串 2.这里提供除了SQL方法外的另一种过滤不满足条…

1天前

大数据

Hive-SQL语法大全

Hive SQL 语法大全基于语法描述说明 CREATE DATABASE [IF NOT EXISTS] db_name [LOCATION] ‘path’; SELECT e…

1天前

dolphin上MySQL到hive、seatunnel任务创建

dolphin上MySQL到hive、seatunnel任务创建： 1.先获取所需数量的taskCode Long taskCode = getClient().opsForPro…

大数据 1天前

Flink SQL –Flink 整合 hive

1、整合 # 1、将依赖包上传到flink的lib目录下 flink-sql-connector-hive-3.1.2_2.12-1.15.2.jar # 2、重启flink集群 …

大数据 1天前

大数据之使用Spark全量抽取MySQL的数据到Hive数据库

文章目录前言一、读题分析二、使用步骤 1.导入配置文件到pom.xml 2.代码部分三、重难点分析总结前言本题来源于全国职业技能大赛之大数据技术赛项赛题-离线数据处理…

大数据 1天前

Hive SQL判断一个字符串中是否包含字串的N种方式及其效率

Hive SQL判断一个字符串中是否包含字串的N种方式及其效率背景方案1:regexp_extract 方案2:instr 方案3:locate 方案4:like 方案5: r…

大数据 1天前

大数据

Hive常见报错与解决方案

背景公司近期上火山云，hive、hadoop、tez等都有较大的版本升级，继而引发了一系列的报错。现将遇到的报错内容以及相应解决方法列出来，供大家参考。关于版本：组件升级…

1天前