数据仓库
-
从一个SQL打印全年日历漫谈数据仓库中时间操作场景的重点写法
文章目录 前言 一、我如何快速确定今年是否是闰年的😣 二、 我如何从DATE类型数据获取年、月(月初&月末)、周、日、时、分、秒信息🤯 三、…
-
数据仓库面试题
1 思维导图&数仓常见面试题 2 题目 1. 数据仓库是什么? 数据仓库是一个面向主题的(订单、支付、退单等)、集成的(整合多个信息源的大量数据)、非易失的(一般不会进…
-
HIVE调优方式(大全)
压缩方式: HIVE压缩方式: 概述:压缩方式就类似于windows的压缩包,可以降低传输,提高磁盘利用率. 区分压缩协议好坏的参考纬度: 1.压缩比,即:压缩后文件大小 2.解压…
-
数据仓库与数据科学的结合
1.背景介绍 数据仓库和数据科学是两个与数据处理和分析密切相关的领域。数据仓库主要关注于存储和管理大量历史数据,以支持企业决策和分析,而数据科学则关注于利用这些数据来发现隐藏的模式…
-
「SQL面试题库」 No
🍅 1、专栏介绍 「SQL面试题库」是由 不是西红柿 发起,全员免费参与的SQL学习活动。我每天发布1道SQL面试真题,从简单到困难,涵盖所有SQL知识点,我敢保证…
-
银行数据仓库体系实践(1)–银行数据仓库简介
银行数据仓库简介 数据仓库之父比尔(Bill Inmon)在1991年出版的“Building the Data Warehouse”(《建立数据仓库》)一书中所提…
-
[DataX引擎配置错误,该问题通常是由于DataX安装错误引起,请联系您的运维解决 .]. – 在有总bps限速条件下,单个channel的bps值不能为空,也不能为非正数
目录 一、背景 二、报错 三、定位原因 四、解决办法 1.修改文件datax/conf/core.json 2.json内容中删除总限速的配置 五、参数说明 六、DataX提速优化…
-
【DolphinScheduler】datax读取hive分区表时,空分区、分区无数据任务报错问题解决
问题背景: 最近在使用海豚调度DolphinScheduler的Datax组件时,遇到这么一个问题:之前给客户使用海豚做的离线数仓的分层搭建,一直都运行好好的,过了个元旦,这几天突…
-
hive的应用场景
网站日志分析: 假设你运营一个大型网站,你可以将网站产生的日志数据导入到Hive中,然后通过执行Hive查询分析用户行为、访问模式、热门内容等。这有助于优化网站性能和改善用户体验。…
-
HIVE(三)+ 教育项目
目录 目录 分桶表 函数 空字符段赋值函数 CASE WHEN THEN ELSE END 多列变一列 一行变多行 窗口函数(开窗函数) 自定义函数 压缩和存储 文件存储格式 离…
-
2023年最新交通航线(飞机、高铁)信息数据合集(含经纬度匹配)
中国高铁航线数据库Chinese High-speed Rail and Airline Database,CRAD)是一个专门收集和管理航空公司和高铁公司交通航线信息的数据仓库。…
-
Hive中的常用concat函数——concat函数、concat
1、concat() 1.1、用法:concat(str1,str2,str3,…) 连接参数的函数,返回结果为连接参数的字符串。如果有一个参数为NULL,则返回的结果为NULL。…
-
【DBeaver】驱动添加-Hive和星环
驱动 Hive驱动 hive驱动可以直接去官网下载官网地址,填一下个人信息。 如果想直接下载可以去我上次的资源下地址,需要用zip解压。 星环驱动 星环驱动是我第一次接触,是国产的…
-
kettle系列(2)kettle连接sql sever
在系列(1)已经介绍过kettle以及使用了,这次就直接正题 kettle使用,进行sql sever连接 版本: kettle 7.1 sql sever 2022 环境: …
-
Hive csv文件导入Hive
一、如何把csv文件导入Hive (1) 在Hive中建立与csv相对应的表 create table if not exists tmp.tmp_wenxin_20231123 …
