hadoop

大数据

构建大数据环境：Hadoop、MySQL、Hive、Scala和Spark的安装与配置

前言在当今的数据驱动时代，构建一个强大的大数据环境对于企业和组织来说至关重要。本文将介绍如何安装和配置Hadoop、MySQL、Hive、Scala和Spark，以搭建一个完整的…

1天前

大数据

Hadoop的安装实验报告

一、实验目的 1. 掌握Linux虚拟机的安装方法。Hadoop在Linux操作系统上运行可以发挥最佳性能。鉴于目前很多读者正在使用Windows操作系统，因此，为了完成本书的后续…

1天前

大数据

掌握大数据–Hive全面指南

1.Hive简介 2.Hive部署方式 3.Hive的架构图 4.Hive初体验 5.Hive SQL语法–DDL操作数据库 1.Hive简介 Apache Hive是…

1天前

数据库

权限管理-Ranger的介绍和使用(集成Hive)

文章目录概述介绍目标支持的框架权限模型架构系统插件安装环境说明创建系统用户和Kerberos主体安装RangerAdmin 数据库环境准备安装RangerA…

1天前

大数据

【大数据实训】基于Hive的北京市天气系统分析报告(二)

博主介绍：✌全网粉丝6W+,csdn特邀作者、博客专家、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于大数据技术领域和毕业项目实战✌ &#…

1天前

大数据

Hive 优化总结

Hive优化本质：HDFS + MapReduce 问题原因：倾斜：分区：有的分区没有数据，有的分区数据堆积。(若按天分区，每一天数据差别大就叫倾斜。) group by：有…

1天前

大数据

基于 Docker 搭建 Hadoop 分布式及 Docker 基本操作使用

文章目录 Docker的介绍及安装 Docker的介绍基于平台 Docker的安装检验系统是否符合安装条件以及更新软件列表安装Docker及测试 Docker镜像构建及Had…

1天前

Redis与Hadoop集成

1.背景介绍随着大数据时代的到来，数据的规模和复杂性不断增加，传统的数据库和数据处理技术已经无法满足需求。为了更有效地处理大量数据，人们开始研究和开发新的数据处理技术和架构。Re…

大数据 1天前

Hadoop HA集群两个NameNode都是standby或者主NameNode是standby，从NameNode是active的情况集锦

文章目录背景架构 HDFS HA配置错误原因解决方案方案一方案二方案三（首先查看自己各参数文件是否配置出错）后记补充 failover transitionToA…

大数据 1天前

大数据

Hive的基本SQL操作（DDL篇）

目录编辑一、数据库的基本操作 1.1 展示所有数据库 1.2 切换数据库 1.3 创建数据库 1.4 删除数据库 1.5 显示数据库信息 1.5.1 显示数据库信息 1.5….

1天前

大数据

启动 AWS Academy Learner Lab【教学】（Hadoop实验）

🔥博客主页： A_SHOWY🎥系列专栏：力扣刷题总结录数据结构云计算第一部分创建实例过程首先，需要创建3台EC2，一台作主…

1天前

大数据

学完了Hadoop，我总结了这些重点

文章目录一、Hadoop 组成 Hadoop1.x 、2.x 、3.x 的区别 HDFS架构概述 MapReduce架构概述 YARN架构概述二、常用端口号三、常用的配置文件…

1天前

大数据

二百零九、Hive——with嵌套语句报错：hadoop.hive.ql.parse.SemanticException: Line 2:5 Ambiguous table alias ‘t2‘

一、目的在Hive的with嵌套语句时，HQL报错Line 2:5 Ambiguous table alias ‘t2’ 二、报错详情 org.apach…

1天前

大数据

大数据开发之Hadoop（完整版+练习）

第 1 章：Hadoop概述 1.1 Hadoop是什么 1、Hadoop是一个由Apache基金会所开发的分布式系统基础架构。 2、主要解决，海量数据的存储和海量数据的分析计算问…

1天前

HDFS的基本操作（创建目录或文件、查看目录或文件、上传和拷贝文件到HDFS上、追加数据到HDFS上、从HDFS上下载文件到Linux本地、合并HDFS文件）

文章目录前言一、HDFS的相关命令 1、在HDFS创建目录 2、查看当前目录 3、查看目录与子目录 4、查看文件的内容 5、创建文件 6、上传和拷贝文件 7、追加数据到HDFS…

算法结构 1天前