hadoop
-
构建大数据环境:Hadoop、MySQL、Hive、Scala和Spark的安装与配置
前言 在当今的数据驱动时代,构建一个强大的大数据环境对于企业和组织来说至关重要。本文将介绍如何安装和配置Hadoop、MySQL、Hive、Scala和Spark,以搭建一个完整的…
-
Hadoop的安装实验报告
一、实验目的 1. 掌握Linux虚拟机的安装方法。Hadoop在Linux操作系统上运行可以发挥最佳性能。鉴于目前很多读者正在使用Windows操作系统,因此,为了完成本书的后续…
-
掌握大数据–Hive全面指南
1.Hive简介 2.Hive部署方式 3.Hive的架构图 4.Hive初体验 5.Hive SQL语法–DDL操作数据库 1.Hive简介 Apache Hive是…
-
权限管理-Ranger的介绍和使用(集成Hive)
文章目录 概述 介绍 目标 支持的框架 权限模型 架构 系统插件 安装 环境说明 创建系统用户和Kerberos主体 安装RangerAdmin 数据库环境准备 安装RangerA…
-
【大数据实训】基于Hive的北京市天气系统分析报告(二)
博主介绍:✌全网粉丝6W+,csdn特邀作者、博客专家、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于大数据技术领域和毕业项目实战✌ &#…
-
Hive 优化总结
Hive优化 本质:HDFS + MapReduce 问题原因: 倾斜: 分区:有的分区没有数据,有的分区数据堆积。(若按天分区,每一天数据差别大就叫倾斜。) group by:有…
-
基于 Docker 搭建 Hadoop 分布式及 Docker 基本操作使用
文章目录 Docker的介绍及安装 Docker的介绍 基于平台 Docker的安装 检验系统是否符合安装条件以及更新软件列表 安装Docker及测试 Docker镜像构建及Had…
-
Redis与Hadoop集成
1.背景介绍 随着大数据时代的到来,数据的规模和复杂性不断增加,传统的数据库和数据处理技术已经无法满足需求。为了更有效地处理大量数据,人们开始研究和开发新的数据处理技术和架构。Re…
-
Hadoop HA集群两个NameNode都是standby或者主NameNode是standby,从NameNode是active的情况集锦
文章目录 背景 架构 HDFS HA配置 错误原因 解决方案 方案一 方案二 方案三(首先查看自己各参数文件是否配置出错) 后记 补充 failover transitionToA…
-
Hive的基本SQL操作(DDL篇)
目录 编辑 一、数据库的基本操作 1.1 展示所有数据库 1.2 切换数据库 1.3 创建数据库 1.4 删除数据库 1.5 显示数据库信息 1.5.1 显示数据库信息 1.5….
-
启动 AWS Academy Learner Lab【教学】(Hadoop实验)
🔥博客主页: A_SHOWY🎥系列专栏:力扣刷题总结录 数据结构 云计算 第一部分 创建实例过程 首先,需要创建3台EC2,一台作主…
-
学完了Hadoop,我总结了这些重点
文章目录 一、Hadoop 组成 Hadoop1.x 、2.x 、3.x 的区别 HDFS架构概述 MapReduce架构概述 YARN架构概述 二、常用端口号 三、常用的配置文件…
-
二百零九、Hive——with嵌套语句报错:hadoop.hive.ql.parse.SemanticException: Line 2:5 Ambiguous table alias ‘t2‘
一、目的 在Hive的with嵌套语句时,HQL报错Line 2:5 Ambiguous table alias ‘t2’ 二、报错详情 org.apach…
-
大数据开发之Hadoop(完整版+练习)
第 1 章:Hadoop概述 1.1 Hadoop是什么 1、Hadoop是一个由Apache基金会所开发的分布式系统基础架构。 2、主要解决,海量数据的存储和海量数据的分析计算问…
-
HDFS的基本操作(创建目录或文件、查看目录或文件、上传和拷贝文件到HDFS上、追加数据到HDFS上、从HDFS上下载文件到Linux本地、合并HDFS文件)
文章目录 前言 一、HDFS的相关命令 1、在HDFS创建目录 2、查看当前目录 3、查看目录与子目录 4、查看文件的内容 5、创建文件 6、上传和拷贝文件 7、追加数据到HDFS…
