hadoop
-
大数据存储系统HDFS和对象存储(OOS/S3)的比较
虽然Apache Hadoop以前都是使用HDFS的,但是当Hadoop的文件系统的需求产生时候也能使用S3。Netflix的 Hadoop data warehouse 利用…
-
Hive的几种排序方式、区别,使用场景
一、几种排序和区别 Hive 支持两种主要的排序方式:ORDER BY 和 SORT BY。除此之外,还有 DISTRIBUTE BY 和 CLUSTER BY 语句,它们也在排…
-
【大数据实训】基于Hadoop的2019年11月至2020年2月宁波天气数据分析(五)
博主介绍:✌全网粉丝6W+,csdn特邀作者、博客专家、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于大数据技术领域和毕业项目实战✌ &#…
-
【数据仓库与联机分析处理】数据仓库工具Hive
目录 一、Hive简介 (一)什么是Hive (二)优缺点 (三)Hive架构原理 (四)Hive 和数据库比较 二、MySQL的安装配置 三、Hive的安装配置 1、下载安装包 …
-
超详细版Hadoop的安装与使用(单机/伪分布式)
一、首先安装VMware虚拟机虚拟机安装包以及Ubuntu ISO映像下载:https://pan.baidu.com/s/19Ai5K-AA4NZHpfMcCs3D8w?pwd=…
-
基于hadoop的邮政数据分析系统毕业设计-附源码46670
Hadoop 基于hadoop的邮政数据分析系统 摘要 为促进邮政业务的发展,充分、合理、高效的使用邮政的各类资源,有效的开展邮政数据分析系统,指导本省业务、管理及营销工…
-
Zookeeper与Hadoop的集成
1.背景介绍 1. 背景介绍 Apache Zookeeper 和 Hadoop 是分布式系统中两个非常重要的组件。Zookeeper 是一个开源的分布式应用程序,它提供了一种可靠…
-
Hive初始化遇到的问题:org.apache.hadoop.hive.metastore.HiveMetaException: 失败加载驱动程序
Hive初始化遇到的问题:org.apache.hadoop.hive.metastore.HiveMetaException: 失败加载驱动程序 在大数据领域,Hive是一个常用…
-
Hadoop学习笔记(HDP)-Part.13 安装Ranger
目录 Part.01 关于HDP Part.02 核心组件原理 Part.03 资源规划 Part.04 基础环境配置 Part.05 Yum源配置 Part.06 安装Oracl…
-
基于Hadoop的云计算与大数据处理技术
一、实验目的 1.了解Scala语言的基本语法 2.了解Spark Scala开发的原理 3.了解Spark Java API的使用 4.了解Spark的Scala API及Jav…
-
熟悉 Hive 的基本操作
4、实验步骤 (一)创建一个内部表 stocks,字段分隔符为英文逗号,表结构下所示。 col_name data_type exchange string symbol stri…
-
Hadoop框架——详解
分布式和集群介绍 * 分布式: 多台机器做不同的事情, 然后组成1个整体. * 集群: 多台机器做相同的事情. > 多台机器既可以组成 中心化模式**(主从模式)**, …
-
大数据处理技术Spark
发一下我三天肝完的菜菜项目过程,林子雨老师的课大作业。介绍配环境,以及遇到的各种问题,方便自己以后万一转码回来重头学。 内容有虚拟机配置,ubuntu安装,创建项目,hadoop部…
-
Hadoop 3.1.1 HDFS 集群部署
Hadoop 3.1.1 HDFS 集群部署 依赖服务 系统优化 查看 ZooKeeper 集群状态 创建路径 配置 /etc/profile 配置 $HADOOP_HOME/et…
-
Hadoop入门详解以及Hadoop集群搭建
一、Hadoop概念 hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。hadoop充分利用了集群的威力进行…
