hadoop
-
虚拟机集群部署hadoop
搭建hadoop虚拟机集群 一,虚拟机环境准备 以三台虚拟机为例,配置如下: 1.台虚拟机:内存2G,处理2 硬盘50G ,如图 (电脑配置参考:8核16线程+32运行内存) 2….
-
hadoop报错ERROR: Cannot set priority of namenode process
现象: 解决: 1.看Hadoop的日志: 查看namenode日志:tail -n 200 hadoop-xinjie-namenode-VM-0-9-centos.log (文…
-
Hive-SQL语法大全
Hive SQL 语法大全 基于语法描述说明 CREATE DATABASE [IF NOT EXISTS] db_name [LOCATION] ‘path’; SELECT e…
-
1.2 Hadoop概述
小肥柴的Hadoop之旅 1.2 Hadoop概述 目录 1.2 Hadoop概述 1.2.1 回归问题 1.2.2 Google的三篇论文 1.2.3 Hadoop的诞生过程 1…
-
数据架构的大数据处理:Hadoop 与 Spark 的结合
1.背景介绍 大数据处理是现代数据科学和工程的核心技术,它涉及到处理海量、高速、多源、不确定性和不可靠性的数据。随着互联网、人工智能、物联网等领域的快速发展,大数据处理的重要性日益…
-
mac上搭建 hadoop 伪集群
1. hadoop介绍 Hadoop是Apache基金会开发的一个开源的分布式计算平台,主要用于处理和分析大数据。Hadoop的核心设计理念是将计算任务分布到多个节点上,以实现高度…
-
服务攻防-数据库安全-服务应用的安全问题以及测试流程-Mysql&Hadoop&未授权访问&RCE-漏洞复现
目录 一、服务应用的安全问题 1、配置不当——未授权访问 2、安全机制——特定安全漏洞 3、安全机制——弱口令爆破攻击 二、服务应用的安全测试思路 1、判断服务是否开放 2、判断服…
-
Hadoop(02) Hadoop-3.3.6 集群的配置教程
当使用Hadoop的分布式模式进行部署和运行时,通常使用分布式文件系统HDFS进行存储。在这种情况下,HDFS的名称节点(NameNode)和数据节点(DataNode)位于不同的…
-
大数据开发之Spark(完整版)
第 1 章:Spark概述 1.1 什么是spark 回顾:hadoop主要解决,海量数据的存储和海量数据的分析计算。 spark是一种基于内存的快速、通用、可扩展的大数据分析计算…
-
VMware执行命令hadoop-daemon.sh start journalnode报错hadoop-daemon.sh: 未找到命令…
首先启动hadoop1节点的Zookeeper服务 然后启动hadoop1节点的Journalnode执行命令hadoop-daemon.sh start journalnode报…
-
【2023】通过docker安装hadoop以及常见报错
💻目录 1、准备 2、安装镜像 2.1、创建centos-ssh的镜像 2.2、创建hadoop的镜像 3、配置ssh网络 3.1、搭建同一网段的网络 3.2、配置…
-
在虚拟机上从0开始安装 hadoop 3.1.3 集群记录
hadoop 3.1.3 安装记录 linux 安装 VMware 新建虚拟机向导 VMware的网络配置 centos 7.5 安装 设置服务器 使用windTerm 连接服务器…
-
服务攻防-数据库安全-服务应用的安全问题以及测试流程-Mysql&Hadoop&未授权访问&RCE-漏洞复现
目录 一、服务应用的安全问题 1、配置不当——未授权访问 2、安全机制——特定安全漏洞 3、安全机制——弱口令爆破攻击 二、服务应用的安全测试思路 1、判断服务是否开放 2、判断服…
-
Hadoop原理介绍
目录 HDFS 分布式存储介绍 组成 架构图 分块存储 NameNode管理元数据 SecondaryNameNode辅助管理元数据 三大机制 读写数据流程 读数据流程 写数据流程…
-
大数据处理技术考试题库(自主整理)
解释大数据?((4V特性))大量、多样、高速、价值密度低(展开论述) (1)数据量大(Volume):大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个…
