hadoop

大数据

虚拟机集群部署hadoop

搭建hadoop虚拟机集群一，虚拟机环境准备以三台虚拟机为例，配置如下： 1.台虚拟机：内存2G，处理2 硬盘50G ，如图（电脑配置参考：8核16线程+32运行内存） 2….

1天前

大数据

hadoop报错ERROR: Cannot set priority of namenode process

现象：解决： 1.看Hadoop的日志：查看namenode日志：tail -n 200 hadoop-xinjie-namenode-VM-0-9-centos.log （文…

1天前

大数据

Hive-SQL语法大全

Hive SQL 语法大全基于语法描述说明 CREATE DATABASE [IF NOT EXISTS] db_name [LOCATION] ‘path’; SELECT e…

1天前

大数据

1.2 Hadoop概述

小肥柴的Hadoop之旅 1.2 Hadoop概述目录 1.2 Hadoop概述 1.2.1 回归问题 1.2.2 Google的三篇论文 1.2.3 Hadoop的诞生过程 1…

1天前

数据架构的大数据处理：Hadoop 与 Spark 的结合

1.背景介绍大数据处理是现代数据科学和工程的核心技术，它涉及到处理海量、高速、多源、不确定性和不可靠性的数据。随着互联网、人工智能、物联网等领域的快速发展，大数据处理的重要性日益…

大数据 1天前

大数据

mac上搭建 hadoop 伪集群

1. hadoop介绍 Hadoop是Apache基金会开发的一个开源的分布式计算平台，主要用于处理和分析大数据。Hadoop的核心设计理念是将计算任务分布到多个节点上，以实现高度…

1天前

大数据

服务攻防-数据库安全-服务应用的安全问题以及测试流程-Mysql&Hadoop&未授权访问&RCE-漏洞复现

目录一、服务应用的安全问题 1、配置不当——未授权访问 2、安全机制——特定安全漏洞 3、安全机制——弱口令爆破攻击二、服务应用的安全测试思路 1、判断服务是否开放 2、判断服…

1天前

大数据

Hadoop(02) Hadoop-3.3.6 集群的配置教程

当使用Hadoop的分布式模式进行部署和运行时，通常使用分布式文件系统HDFS进行存储。在这种情况下，HDFS的名称节点（NameNode）和数据节点（DataNode）位于不同的…

1天前

大数据

大数据开发之Spark（完整版）

第 1 章：Spark概述 1.1 什么是spark 回顾：hadoop主要解决，海量数据的存储和海量数据的分析计算。 spark是一种基于内存的快速、通用、可扩展的大数据分析计算…

1天前

大数据

VMware执行命令hadoop-daemon.sh start journalnode报错hadoop-daemon.sh: 未找到命令…

首先启动hadoop1节点的Zookeeper服务然后启动hadoop1节点的Journalnode执行命令hadoop-daemon.sh start journalnode报…

1天前

大数据

【2023】通过docker安装hadoop以及常见报错

💻目录 1、准备 2、安装镜像 2.1、创建centos-ssh的镜像 2.2、创建hadoop的镜像 3、配置ssh网络 3.1、搭建同一网段的网络 3.2、配置…

1天前

大数据

在虚拟机上从0开始安装 hadoop 3.1.3 集群记录

hadoop 3.1.3 安装记录 linux 安装 VMware 新建虚拟机向导 VMware的网络配置 centos 7.5 安装设置服务器使用windTerm 连接服务器…

1天前

大数据

服务攻防-数据库安全-服务应用的安全问题以及测试流程-Mysql&Hadoop&未授权访问&RCE-漏洞复现

目录一、服务应用的安全问题 1、配置不当——未授权访问 2、安全机制——特定安全漏洞 3、安全机制——弱口令爆破攻击二、服务应用的安全测试思路 1、判断服务是否开放 2、判断服…

1天前

大数据

Hadoop原理介绍

目录 HDFS 分布式存储介绍组成架构图分块存储 NameNode管理元数据 SecondaryNameNode辅助管理元数据三大机制读写数据流程读数据流程写数据流程…

1天前

大数据处理技术考试题库（自主整理）

解释大数据？（（4V特性））大量、多样、高速、价值密度低（展开论述）（1）数据量大（Volume）：大数据的起始计量单位至少是P（1000个T）、E（100万个T）或Z（10亿个…

前端 1天前