hdfs

大数据

大数据之使用Flume监听本地文件采集数据流到HDFS

本文介绍Flume监听本地文件采集数据流到HDFS 我还写了一篇文章是Flume监听端口采集数据流到Kafka【点击即可跳转，写的也非常详细】任务一：在Master节点使用Fl…

1天前
大数据

Hadoop：学习HDFS，看完这篇就够了！

HDFS（Hadoop Distributed File System）是Apache Hadoop生态系统中的分布式文件系统，用于存储和处理大规模数据集。由于其具有高容错性、高…

1天前
大数据

2024-01-30（Hadoop

1.什么是大数据狭义（技术思维）：使用分布式技术完成海量数据的处理，得到数据背后蕴含的价值。广义：大数据是数字化时代，信息化时代的基础（技术）支撑，以数据为生活赋能。大数据的…

1天前
大数据

学会大数据基础，一篇就够了

第 2 章-大数据处理架构 Hadoop 1 hadoop 生态系统 1 Hadoop的三大组件 1) HDFS分布式文件管理系统超大数据存储流式存储 2) MapRuduce…

1天前
大数据

Hadoop集群！将HDFS副本数设置为3；可以正常提交MapReduce运行！

目录一、将HDFS副本数设置为3 1、什么是HDFS副本数？ 2.将副本数设置为3 二、基于MapReduce框架开发wordcount程序 1、什么是MapReduce框架？ …

1天前
算法结构

HDFS基本命令

目录 1.上传文件到HDFS文件系统 2.-appendToFile：追加一个文件到已经存在的文件末尾 3.查看HDFS文件系统中的文件 4.查看上传到HDFS文件系统中指定文件…

1天前
NameNode和DataNode在HDFS中的作用是什么？

作者简介：一名后端开发人员，每天分享后端开发以及人工智能相关技术，行业前沿信息，面试宝典。座右铭：未来是不可确定的，慢慢来是最快的。个人主页：极客李华-CSDN博客合作方式：…

算法结构 1天前
算法结构

HDFS HA 高可用集群搭建详细图文教程

目录一、高可用（HA）的背景知识 1.1 单点故障 1.2 如何解决单点故障 1.2.1 主备集群 1.2.2 Active、Standby 1.2.3 高可用 1.2.4…

1天前
Hadoop-5-HDFS常用命令

hdfs常用命令：第一部分：hdfs文件系统命令第一类：文件路径增删改查系列： hdfs dfs -mkdir dir 创建文件夹 hdfs dfs -rmr dir 删除文件…

大数据 1天前
HDFS 常用命令

HDFS 常用命令 HDFS (Hadoop Distributed File System) 是 Hadoop 分布式文件系统，以下是一些 HDFS 常用命令：低版本 hado…

算法结构 1天前
算法结构

HDFS系统权限详解

一，HDFS超级用户启动namenode的用户就是HDFS中的超级用户如图所示 HDFS中，也是有权限控制的，其控制逻辑和Linux文件系统的完全一致但是不同的是，两个系统的…

1天前
Pyspark读写csv,txt,json,xlsx,xml,avro等文件

1. Spark读写txt文件读： df = spark.read.text(“/home/test/testTxt.txt”).show() +————-+ |…

大数据 1天前
算法结构

HDFS读写数据流程、NameNode与DataNode工作机制

文章目录 HDFS 写数据流程 HDFS 读数据流程 HDFS 节点距离计算 HDFS 机架感知 HDFS NN和2NN工作机制 HDFS FsImage镜像文件 HDFS Edi…

1天前
移动开发

HDFS Federation前世今生

一背景熟悉大数据的人应该都知道，HDFS 是一个分布式文件系统，它是基于谷歌的GFS实现的开源系统，设计目的就是提供一个高度容错性和高吞吐量的海量数据存储解决方案。在经典的HD…

1天前
HDFS及各组件功能介绍

Hadoop分布式文件系统（Hadoop Distributed File System，HDFS）是Hadoop生态系统的核心组件之一，它是设计用于存储和处理大规模数据集的分布式…

大数据 1天前

1 / 501 2 3 4 5 6 下一页 »