大数据 | 第32页 | 协通编程

大数据

Windows下安装HBase

Windows下安装HBase 一、HBase简介二、HBase下载安装包三、环境准备 3.1、 JDK的安装 3.2、 Hadoop的安装四、HBase安装 4.1、压缩包…

1天前

Kafka实战：消费指定时间范围内的Kafka Topic数据

Kafka实战：消费指定时间范围内的Kafka Topic数据在大数据领域，Kafka是一个广泛使用的分布式流数据平台。它提供了高吞吐量、可扩展性和容错性，使得实时数据流处理变得…

大数据 1天前

大数据

Structured

结构化编程模型输出终端/位置默认情况下，Spark的结构化流支持多种输出方案： 1- console sink: 将结果数据输出到控制台。主要是用在测试中，并且支持3种输出模式…

1天前

大数据的开源工具与技术：最佳实践

1.背景介绍大数据技术是指利用分布式计算、存储和处理大量、多样化、高速增长的数据，以实现数据的高效存储、高效处理和高效挖掘的技术。随着互联网的普及和人们对数据的需求不断增加，大数…

大数据 1天前

大数据

尚硅谷大数据Flink1.17实战教程-笔记01【Flink概述、Flink快速上手】

尚硅谷大数据技术-教程-学习路线-笔记汇总表【课程资料下载】视频地址：尚硅谷大数据Flink1.17实战教程从入门到精通_哔哩哔哩_bilibili 尚硅谷大数据Flink1.1…

1天前

人工智能与大数据：未来科技的驱动力

1.背景介绍人工智能(Artificial Intelligence, AI)和大数据(Big Data)是当今科技领域的两个热门话题。它们都是未来科技的驱动力，具有巨大的潜力和…

大数据 1天前

Spark的安全与权限管理

1.背景介绍 Spark是一个快速、易用、高吞吐量和广度的大数据处理框架。它广泛应用于数据处理、机器学习、图像处理等领域。随着Spark的广泛应用，数据安全和权限管理变得越来越重要…

大数据 1天前

大数据

大数据：分类算法深度解析

文章目录大数据分类算法深度解析 1. 背景 2. 分类算法的基本原理 2.1 特征提取数据清洗降维主成分分析（PCA） t分布邻域嵌入（t-SNE）特征选择 2.2 模型…

1天前

大数据

hadoop集群启动master节点jps后没有namenode解决方案

hadoop集群启动jps后没有namenode 启动集群jps后出现： 1.关闭集群 stop-all.sh 2.切换到hadoop的目录下将logs与tmp文件与内容删除并创建…

1天前

大数据与人工智能伦理：数据渠道与信息流行

1.背景介绍随着人工智能(AI)和大数据技术的不断发展，我们的生活、工作和社会都在不断变化。这些技术为我们提供了许多好处，但同时也带来了许多挑战和道德问题。在这篇文章中，我们将探…

大数据 1天前

大数据

Flink 实时数仓 (一) ——— 数据采集层

目录一、数仓分层介绍二、实时需求概览三、统计架构分析四、日志数据采集 1. 模拟日志生成器的使用 2. 日志采集模块-本地测试 3. 日志采集模块-打包单机部署五、业务数…

1天前

大数据

【大数据进阶第三阶段之DolphinScheduler学习笔记】DolphinScheduler(海豚调度)的部署指南

部署参考官网部署方式：https://dolphinscheduler.apache.org/zh-cn/docs/3.1.3/guide/installation/standa…

1天前

大数据

基于Python大数据的电影可视化分析系统-毕业设计

基于Python大数据的电影可视化分析系统（源码+论文） 0 简介 ✍🏻作者简介：机器学习，深度学习，卷积神经网络处理，图像处理 🚀B站项目实战：h…

1天前

大数据

Win10 环境下 spark 本地环境的搭建

一、安装配置 java 环境（已有 java 环境则跳过）所需文件下载链接：https://pan.baidu.com/s/1OYoeMVHOtcu05jR1mL7LeA …

1天前

HBase与HadoopYARN集成

1.背景介绍 1. 背景介绍 HBase是一个分布式、可扩展、高性能的列式存储系统，基于Google的Bigtable设计。HBase提供了自动分区、自动同步和故障转移等特性，使其…

大数据 1天前