大数据
-
Hadoop的基础操作
Hadoop的基础操作 HDFS是Hadoop的分布式文件框架,它的实际目标是能够在普通的硬件上运行,并且能够处理大量的数据。 HDFS采用主从架构,其中由一个NameNode和多…
-
Flink异步IO初步了解
之前使用Flink查询Redis数据的过程中,由于对数据一致性的要求并不是很高,当时是用MapFunction + State 的方案。先缓存一大堆数据到Stat…
-
Spark Core进阶知识
小知识: 大数据开发人员/数据分析人员,必须要对自己统计的指标结果负责!!! 结果数据的核对方式: 1- 在离线文件中直接ctrl+F搜索关键内容核对(不常用) 2- 一般原始数据…
-
大数据为智能家居带来的汽车变革
1.背景介绍 随着互联网的普及和人工智能技术的发展,智能家居已经成为了人们生活中不可或缺的一部分。智能家居通过将传感器、摄像头、微控制器等设备与互联网联网,实现了家居设施的智能化管…
-
Flink编程——风险欺诈检测
Flink 风险欺诈检测 文章目录 Flink 风险欺诈检测 背景 准备条件 FraudDetectionJob.java FraudDetector.java 代码分析 执行环境…
-
2023-2024年 计算机毕业设计选题合集推荐大全 人工智能 大数据 通信工程 计科 软件工程
目录 前言 毕设选题 网站和Web应用开发方向 小程序开发方向 人工智能和机器学习方向 数据科学和大数据分析方向 信息安全和网络安全方向 物联网和智能家居方向 选题迷茫 选题的重要…
-
Spark基础学习–基础介绍
1. Spark基本介绍 1.1 定义 Spark是可以处理大规模数据的统一分布式计算引擎。 1.2 Spark与MapReduce的对比 在之前我们学习过MapReduce,同样…
-
HBase 的实时数据处理与分析: 利用 HBase 实现高效的数据处理
1.背景介绍 HBase 是一个分布式、可扩展、高性能的列式存储系统,基于 Google 的 Bigtable 设计。它是 Apache Hadoop 生态系统的一部分,可以与 H…
-
大数据组件配置–Flink
系统环境为 CentOS 7.5 版本。 安装 Java 8。 安装 Hadoop 集群,Hadoop 建议选择 Hadoop 2.7.5 以上版本。 配置集群节点服务器间时间同步…
-
在Windows下用navicat,连接虚拟机的MySQL
目录 (一)防火墙 1.查看防火墙状态 2.关闭防火墙 (二)登录MySQL 1.登录 2.查看MySQL端口号 (三)连接navicat 1.点击连接 2.新建连接 3.连接成功…
-
搭建flink集群 —— 筑梦之路
Apache Flink 是一个框架和分布式处理引擎, 用于在无边界和有边界数据流上进行有状态的计算。 Flink 能在所有常见集群环境中运行,并能以内存速度和任意规模进行计算。 …
-
Hadoop YARN Cgroups 资源隔离讲解
文章目录 一、概述 二、Hadoop 环境准备 三、内存资源限制 四、CPU 资源限制 1)启用 LCE 2)启用 CGroup 3)配置 Yarn CGroup 目录 3)CPU…
-
创建表:HBase表的定义与创建
1.背景介绍 在大数据时代,HBase作为一种高性能、可扩展的列式存储系统,已经成为了许多企业和组织的首选。本文将深入探讨HBase表的定义与创建,揭示其核心概念、算法原理、最佳实…
-
玩转大数据11:数据可视化与交互式分析
1. 引言 数据可视化和交互式分析是大数据领域中的重要方面。随着大数据时代的到来,数据量越来越大,数据类型越来越复杂,传统的数据处理和分析方法已经无法满足我们的需求。数据可视化可以…
-
数据标准与数据仓库:实现企业级数据管理
1.背景介绍 数据标准和数据仓库是企业级数据管理中的两个关键概念。数据标准确定了数据的格式、结构和语义,使得不同来源的数据能够相互兼容和整合。数据仓库则是一个用于存储、管理和分析企…
