大数据
-
【用户画像】用户画像简介、用户画像的架构、搭建用户画像管理平台
文章目录 一 用户画像简介 1 用户画像 2 定位 2 应用 3 用户标签 (1)标签分级 (2)标签分类 二 用户画像的架构 1 画像处理流程 2 画像标签数据应用 3 用户画像…
-
头歌大数据——HBase 伪分布式环境搭建
第1关:HBASE伪分布式环境搭建 编程要求 好了,到你啦,你需要先按照上次实训——HBase单节点安装的方式将HBase安装在/app目录下,然后根据本关知识配置好伪分布式的HB…
-
元数据管理、治理、系统、建设方案、范例等
【数据治理工具】–元数据系统 1.元数据系统 1.1 概述 如果想建设好元数据系统,需要理解元数据系统的相关概念,如数据、数据模型、元数据、元模型、ETL、数据血缘等等。 首先,要…
-
【SQL应知应会】索引(二)• MySQL版
欢迎来到爱书不爱输的程序猿的博客, 本博客致力于知识分享,与更多的人进行学习交流 本文收录于SQL应知应会专栏,本专栏主要用于记录对于数据库的一些学习,有基础也有进阶,有MySQL…
-
【大数据】深入浅出 Apache Flink:架构、案例和优势
深入浅出 Apache Flink:架构、案例和优势 1.现代大数据架构1.1 什么是批处理?1.2 什么是流处理?2.Apache Flink 项目2.1 处理无界和有界数据流2…
-
Hadoop原理之HDFS
小伙伴们大家好,今天给大家介绍一下HDFS部分的相关知识: 1.HDFS原理–架构 hdfs由三部分组成:分别是 namenode,SecondaryNameNode,…
-
一文让你学明白Hadoop《大数据技术之Hadoop》详细知识总结
思维导图: 一:Hadoop的简介 简介: Hadoop是由Apache基金会所开发的一个开源的分布式存储和处理大数据的框架,可以在计算机集群中进行大规模数据集的的存储和处理,并提…
-
kettle的下载安装以及问题点
1、kettle下载以安装 1)kettle的官网下载地址:Pentaho from Hitachi Vantara – Browse Files at SourceF…
-
HBase的数据压缩与存储效率实践
1.背景介绍 1. 背景介绍 HBase是一个分布式、可扩展、高性能的列式存储系统,基于Google的Bigtable设计。它是Hadoop生态系统的一部分,可以与HDFS、Map…
-
【有ISSN、ISBN号!往届均已完成EI检索】第三届电子信息工程、大数据与计算机技术国际学术会议(EIBDCT 2024)
第三届电子信息工程、大数据与计算机技术国际学术会议(EIBDCT 2024) 2024 3rd International Conference on Electronic Inf…
-
Hadoop 实战 | 词频统计WordCount
词频统计 通过分析大量文本数据中的词频,可以识别常见词汇和短语,从而抽取文本的关键信息和概要,有助于识别文本中频繁出现的关键词,这对于理解文本内容和主题非常关键。同时,通过分析词在…
-
Spark 运行架构
Spark 框架的核心是一个计算引擎,整体来说,它采用了标准 master-slave 的结构。 如下图所示,它展示了一个 Spark 执行时的基本结构。图形中的 …
-
毕设分享 基于Python大数据的电影可视化分析系统(源码+论文)
0 简介 今天学长向大家介绍一个机器视觉的毕设项目 毕设分享 基于Python大数据的电影可视化分析系统(源码+论文) 项目获取: https://gitee.com/sinonf…
-
K8S集群搭建(多master多node节点)
目录 一 部署环境 关闭防火墙 设置主机名hostname,管理节点设置主机名为 master 配置hosts主机名解析 配置免密登陆 关闭交换分区 配置内核…
-
AI 时代的软件工程
摘要 随着人工智能(AI)技术的飞速发展,软件工程正经历着前所未有的变革。本论文深入探讨了AI时代对软件工程的影响,分析了新兴技术在软件开发、测试和维护等方面所带来的挑战和机遇。从…
