大数据 | 第25页 | 协通编程

大数据

HADOOP的配置

一，集群和分布式的概念 hadoop+java1.8:链接：https://pan.baidu.com/s/1yTlgLGzz6Ow-YWU-CeF68w 提取码：aoag –来自…

1天前

大数据

【大数据进阶第三阶段之Hive学习笔记】Hive安装

目录 1、环境准备 2、下载安装 3、配置环境变量 4、配置文件 4.1、配置hive-env.sh 编辑4.2、配置hive-site.xml 5、上传配置jar 6、启动 1…

1天前

大数据

京东数据分析（京东大数据）：2023年10月京东手机行业品牌销售排行榜

鲸参谋监测的京东平台10月份手机市场销售数据已出炉！根据鲸参谋平台的数据显示，今年10月份，京东平台手机行业的销量约340万，环比增长约11%，同比则下滑约2%；销售额为108亿…

1天前

第六章使用 SQL Search – 词干提取和分解

文章目录第六章使用 SQL Search – 词干提取和分解词干提取和分解 `Stemming` `Decompounding` IRIS 自然语言处理器不支持的…

数据库 1天前

大数据

HBase入门：实现原理

文章目录说明 HBase的实现原理 HBase功能组件表和 Region Region 的定位说明本文参考自林子雨老师的《大数据技术原理与应用(第三版)》教材内容，仅供学习…

1天前

大数据

医疗信息管理系统(HIS)——＞业务介绍

目录一、项目背景二、业务三、门诊流程四、住院流程五、页面原型初稿（门诊）介绍六、页面原型初稿（住院）介绍七、页面原型初稿（药房药库）介绍一、项目背景 …

1天前

Flink Operator 使用指南之全局配置

背景在上一个章节中已经介绍了基本的Flink-Operator安装，但是在实际的数据中台的项目中，用户可能希望看到Flink Operator的运行日志情况，当然这可以通过修改F…

大数据 1天前

大数据在零售行业的应用与成功案例

1.背景介绍大数据是指通过各种计算机技术和软件工具来整合、存储、分析和挖掘的数据集，这些数据通常非结构化且非常庞大。随着互联网和人工智能技术的发展，大数据已经成为许多行业的重要驱…

大数据 1天前

深入理解Apache Hadoop的分布式存储

1.背景介绍分布式存储是大数据处理领域中的一个重要话题。随着数据量的增加，单机存储和计算的能力已经无法满足需求。因此，分布式存储和计算技术变得越来越重要。Apache Hadoo…

大数据 1天前

大数据

hadoop期末复习

参考：尚硅谷-B站-hadoop3.x教程尚硅谷大数据Hadoop教程，hadoop3.x搭建到集群调优，百万播放_哔哩哔哩_bilibili 1.集群部署规划主要修改那几个配置…

1天前

26、Flink 的SQL之概览与入门示例

Flink 系列文章一、Flink 专栏 Flink 专栏系统介绍某一知识点，并辅以具体的示例进行说明。 1、Flink 部署系列本部分介绍Flink的部署、配置相关基础内容。…

大数据 1天前

实现高效的大数据处理：Apache Hadoop的核心原理

1.背景介绍大数据处理是当今信息技术中最热门的话题之一。随着互联网的发展，数据的产生和增长速度已经超越了我们的预期。根据IDC的预测，全球数据量将达到44ZB(Zettabyte…

大数据 1天前

大数据

Spark—RDD介绍

文章目录 1.Spark核心编程 2.RDD介绍 2.1.RDD基本原理 2.2 RDD特点 1.弹性 2.分布式：数据存储在大数据集群的不同节点上 3.数据集：RDD封装了计…

1天前

大数据

2024.1.3 Spark架构角色和提交任务流程

目录一 . Yarn的角色回顾二、Spark提交任务流程 1、Spark On Standalone 2. Spark on Yarn 三. Spark 比MapRe…

1天前

数据库

【SQL应知应会】表分区（四）• Oracle版

欢迎来到爱书不爱输的程序猿的博客, 本博客致力于知识分享，与更多的人进行学习交流本文收录于SQL应知应会专栏,本专栏主要用于记录对于数据库的一些学习，有基础也有进阶，有MySQL…

1天前