大数据 | 第24页 | 协通编程

HiveSql中的分区分桶详解

分区(partiton) 静态分区动态分区静态分区如果有一张表,需求是要其中一类的数据例如(星座),但是需要全盘扫描,如何精…

大数据 1天前

网约车大数据综合项目——数据分析Hive

第1关：Hive 储存数据开启Hadoop服务，并使得 Hive 连接 MySQL 初始化 start-all.sh schematool -dbType mysql -init…

大数据 1天前

Flink的实时数据流式图数据处理

1.背景介绍 1. 背景介绍 Apache Flink 是一个流处理框架，用于实时数据流处理和大数据处理。Flink 可以处理大规模数据流，并提供低延迟和高吞吐量。Flink 支持…

大数据 1天前

大数据

Spark与PySpark(1.概述、框架、模块)

目录 1.Spark 概念 2. Hadoop和Spark的对比 3. Spark特点 3.1 运行速度快 3.2 简单易用 3.3 通用性强 3.4 可以允许运行在很多地方 4….

1天前

Jave

记elasticsearch CPU负载100%问题

记elasticsearch CPU负载100%问题环境：问题表现：初步排查：日志查询hot_thread 深入查询当前elasticsearch正在运行的Task 查…

1天前

大数据环境下的隐私安全的图像特征提取及应用（毕业论文）

点我完整下载：大数据环境下的隐私安全的图像特征提取及应用.docx 大数据环境下的隐私安全的图像特征提取及应用 “Image Feature Extraction an…

大数据 1天前

大数据

文化+科技融合发展第十一届中关村大数据日成功举办

12月22日，以“新出发，文化+科技铸就新商业文明”为主题的“2023年中关村大数据日暨大红门数智产业大厦启动仪式”在北京南中轴国际文化科技园成功举办。百余位政府主管部门领导、权威…

1天前

大数据

Hadoop YARN CGroup 实践

文章目录 Hadoop YARN Cgroups 实践什么是 cgroups cgroups 概念 YARN 使用 cgroups 背景 cgroups 在 YARN 中的工作原…

1天前

大数据

Hadoop-MapReduce使用说明

一、MapReduce是什么？ MapReduce是一个开源的分布式软件框架，可以让你很容易的编写程序（继承Mapper和Reducer，重写map和reduce方法）去处理大数据…

1天前

大数据

HADOOP的配置

一，集群和分布式的概念 hadoop+java1.8:链接：https://pan.baidu.com/s/1yTlgLGzz6Ow-YWU-CeF68w 提取码：aoag –来自…

1天前

大数据

【大数据进阶第三阶段之Hive学习笔记】Hive安装

目录 1、环境准备 2、下载安装 3、配置环境变量 4、配置文件 4.1、配置hive-env.sh 编辑4.2、配置hive-site.xml 5、上传配置jar 6、启动 1…

1天前

大数据

京东数据分析（京东大数据）：2023年10月京东手机行业品牌销售排行榜

鲸参谋监测的京东平台10月份手机市场销售数据已出炉！根据鲸参谋平台的数据显示，今年10月份，京东平台手机行业的销量约340万，环比增长约11%，同比则下滑约2%；销售额为108亿…

1天前

第六章使用 SQL Search – 词干提取和分解

文章目录第六章使用 SQL Search – 词干提取和分解词干提取和分解 `Stemming` `Decompounding` IRIS 自然语言处理器不支持的…

数据库 1天前

大数据

HBase入门：实现原理

文章目录说明 HBase的实现原理 HBase功能组件表和 Region Region 的定位说明本文参考自林子雨老师的《大数据技术原理与应用(第三版)》教材内容，仅供学习…

1天前

大数据

医疗信息管理系统(HIS)——＞业务介绍

目录一、项目背景二、业务三、门诊流程四、住院流程五、页面原型初稿（门诊）介绍六、页面原型初稿（住院）介绍七、页面原型初稿（药房药库）介绍一、项目背景 …

1天前