大数据
-
HiveSql中的分区分桶详解
分区(partiton) 静态分区 动态分区 静态分区 如果有一张表,需求是要其中一类的数据例如(星座),但是需要全盘扫描,如何精…
-
网约车大数据综合项目——数据分析Hive
第1关:Hive 储存数据 开启Hadoop服务,并使得 Hive 连接 MySQL 初始化 start-all.sh schematool -dbType mysql -init…
-
Flink的实时数据流式图数据处理
1.背景介绍 1. 背景介绍 Apache Flink 是一个流处理框架,用于实时数据流处理和大数据处理。Flink 可以处理大规模数据流,并提供低延迟和高吞吐量。Flink 支持…
-
Spark与PySpark(1.概述、框架、模块)
目录 1.Spark 概念 2. Hadoop和Spark的对比 3. Spark特点 3.1 运行速度快 3.2 简单易用 3.3 通用性强 3.4 可以允许运行在很多地方 4….
-
记elasticsearch CPU负载100%问题
记elasticsearch CPU负载100%问题 环境: 问题表现: 初步排查: 日志 查询hot_thread 深入 查询当前elasticsearch正在运行的Task 查…
-
大数据环境下的隐私安全的图像特征提取及应用(毕业论文)
点我完整下载:大数据环境下的隐私安全的图像特征提取及应用.docx 大数据环境下的隐私安全的图像特征提取及应用 “Image Feature Extraction an…
-
文化+科技融合发展 第十一届中关村大数据日成功举办
12月22日,以“新出发,文化+科技铸就新商业文明”为主题的“2023年中关村大数据日暨大红门数智产业大厦启动仪式”在北京南中轴国际文化科技园成功举办。百余位政府主管部门领导、权威…
-
Hadoop YARN CGroup 实践
文章目录 Hadoop YARN Cgroups 实践 什么是 cgroups cgroups 概念 YARN 使用 cgroups 背景 cgroups 在 YARN 中的工作原…
-
Hadoop-MapReduce使用说明
一、MapReduce是什么? MapReduce是一个开源的分布式软件框架,可以让你很容易的编写程序(继承Mapper和Reducer,重写map和reduce方法)去处理大数据…
-
HADOOP的配置
一,集群和分布式的概念 hadoop+java1.8:链接:https://pan.baidu.com/s/1yTlgLGzz6Ow-YWU-CeF68w 提取码:aoag –来自…
-
【大数据进阶第三阶段之Hive学习笔记】Hive安装
目录 1、环境准备 2、下载安装 3、配置环境变量 4、配置文件 4.1、配置hive-env.sh 编辑4.2、配置hive-site.xml 5、上传配置jar 6、启动 1…
-
京东数据分析(京东大数据):2023年10月京东手机行业品牌销售排行榜
鲸参谋监测的京东平台10月份手机市场销售数据已出炉! 根据鲸参谋平台的数据显示,今年10月份,京东平台手机行业的销量约340万,环比增长约11%,同比则下滑约2%;销售额为108亿…
-
第六章 使用 SQL Search – 词干提取和分解
文章目录 第六章 使用 SQL Search – 词干提取和分解 词干提取和分解 `Stemming` `Decompounding` IRIS 自然语言处理器不支持的…
-
HBase入门:实现原理
文章目录 说明 HBase的实现原理 HBase功能组件 表和 Region Region 的定位 说明 本文参考自林子雨老师的《大数据技术原理与应用(第三版)》教材内容,仅供学习…
-
医疗信息管理系统(HIS)——>业务介绍
目录 一、项目背景 二、业务 三、门诊流程 四、住院流程 五、页面原型初稿(门诊)介绍 六、 页面原型初稿(住院)介绍 七、页面原型初稿(药房药库)介绍 一、项目背景 …
