大数据
-
HADOOP的配置
一,集群和分布式的概念 hadoop+java1.8:链接:https://pan.baidu.com/s/1yTlgLGzz6Ow-YWU-CeF68w 提取码:aoag –来自…
-
【大数据进阶第三阶段之Hive学习笔记】Hive安装
目录 1、环境准备 2、下载安装 3、配置环境变量 4、配置文件 4.1、配置hive-env.sh 编辑4.2、配置hive-site.xml 5、上传配置jar 6、启动 1…
-
京东数据分析(京东大数据):2023年10月京东手机行业品牌销售排行榜
鲸参谋监测的京东平台10月份手机市场销售数据已出炉! 根据鲸参谋平台的数据显示,今年10月份,京东平台手机行业的销量约340万,环比增长约11%,同比则下滑约2%;销售额为108亿…
-
第六章 使用 SQL Search – 词干提取和分解
文章目录 第六章 使用 SQL Search – 词干提取和分解 词干提取和分解 `Stemming` `Decompounding` IRIS 自然语言处理器不支持的…
-
HBase入门:实现原理
文章目录 说明 HBase的实现原理 HBase功能组件 表和 Region Region 的定位 说明 本文参考自林子雨老师的《大数据技术原理与应用(第三版)》教材内容,仅供学习…
-
医疗信息管理系统(HIS)——>业务介绍
目录 一、项目背景 二、业务 三、门诊流程 四、住院流程 五、页面原型初稿(门诊)介绍 六、 页面原型初稿(住院)介绍 七、页面原型初稿(药房药库)介绍 一、项目背景 …
-
Flink Operator 使用指南 之 全局配置
背景 在上一个章节中已经介绍了基本的Flink-Operator安装,但是在实际的数据中台的项目中,用户可能希望看到Flink Operator的运行日志情况,当然这可以通过修改F…
-
大数据在零售行业的应用与成功案例
1.背景介绍 大数据是指通过各种计算机技术和软件工具来整合、存储、分析和挖掘的数据集,这些数据通常非结构化且非常庞大。随着互联网和人工智能技术的发展,大数据已经成为许多行业的重要驱…
-
深入理解Apache Hadoop的分布式存储
1.背景介绍 分布式存储是大数据处理领域中的一个重要话题。随着数据量的增加,单机存储和计算的能力已经无法满足需求。因此,分布式存储和计算技术变得越来越重要。Apache Hadoo…
-
hadoop期末复习
参考:尚硅谷-B站-hadoop3.x教程 尚硅谷大数据Hadoop教程,hadoop3.x搭建到集群调优,百万播放_哔哩哔哩_bilibili 1.集群部署规划主要修改那几个配置…
-
26、Flink 的SQL之概览与入门示例
Flink 系列文章 一、Flink 专栏 Flink 专栏系统介绍某一知识点,并辅以具体的示例进行说明。 1、Flink 部署系列 本部分介绍Flink的部署、配置相关基础内容。…
-
实现高效的大数据处理:Apache Hadoop的核心原理
1.背景介绍 大数据处理是当今信息技术中最热门的话题之一。随着互联网的发展,数据的产生和增长速度已经超越了我们的预期。根据IDC的预测,全球数据量将达到44ZB(Zettabyte…
-
Spark—RDD介绍
文章目录 1.Spark核心编程 2.RDD介绍 2.1.RDD基本原理 2.2 RDD特点 1.弹性 2.分布式 :数据存储在大数据集群的不同节点上 3.数据集 :RDD封装了计…
-
2024.1.3 Spark架构角色和提交任务流程
目录 一 . Yarn的角色回顾 二、Spark提交任务流程 1、Spark On Standalone 2. Spark on Yarn 三. Spark 比MapRe…
-
【SQL应知应会】表分区(四)• Oracle版
欢迎来到爱书不爱输的程序猿的博客, 本博客致力于知识分享,与更多的人进行学习交流 本文收录于SQL应知应会专栏,本专栏主要用于记录对于数据库的一些学习,有基础也有进阶,有MySQL…
