大数据
-
SPSS软件实操——ARIMA时间序列预测模型
相关文章链接 时间序列预测——ARIMA模型https://blog.csdn.net/beiye_/article/details/123317316?spm=1001.201…
-
使用QueryBuilders、NativeSearchQuery实现复杂查询
使用QueryBuilders、NativeSearchQuery实现复杂查询 本文继续前面文章《ElasticSearch系列(二)springboot中集成使用ElasticS…
-
大数据趣味学习探讨(三):怎么确定学习目标
CSDN话题挑战赛第2期 参赛话题:大数据趣味学习探讨 文章目录 自己定制很多学习目标,但是都没用,要这样定目标才行 一、什么是战点 二、选对趋势有多重要 三、什么是机会和时机 1…
-
大数据——Superset安装篇(二)Python3.8环境+MySQL元数据库
1. 实际安装时间 2023-06-20 安装最新版本 $ superset –version Python 3.8.13 Flask 2.0.3 Werkzeug 2.0.3 …
-
《Java SE》网络编程基础知识归纳。
目录 一、网络基本介绍 1、什么是网络通信? 2、网络 3、IP地址 4、域名 5、网络通信协议 6、Socket 二、TCP网络通信编程 1、应用实例1(字节流) 2、应用实例…
-
Hadoop精选18道面试题(附回答思路)
1.简述Hadoop1和Hadoop2的架构异同 HDFS HA(High Availablity) 一旦Active节点出现故障,就可以立即切换到Standby节点,避免了单点故…
-
Spark中的Driver、Executor、Stage、TaskSet、DAGScheduler等介绍
工作流程: Driver 创建 SparkSession 并将应用程序转化为执行计划,将作业划分为多个 Stage,并创建相应的 TaskSet。 Driver 将 TaskSet…
-
ElasticSearch单机或集群未授权访问漏洞
漏洞处理方法: 1、可以使用系统防火墙 来做限制只允许ES集群和Server节点的IP来访问漏洞节点的9200端口,其他的全部拒绝。 2、在ES节点上设置用户密码 漏洞现象:直接访…
-
分布式计算的基础:Spark的核心组件
1.背景介绍 分布式计算的基础:Spark的核心组件 1.背景介绍 分布式计算是指在多个计算节点上并行处理数据的计算方法。随着数据规模的增加,单机计算的能力已经无法满足需求。分布式…
-
python汽车大数据分析可视化系统【计算机毕业设计】大数据 (含源码)建议收藏
[毕业设计]2023-2024年最新最全计算机专业毕设选题推荐汇总 2023年 – 2024年 最新计算机毕业设计 本科 选题大全 汇总 1、项目介绍 技术栈: Pyt…
-
Flink—11、状态管理(按键分区状态(值状态、列表状态、Map状态、归约状态、聚合状态)算子状态(列表状态、广播状态))
星光下的赶路人star的个人主页 这世上唯一扛得住岁月摧残的就是才华 文章目录 1、状态管…
-
Flink + Paimon数据 CDC 入湖最佳实践
一.前言 Apache Paimon 最典型的场景是解决了 CDC (Change Data Capture)数据的入湖,看完这篇文章可以了解到: 1、为什么 CDC 入Hive迁…
-
解决问题: java.net.ConnectException: Connection refused: connect
问题描述: 使用hive连接三方工具datagrip的时候出现错误: Could not open client transport with JDBC Uri: jdbc:hiv…
-
HBase的数据备份与恢复策略
1.背景介绍 HBase是一个分布式、可扩展、高性能的列式存储系统,基于Google的Bigtable设计。它是Hadoop生态系统的一部分,可以与HDFS、MapReduce、Z…
-
大数据篇|Hadoop发展史及介绍
文章目录 一、Hadoop介绍 1.1、Hadoop是什么 二、Hadoop发展史 2.1、创始人 2.2、Hadoop发展历史/起源 2.3、Hadoop三大发行版本 2.3.1…
