大数据 | 第23页 | 协通编程

大数据

Spark—RDD(Key-Value类型转换算子)

文章目录 1.RDD Key-Value类型 1.1 partitionBy 1.2 reduceByKey 1.3 groupByKey reduceByKey和groupByK…

1天前

大数据

Aloudata 两项 Data Fabric 最佳实践获评 2023 信通院大数据“星河”案例标杆案例

12 月 20 日，由中国信息通信研究院和中国通信标准化协会大数据技术标准推进委员会（CCSA TC601）组织的第七届大数据“星河（Galaxy）”案例征集结果正式发布。Alou…

1天前

大数据

【高级应用】Flink Cep模式匹配

什么是Cep？在流式数据中（事件流），筛选出符合条件的一系列动作（事件）【复杂事件处理】什么是 Flink-Cep？ Flink Cep库Api 【实时操作】官方文档什么是…

1天前

大数据

Hadoop中HBase命令行操作

HBase提供了Shell命令行，功能类似于Oracle、MySQL等关系库的SQL Plus窗口那样，用户可以通过命令行模式进行创建表、新增和更新数据，以及删除表的操作。采用的…

1天前

大数据

Hadoop之Hbase安装和配置

文章目录 Hadoop之HBase安装和配置 1、确保Hadoop已安装/配置 1.1 启动Hadoop 1.2 查看Hadoop版本（要兼容Hbase） 2、HBase安装 2….

1天前

前端

java在线电影网站

Java在线电影网站项目简介这次分享一个电影网站，基于Jsp+Servlet+C3p0+mysql，难度适中。网站内视频均是跳转到相应的平台播放（如腾讯视频、爱奇艺、优酷等），…

1天前

数据库

群晖 NAS WebDAV服务手机ES文件浏览器远程访问【无公网IP内网穿透】

📱 iOS开发上架主页在强者的眼中，没有最好，只有更好。我们是移动开发领域的优质创作者，同时也是阿里云专家博主。 ✨ 关注我们的主页，探索iOS开发的无限可能！ …

1天前

后端

基于Python的100+高质量爬虫开源项目（持续更新中）

前言以下是项目所使用的框架，不同的项目所使用的框架或许有不同，但都万差不离： Scrapy：一个快速的高级Web爬虫框架，可用于从网站中提取结构化数据。 BeautifulSou…

1天前

大数据

大数据ClickHouse进阶（一）：ClickHouse使用场景和集群安装

文章目录 ClickHouse使用场景和集群安装一、使用场景

1天前

智能能源：如何利用大数据提高能源效率

1.背景介绍能源是现代社会的基本要素，其安全和可持续性对于经济发展和人类生存都至关重要。随着人口增长和经济发展的加速，能源需求也不断增加，导致对于能源资源的压力日益增加。因此，提…

大数据 1天前

大数据

Spark 图计算ONEID 进阶版

0、环境信息本文采用阿里云maxcompute的spark环境为基础进行的，搭建本地spark环境参考搭建Windows开发环境_云原生大数据计算服务 MaxCo…

1天前

高效掌握JDBC技术（二）| 掌握ORM思想 | 定义连接数据库的工具类

✅作者简介：C/C++领域新星创作者、CSDN内容合伙人，喜欢学习后端语言的大学生 ✨精品专栏：C++面向对象核心 🔥系列专栏：JDBC技术 📃推荐…

大数据 1天前

spark3使用hive zstd压缩格式总结

ZSTD（全称为Zstandard）是一种开源的无损数据压缩算法，其压缩性能和压缩比均优于当前Hadoop支持的其他压缩格式，本特性使得Hive支持ZSTD压缩格式的表。Hive支…

大数据 1天前

Hadoop作业篇(一）

一、选择题 1. 以下哪一项不属于Hadoop可以运行的模式__C____。 A. 单机（本地）模式 B. 伪分布式模式 C. 互联模式 D. 分布式模式 C. 互联模式不属于H…

大数据 1天前

大数据基础复习题整理

第一章以下关于云计算、大数据和物联网之间的关系，论述错误的是 A. 物联网可以借助于大数据实现海量数据的分析 B. 物联网可以借助于云计算实现海量数据的存储 C. 云计算、大数据…

大数据 1天前