大数据
-
实现高效的机器学习:Apache Mahout与Flink集成
1.背景介绍 机器学习(Machine Learning)是一种通过计算机程序自动学习和改进其自身表现的方法。它是人工智能(Artificial Intelligence)的一个分…
-
59、Flink CEP – Flink的复杂事件处理介绍及示例(1)-入门
Flink 系列文章 一、Flink 专栏 Flink 专栏系统介绍某一知识点,并辅以具体的示例进行说明。 1、Flink 部署系列 本部分介绍Flink的部署、配置相关基础内容。…
-
【大数据面试题】HBase面试题附答案
目录 1.介绍下HBase 2.HBase优缺点 3.介绍下的HBase的架构 4.HBase的读写缓存 5.在删除HBase中的一个数据的时候,它是立马就把数据删除掉了吗? …
-
湖仓一体电商项目(十九):业务实现之编写写入DWS层业务代码
文章目录 业务实现之编写写入DWS层业务代码 一、代码编写 二、创建Iceberg-DWS层表
-
一站式元数据治理平台——Datahub入门宝典
随着数字化转型的工作推进,数据治理的工作已经被越来越多的公司提上了日程。作为新一代的元数据管理平台,Datahub在近一年的时间里发展迅猛,大有取代老牌元数据管理工具Atlas之势…
-
Elasticsearch:什么是检索增强生成 – RAG?
在人工智能的动态格局中,检索增强生成(Retrieval Augmented Generation – RAG)已经成为游戏规则的改变者,彻底改变了我们生成文本和与文本…
-
2023最新ELK日志平台(elasticsearch+logstash+kibana)搭建
前言 去年公司由于不断发展,内部自研系统越来越多,所以后来搭建了一个日志收集平台,并将日志收集功能以二方包形式引入自研系统,避免每个自研系统都要建立一套自己的日志模块,节约了开发时…
-
postgresql 使用之 存储架构 触摸真实数据的存储结构以及组织形式,存入数据库的数据原来在这里
存储架构 专栏内容: postgresql内核源码分析 手写数据库toadb 并发编程 个人主页:我的主页 座右铭:天行健,君子以自强不息;地势坤,君子以厚德载物. 概述 pos…
-
(十七)大数据实战——Hive的hiveserver2服务安装部署
前言 HiveServer2 是 Apache Hive 的一个服务器端组件,用于支持客户端与 Hive 进行交互和执行查询。HiveServer2服务的作用是提供jdbc/odb…
-
基于spark的电影推荐系统,包括基于ALS、LFM的离线推荐、实时推荐
完整项目地址:https://download.csdn.net/download/lijunhcn/88463162 基于spark的电影推荐系统,包括基于ALS、LFM的离线推…
-
基于Python-sqlparse的SQL表血缘追踪解析实现
目录 前言 一、主线任务 1.数据治理 2.血缘追踪 3.SQL表血缘 二、实现过程 1.目标效果 2.代码实现 1.功能函数识别 2.SQL标准格式 3.解析AST树 4.最终…
-
python商品房数据爬虫分析预测系统+可视化 +商品房数据+Flask框架 大数据 毕业设计(源码+讲解视频)✅
🍅大家好,今天给大家分享一个Python项目,感兴趣的可以先收藏起来,点赞、关注不迷路!🍅 大家在毕设选题,项目以及论文编写等相关问题都可以给我留言…
-
HBase的数据清洗与数据质量检查
1.背景介绍 1. 背景介绍 HBase是一个分布式、可扩展、高性能的列式存储系统,基于Google的Bigtable设计。它是Hadoop生态系统的一部分,可以与HDFS、Map…
-
一文带你读懂:数据集市、数据仓库、数据湖
hello宝子们…我们是艾斯视觉擅长ui设计和前端开发10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩! 一文带你读懂:数据集市…
-
链路聚合介绍及其配置命令
链路聚合 手动配置模式 一般是在不支持LACP协议的情况下使用,只要有一段不支持就得使用手动模式 还有一个缺点,如果一端出现故障会无法正常通信且不会有明显的故障显示,端口依…
