作者:Ezekielx

Spark Chapter 1:Introduction to Spark(Spark 简介)

一、Spark Introduction(Spark 简介) 设想一个场景:每个人都用过 QQ,它会不定期地给你推荐一些你可能认识的人。那么,这些数据是从哪里来的呢?实际上,它是通过分析每个人的好友列表数据得出的。一个人的好友列表数据量非常庞大,光是存储就是一个问题,更不用说数据处理了。这时,我们就

Ezekielx 发布于 2025-09-13

Linux-CentOS Stream 安装 MySQL

一、安装 MySQL 1、从官网下载仓库配置 rpm 包 默认的 yum 仓库里是没有 MySQL 的,需要先在 MySQL 的官网下载安装他的仓库配置 rpm 包。(这个 rpm 包不包含 MySQL 本体,它的作用只是在 yum 的配置文件中添加 MySQL 本体的下载地址🙂) 打开MySQL

Ezekielx 发布于 2025-09-09

该死的三角洲,毁了我的暑假

什么都没干,玩了一个暑假😭。 琳琅天上,把我的暑假还给我😡。

Ezekielx 发布于 2025-08-20

NoSQL Chapter 4:Aggregation Framework, Transaction and Replication(聚合框架、事务和复制)

一、Understanding Aggregation, Transaction and replication(理解聚合框架、事务和复制) 理解聚合框架、事务和复制 Ezekielx 在电商公司 SwiftCart 工作,使用 MongoDB 开发了一个强大的电商平台。该平台需要处理大量交易、用户

Ezekielx 发布于 2025-06-19

NoSQL Chapter 3:Working with MongoDB index, geospatial data and time series(MongoDB 索引、地理空间与时序数据处理)

LocalBites 是一家初创公司,他的目标是提供关于附近餐厅的实时信息、优化配送路线,并生成有关用户偏好和餐厅人气的有价值分析。关键内容包括索引的实现、地理空间索引以及聚合管道的使用。 LocalBites 所处的是一个竞争激烈的市场,在这里,快速的响应时间和准确的基于位置的数据对于用户满意度至

Ezekielx 发布于 2025-06-19

NoSQL Chapter 2:Working with MongoDB(使用 MongoDB)

NoSQL Chapter 2:Working with MongoDB(使用 MongoDB) 一、Need for Schemas(模式需求) **模式(Schema)**在数据库管理系统中起着至关重要的作用,它为数据的组织和存储提供了蓝图。 虽然 MongoDB 是一个无模式(schema-l

Ezekielx 发布于 2025-06-19

NoSQL Chapter 1:Introduction to NoSQL(NoSQL 简介)

一、Introduction to NoSQL(NoSQL 简介) 数据库是一个用于存储数据的平台,其设计目标是确保数据的安全性、可靠性和易于访问性。通常,数据库分为两种类型:关系型数据库和非关系型数据库。非关系型数据库通常被称为 NoSQL 数据库。 NoSQL数据库用于存储大量复杂且多样化的数据

Ezekielx 发布于 2025-06-19

Hadoop Chapter 6:Hadoop Serialization and Compression(Hadoop 的序列化与压缩)

Hadoop Chapter 6:Hadoop Serialization and Compression(Hadoop 的序列化与压缩) 一、Serialization Overview(序列化概述) 计算机以 0 和 1 的比特形式读取、存储和处理数据。序列化是指将任何对象的状态或数据转换为一系

Ezekielx 发布于 2025-06-17

Hadoop Chapter 5:Deep Insight of MapReduce(深入解析 MapReduce)

一、Introduction of MapReduce(MapReduce 简介) MapReduce 是 Hadoop 的处理层。MapReduce 编程模型旨在通过将工作划分为一组独立的任务,来并行处理海量数据。你只需将业务逻辑融入 MapReduce 的工作方式中,其余的部分将由框架自动处理。

Ezekielx 发布于 2025-06-17

Hadoop Chapter 4:HDFS Distributed File System(HDFS 分布式文件系统)

一、Introduction of Hadoop Shell Commands(Hadoop Shell 命令简介) Hadoop 分布式文件系统(HDFS)是一种分布式文件系统,基于“一次写入,多次读取”的理念,具有高容错性和高吞吐量。DataNode 负责处理来自文件系统客户端的读写请求。 HD

Ezekielx 发布于 2025-06-17
上一页 下一页