大数据


关于更正《大数据ETL技术中的数据抽取方法》
2021-02-22
关于更正《大数据ETL技术中的数据抽取方法》

原文中第一次对比求出了 CuB 和 CuA 两个补集,第二次拉取真实数据进行二次比对,根据在实际生产...

Hadoop入门教程(一):Hadoop 是什么 Hadoop 由什么组成
2021-02-21
Hadoop入门教程(一):Hadoop 是什么 Hadoo...

在上一大章节我们讲了大数据仓库的概念,我们了解了数仓的建设思想,接下来我们就开始让我们的思想慢慢变为...

大数据ETL技术中对数据进行局部哈希对比优化对比速度
2021-02-06
大数据ETL技术中对数据进行局部哈希对比优化对比速度

在上一篇文章中我们通过对每条数据的所有字段进行了哈希摘要,将几十个字段摘要成了一串哈希值,加快的我们...

数据仓库的概念(四):全量表、增量表、拉链表、流水表、快照表
2021-02-05
数据仓库的概念(四):全量表、增量表、拉链表、流水表、快照表...

上一篇文章我们了解了事实表、维度表和星型模型、雪花模型,除了这些在行业中还有一些专业名词需要了解,本...

数据仓库的概念(三):数据模型设计事实表、维度表、星型模型、雪花模型
2021-02-04
数据仓库的概念(三):数据模型设计事实表、维度表、星型模型、...

在上一篇数据仓库分层设计中,我们还提到了各个层除了原始表还进行了一些加工,在加工的时候还提到了事实表...

数据仓库的概念(二):数据仓库的分层设计
2021-02-03
数据仓库的概念(二):数据仓库的分层设计

随着数据随时间流入我们的数据仓库以后,数据的种类和数量将越来越庞大,如果不加以治理和设计,我们查询取...

数据仓库的概念(一):什么是数据仓库与数据库有什么不同
2021-02-02
数据仓库的概念(一):什么是数据仓库与数据库有什么不同

本文作为开启大数据技术入门级系列教程首篇文章,我们使用的任何大数据组件和工具其实都是在解决数据的问题...

大数据技术入门级系列教程
2021-02-01
大数据技术入门级系列教程

包括大数据数据仓库的概念、Hadoop入门教程、Zookeeper入门教程、Hive入门教程、Flu...

大数据ETL技术中的数据抽取方法
2021-01-03
大数据ETL技术中的数据抽取方法

说到大数据仓库技术,不得不提ETL,ETL一词较常用在数据仓库,但其对象并不限于数据仓库。可以说是非...