快中午啦,准备下班吗?
订阅RSS:

标签:大数据

更多博文

Hive入门教程(二):Hive 的安装部署教程

上一篇文件我们了解了什么是 Hive,本文将带你安装和部署 Hive 体验一下这个传说中的数据仓库。

进入阅读
Hive入门教程(一):初次见面 Hive 简介

在完成之前的 Hadoop 入门系列教程以后,现在才开始真正的接触数据仓库,我们先了解一下 Hadoop 生态圈中的 Hive 是什么。

进入阅读
Zookeeper入门教程(四):走进 Zookeeper 内部

在 Zookeeper 入门教程前三篇已经基本可以使用 Zookeeper 了,本文就带大家进一步走进 Zookeeper,大致了解一下 Zookeeper 是如何运行的。

进入阅读
Zookeeper入门教程(三):监听节点动态的小案例

上一篇我们已经可以通过编程的方式操作 Zookeeper 了,并且学到了 Zookeeper 注册与监听,那么就来小试牛刀体验一把,本文将带你实践体验一个简单的小案例,监听节点的变化。

进入阅读
Zookeeper入门教程(二):Zookeeper API 编程操作教程

上一篇文章我们已经成功安装了 Zookeeper,虽然可以使用命令行操作 Zookeeper,但大部分时间还是通过编程调用操作 Zookeeper 的,所以本文就简单介绍一下入门级的基础操作。

进入阅读
Zookeeper入门教程(一):Zookeeper简介与安装教程

ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。它可以接受观察者的注册订阅,当数据发生改变时就可以通知观察者,你可以理解为 ZooKeeper = 文件系统+通知机制。

进入阅读
Hadoop入门教程(十四):Hadoop MapReduce Shuffle 机制

在上一篇教程我们引入了 MapReduce 的执行机制,并粗略的讲了 InputFormat,现在该讲一下 Shuffle 了。Map方法之后,Reduce方法之前的数据处理过程称之为Shuffle。

进入阅读
Hadoop入门教程(十三):Hadoop MapReduce 的切片与并行

​在前面《Hadoop入门教程(十一):编程的方式使用 MapReduce 实现 WordCount 案例》中我们使用编程的方式体验了 MapReduce,MapReduce 的工作流程大概是下面这样的

进入阅读
Hadoop入门教程(十二):Hadoop 的 Writable 类

上一节我们讲了编程的方式使用 MapReduce,在其中我们第一次接触了到 Writable 类,本节就大概讲一下 Writable 类是干嘛的。

进入阅读
Hadoop入门教程(十一):编程的方式使用 MapReduce 实现 WordCount 案例

上一篇文章我们大致了解了什么是 MapReduce,这一节我们将使用代码编程的方式实现 WordCount 案例,体验一下 MapReduce 到底是怎么回事。

进入阅读
微信搜一搜:任霏博客