站起来活动活动吧~
订阅RSS:

标签:开发

Hadoop入门教程(六):Hadoop API 使用编程的方式操作 HDFS

上一篇讲了使用 Shell 命令操作 HDFS,但实际中我们肯定不可能一直手动操作,还是需要通过编程实现自动化的,所以本文将带你熟悉一下使用 Java 编程控制 HDFS 中的文件。

进入阅读
Spring Boot 在 Jar 包中使用 getInputStream 获取文件流的验证

我之前写了一篇《SpringBoot项目打包成jar后读取文件的大坑,使用ClassPathResource获取classpath下文件失败》,发表在了我的博客和 CSDN 上。很久没登陆 CSDN 了,今天登陆进来发现两个网友的留言,都说是用我的方式 亲测,获取不到。

进入阅读
Hadoop入门教程(五):HDFS 分布式文件系统

HDFS是指 Hadoop Distributed File System,Hadoop分布式文件系统。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。

进入阅读
Hadoop入门教程(四):Hadoop 完全分布式集群环境

上一篇我们尝试了伪分布式的安装搭建,但真正使用的是分布式集群,所以这才是重点,本文章将使用三个节点来安装最小的Hadoop集群,体验完全分布式的环境。

进入阅读
Hadoop入门教程(三):Hadoop 单节点本地运行与伪分布式

因为是入门学习,很多同学的电脑性能不具备集群环境的要求,我们先了解一下 Hadoop 单节点运行模式,以便您可以使用 Hadoop MapReduce和 Hadoop 分布式文件系统(HDFS)快速执行简单的操作。本节内容主要是带新手体验一下 Hadoop 的案例,相当于 Hello World 案例,揭开 Hadoop 神秘的面纱。

进入阅读
Hadoop入门教程(二):Hadoop 的安装教程

在开始我们的 Hadoop 之旅前,我们需要先学会安装 Hadoop ,在后面我们将使用多个 Hadoop 节点进行试验和学习,本文将带你安装 Hadoop,这是非常简单的。

进入阅读
HTTPS(SSL) 网站 使用 discuz-ucenter-api-for-java 的更新

随着互联网的发展越来越多的网站使用 https 加密连接来访问,其中 Discuz 的 UCenter 与 Java 交互的 discuz-ucenter-api-for-java 在使用 https 时却会出现问题,因为这个项目是十分古老的项目很久没有更新了,并不支持 https 的接口,所以我进行了更新。

进入阅读
使用 DBeaver 连接 达梦(DaMeng) 数据库 的教程

在新版的 DBeaver 中似乎不再支持 ODBC 连接,可能是因为 JDBC-ODBC 网桥已经从 Java 8 中移除。所以网络上的旧教程让使用 ODBC 连接就找不到了,现在给大家一个正确使用 DBeaver 连接 达梦(DaMeng) 数据库 的教程。

进入阅读
关于更正《大数据ETL技术中的数据抽取方法》

原文中第一次对比求出了 CuB 和 CuA 两个补集,第二次拉取真实数据进行二次比对,根据在实际生产环境汇总应用时发现,在第二次比对中拉取原文数据是可以省略的,所以更正了上一篇文章的ETL操作步奏。

进入阅读
数据库 MariaDB/MySQL 忽略大小写敏感设置(Linux下的Ubuntu环境)

数据库 MariaDB/MySQL 在 Linux 环境下会大小写敏感,这个时候表名字段名和写的SQL中大小写对不上就会报错,所以我们会先关闭大小写敏感。

进入阅读
Hadoop入门教程(一):Hadoop 是什么 Hadoop 由什么组成

在上一大章节我们讲了大数据仓库的概念,我们了解了数仓的建设思想,接下来我们就开始让我们的思想慢慢变为现实,承载这一切的基础就是 Hadoop 生态圈中的各种大数据组件,慢慢形成我们的大数据仓库和平台。

进入阅读
微信搜一搜:任霏博客