站起来活动活动吧~
订阅RSS:

任霏博客

数据库 MariaDB/MySQL 忽略大小写敏感设置(Linux下的Ubuntu环境)

数据库 MariaDB/MySQL 在 Linux 环境下会大小写敏感,这个时候表名字段名和写的SQL中大小写对不上就会报错,所以我们会先关闭大小写敏感。

进入阅读
Hadoop入门教程(一):Hadoop 是什么 Hadoop 由什么组成

在上一大章节我们讲了大数据仓库的概念,我们了解了数仓的建设思想,接下来我们就开始让我们的思想慢慢变为现实,承载这一切的基础就是 Hadoop 生态圈中的各种大数据组件,慢慢形成我们的大数据仓库和平台。

进入阅读
SQL 语句中 Like 模糊查询基本语法介绍

在 SQL 语句中,LIKE 操作符用于在 WHERE 子句中搜索列中的指定模式。在实际使用中也是非常常见的查询方式,很多同学经常使用 % 百分号来进行模糊搜索,但其实还支持很多种查询模式。

进入阅读
大数据ETL技术中对数据进行局部哈希对比优化对比速度

在上一篇文章中我们通过对每条数据的所有字段进行了哈希摘要,将几十个字段摘要成了一串哈希值,加快的我们的对比速度,但这只是将字段进行了压缩,数据的数量还是没有被压缩,如果有几十亿条数据,我们还是不能快速的找到变化的数据。

进入阅读
数据仓库的概念(四):全量表、增量表、拉链表、流水表、快照表

上一篇文章我们了解了事实表、维度表和星型模型、雪花模型,除了这些在行业中还有一些专业名词需要了解,本篇文章将带你了解大数据行业“黑话”全量表、增量表、拉链表、流水表、快照表都是什么。可能下面的一些内容理解不了,等到搞 hive 的时候就知道了,先了解一下基本的知识。

进入阅读
Linux、Unix、MacOS 存在 sudo 漏洞(CVE-2021-3156) 利用复现

这是 Sudo 工具中存在十年之久的漏洞,可能会授予任意本地用户对基于 Unix 的系统(包括 macOS Big Sur 和早期版本)进行根访问。可通过非法操作为任意本地用户授予 root 权限。用户要触发它,只需要重写 argv[0]或者创建一个符号链接。

进入阅读
数据仓库的概念(三):数据模型设计事实表、维度表、星型模型、雪花模型

在上一篇数据仓库分层设计中,我们还提到了各个层除了原始表还进行了一些加工,在加工的时候还提到了事实表、维度表,本文带你粗略的理解一下事实表、维度表,数据模型中的星型模型、雪花模型。

进入阅读
数据仓库的概念(二):数据仓库的分层设计

随着数据随时间流入我们的数据仓库以后,数据的种类和数量将越来越庞大,如果不加以治理和设计,我们查询取用数据时将遇到很大的问题,所以就需要对数据仓库进行设计,让数据分门别类的放到自己应该去的地方,方便我们日后随时调用查取。

进入阅读
数据仓库的概念(一):什么是数据仓库与数据库有什么不同

本文作为开启大数据技术入门级系列教程首篇文章,我们使用的任何大数据组件和工具其实都是在解决数据的问题,而数据就需要通过数据仓库存取,无论你使用什么样的技术架构都离不开数据仓库,所以第一篇文章先了解一下什么是数据仓库,以及数据仓库和数据库有什么区别。

进入阅读
大数据技术入门级系列教程

包括大数据数据仓库的概念、Hadoop入门教程、Zookeeper入门教程、Hive入门教程、Flume入门教程、Kafka入门教程、Hbase入门教程、Sqoop入门教程、Oozie入门教程、azkaban入门教程、Kylin入门教程、CDH入门教程、Impala入门教程、Hue入门教程、ClickHouse入门教程、Kettle入门教程、Ambari入门教程、ELK入门教程、Scala入门教程、Flink入门教程

进入阅读
百度上线”百度诊站“网站工具可检测网站健康度运行情况

百度又悄悄上线了一款工具:百度诊站,提供了网站检测的能力,其中包括”百度上搜热力值“、浏览器表现、网站证书信息、网站安全检测和站点企业信息的查询。

进入阅读
微信搜一搜:任霏博客