五分钟轻松了解Hbase面向列的存储

[置顶] 五分钟轻松了解Hbase面向列的存储

说明:从严格的列式存储的定义来看,Hbase并不属于列式存储,有人称它为面向列的存储,请各位看官注意这一点。 行式存储 传统的数据库是关...
OpenTSDB/HBase的调优过程整理

[置顶] OpenTSDB/HBase的调优过程整理

背景 过年前,寂寞哥给我三台机器,说搞个新的openTSDB集群。机器硬件是8核16G内存、3个146G磁盘做数据盘。 我说这太抠了,寂寞哥说之前的TS...
亿级 ELK 日志平台构建部署实践

[置顶] 亿级 ELK 日志平台构建部署实践

本篇主要讲工作中的真实经历,我们怎么打造亿级日志平台,同时手把手教大家建立起这样一套亿级 ELK 系统。日志平台具体发展历程可以参考上篇 「从 ELK 到...
HBase数据压缩编码探索

[置顶] HBase数据压缩编码探索

摘要: 本文主要介绍了hbase对数据压缩,编码的支持,以及云hbase在社区基础上对数据压缩率和访问速度上了进行的改进。前言你可曾遇到这种需求,...
Ambari2.7.3 和HDP3.1.0搭建Hadoop集群

[置顶] Ambari2.7.3 和HDP3.1.0搭建Hadoop集群

一、环境及软件准备 1、集群规划...
Ambari2.6.2 HDP2.6.5 大数据集群搭建

[置顶] Ambari2.6.2 HDP2.6.5 大数据集群搭建

Ambari 2.6.2 中 HDFS-2.7.3 YARN-2.7.3 HIVE-1.2.1 HBASE-1.1.2 ZOOKEEPER-3.4.6 SP...
hadoop-2.7.7 HA完全分布式集群部署详解

[置顶] hadoop-2.7.7 HA完全分布式集群部署详解

1.Hadoop HA简介及工作原理Hadoop NameNode官方开始支持HA集群默认是从2.0开始,之前的版本均是不支持NameNode HA的高可用...
可怕的黑暗料理之暗黑谷歌搜索神器

[置顶] 可怕的黑暗料理之暗黑谷歌搜索神器

1.暗黑谷歌的由来 有这么一款搜索引擎,它一刻不停的在寻找着所有和互联网关联的PLC、摄像头、红绿灯、打印机、路由器、交换机、服务器、数据库等等各种软硬件...
Oracle12c跨平台迁移之linux至windows

[置顶] Oracle12c跨平台迁移之linux至windows

近期应朋友邀请协助处理一起oracle数据库跨平台迁移的项目,需求为迁移centos 7.2 linux的oracle12.2数据库至windo...
Elasticsearch 删除数据

Elasticsearch 删除数据

删除数据分为两种:一种是删除索引(数据和表结构同时删除,作用同SQLSERVER 中 DROP TABLE "表格名" ),另一种是删除数据(不删...
Hadoop(18)-MapReduce框架原理-WritableComparable排序和GroupingComparator分组

Hadoop(18)-MapReduce框架原理-WritableComparable排序和GroupingComparator分组

1.排序概述 2.排序分类   3.WritableComparable案例 这个文件,是大数据-Hadoop生态(12)-H...
hadoop在CentOS下的安装配置

hadoop在CentOS下的安装配置

  版本:CentOS-6.8-x86_64-minimal,hadoop2.6.4,jdk1.7.0 首先把jdk、hadoop压缩...
分布式总结

分布式总结

一、TOKEN   Token的特点: 无状态、可扩展 支持移动设备 跨程序调用 安全  &nb...
Flume的一些报错问题解决(持续更新中)

Flume的一些报错问题解决(持续更新中)

严谨转载--否则追究法律责任 作者----王加鸿                          &...
Hadoop(16)-MapReduce框架原理-自定义FileInputFormat

Hadoop(16)-MapReduce框架原理-自定义FileInputFormat

  1. 需求 将多个小文件合并成一个SequenceFile文件(SequenceFile文件是Hadoop用来存储二进制形式的ke...
Kafka web console安装

Kafka web console安装

参考:  http://www.cnblogs.com/yxwkf/p/5092589.html 1. 安装包下载 下载地址:ht...
Hadoop系列006-HDFS概念及命令行操作

Hadoop系列006-HDFS概念及命令行操作

本人微信公众号,欢迎扫码关注! HDFS概念及命令行操作 一、HDFS概念 1.1 概念 HDFS,它是一个文件系统,用于存储文件,通...
阿里云优惠券领取

阿里云优惠券领取

阿里云限时红包领取,云产品通用红包,可叠加官网常规优惠,最高1888 内部链接 https://promotion.aliyun.com/ntm...
Mysql增量写入Hdfs(一) --将Mysql数据写入Kafka Topic

Mysql增量写入Hdfs(一) --将Mysql数据写入Kafka Topic

一. 概述 在大数据的静态数据处理中,目前普遍采用的是用Spark+Hdfs(Hive/Hbase)的技术架构来对数据进行处理。 但有时候有其他的需求,...
ZooKeeper 03 - ZooKeeper集群的脑裂问题 (Split Brain问题)

ZooKeeper 03 - ZooKeeper集群的脑裂问题 (Split Brain问题)

目录 1 ZooKeeper的主从机制 2 什么是ZooKeeper的脑裂 2.1 脑裂现象的表现 2.2 为什么会出...
学习笔记—MapReduce

学习笔记—MapReduce

MapReduce是什么 MapReduce是一种分布式计算编程框架,是Hadoop主要组成部分之一,可以让用户专注于编写核心逻辑代码,最后以高可靠、高容...

User Login