五分钟轻松了解Hbase面向列的存储

[置顶] 五分钟轻松了解Hbase面向列的存储

说明:从严格的列式存储的定义来看,Hbase并不属于列式存储,有人称它为面向列的存储,请各位看官注意这一点。 行式存储 传统的数据库是关...

OpenTSDB/HBase的调优过程整理

[置顶] OpenTSDB/HBase的调优过程整理

背景 过年前,寂寞哥给我三台机器,说搞个新的openTSDB集群。机器硬件是8核16G内存、3个146G磁盘做数据盘。 我说这太抠了,寂寞哥说之前的TS...

亿级 ELK 日志平台构建部署实践

[置顶] 亿级 ELK 日志平台构建部署实践

本篇主要讲工作中的真实经历,我们怎么打造亿级日志平台,同时手把手教大家建立起这样一套亿级 ELK 系统。日志平台具体发展历程...

HBase数据压缩编码探索

[置顶] HBase数据压缩编码探索

摘要: 本文主要介绍了hbase对数据压缩,编码的支持,以及云hbase在社区基础上对数据压缩率和访问速度上了进行的改进。前言你可曾遇到这种需求,...

Ambari2.7.3 和HDP3.1.0搭建Hadoop集群

[置顶] Ambari2.7.3 和HDP3.1.0搭建Hadoop集群

一、环境及软件准备 1、集群规划...

Ambari2.6.2 HDP2.6.5 大数据集群搭建

[置顶] Ambari2.6.2 HDP2.6.5 大数据集群搭建

Ambari 2.6.2 中 HDFS-2.7.3 YARN-2.7.3 HIVE-1.2.1 HBASE-1.1.2 ZOOKEEPER-3.4.6 SP...

hadoop-2.7.7 HA完全分布式集群部署详解

[置顶] hadoop-2.7.7 HA完全分布式集群部署详解

1.Hadoop HA简介及工作原理Hadoop NameNode官方开始支持HA集群默认是从2.0开始,之前的版本均是不支持NameNode HA的高可用...

可怕的黑暗料理之暗黑谷歌搜索神器

[置顶] 可怕的黑暗料理之暗黑谷歌搜索神器

1.暗黑谷歌的由来 有这么一款搜索引擎,它一刻不停的在寻找着所有和互联网关联的PLC、摄像头、红绿灯、打印机、路由器、交换机、服务器、数据库等等各种软硬件...

Oracle12c跨平台迁移之linux至windows

[置顶] Oracle12c跨平台迁移之linux至windows

近期应朋友邀请协助处理一起oracle数据库跨平台迁移的项目,需求为迁移centos 7.2 linux的oracle12.2数据库至windo...

大规模数据传输,知易行难 — 数据传输与 ETL 平台的架构演进

大规模数据传输,知易行难 — 数据传输与 ETL 平台的架构演进

本文首发于 vivo 互联网技术微信公众号 (https://mp.weixin.qq.com/s/EBaUiMim6LjVHQy2-dCDOg)&n...

Kafka使用jmxtrans+influxdb+grafana监控JMX指标

Kafka使用jmxtrans+influxdb+grafana监控JMX指标

  最近在搞Kafka集群监控,之前也是看了网上的很多资料。之所以使用jmxtrans+influxdb+grafana是因为界面酷炫,可以定制化,缺点是不...

Hive的DDL

Hive的DDL

DDL:data definittion language  数据定义语言   主要是定义或改变表的结构、数据类型、表之间的链接和约束等初始化操作 DM...

Hive基础测试操作

Hive基础测试操作

一、Hive测试   1.查看数据库   show databases;   2.使用某个数据库,如默认数据库   user default;  ...

ES 13 - Elasticsearch的元字段(_index、_type、_source、_routing等)

ES 13 - Elasticsearch的元字段(_index、_type、_source、_routing等)

目录 1 标识元字段 1.1 _index - 文档所属的索引 1.2 _uid - 包含_type和_id的复合字段...

远程服务器数据交互技术:rsync,scp,mysqldump

远程服务器数据交互技术:rsync,scp,mysqldump

远程服务器间数据文件交互,可用技术:rsync,scp 速度:rsync是非加密传输,比scp快 安全:scp为加密传输 备份体量:rsync只更新差异部...

Hive的安装配置

Hive的安装配置

一、Hive安装配置   1.登陆hive官网下载安装包,本人使用的是1.2.2版本   官网:http://hive.apache.org/   2...

hive的概述和数据类型

hive的概述和数据类型

一、Hive概述   1.Hive简介   Hive数据仓库软件有助于使用SQL读取、编写和管理驻留在分布式存储中的大型数据集。提供了命令行工具和JDB...

基于hadoop集群中的linux内核优化

基于hadoop集群中的linux内核优化

1、禁用swapcat /etc/sysctl.confvm.swappiness = 0sysctl -p 生效swapoff -a 永久关闭swapsw...

从0到1搭建AI中台

从0到1搭建AI中台

  文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。    ...

Mapjoin和Reducejoin案例

Mapjoin和Reducejoin案例

一、Mapjoin案例   1.需求:有两个文件,分别是订单表、商品表,   订单表有三个属性分别为订单时间、商品id、订单id(表示内容量大的表),...

Hbase学习之概念与原理

Hbase学习之概念与原理

一、hbase与列式存储   hbase最早起源于谷歌的一篇BigTable的论文,它是由java编写的、开源的一个nosql数据库,同时它也是一个列式存...

User Login