大数据-小翔博客-第37页

Hadoop

[置顶] 五分钟轻松了解Hbase面向列的存储

5年前 (2018-12-26) 168762人围观抢沙发

说明：从严格的列式存储的定义来看，Hbase并不属于列式存储，有人称它为面向列的存储，请各位看官注意这一点。行式存储传统的数据库是关...

Hbase

[置顶] OpenTSDB/HBase的调优过程整理

5年前 (2019-03-13) 10927人围观抢沙发

背景过年前，寂寞哥给我三台机器，说搞个新的openTSDB集群。机器硬件是8核16G内存、3个146G磁盘做数据盘。我说这太抠了，寂寞哥说之前的TS...

Hadoop

[置顶] 亿级 ELK 日志平台构建部署实践

5年前 (2019-02-02) 8468人围观抢沙发

本篇主要讲工作中的真实经历，我们怎么打造亿级日志平台，同时手把手教大家建立起这样一套亿级 ELK 系统。日志平台具体发展历程...

Hbase

[置顶] HBase数据压缩编码探索

5年前 (2019-04-07) 7749人围观抢沙发

摘要：本文主要介绍了hbase对数据压缩，编码的支持，以及云hbase在社区基础上对数据压缩率和访问速度上了进行的改进。前言你可曾遇到这种需求，...

Hadoop

[置顶] Ambari2.7.3 和HDP3.1.0搭建Hadoop集群

5年前 (2019-01-31) 14457人围观抢沙发

一、环境及软件准备 1、集群规划...

Hadoop

[置顶] Ambari2.6.2 HDP2.6.5 大数据集群搭建

5年前 (2019-04-18) 11581人围观抢沙发

Ambari 2.6.2 中 HDFS-2.7.3 YARN-2.7.3 HIVE-1.2.1 HBASE-1.1.2 ZOOKEEPER-3.4.6 SP...

Hadoop

[置顶] hadoop-2.7.7 HA完全分布式集群部署详解

5年前 (2019-05-23) 10408人围观抢沙发

1.Hadoop HA简介及工作原理Hadoop NameNode官方开始支持HA集群默认是从2.0开始，之前的版本均是不支持NameNode HA的高可用...

Safe

[置顶] 可怕的黑暗料理之暗黑谷歌搜索神器

4年前 (2020-01-23) 10871人围观抢沙发

1.暗黑谷歌的由来有这么一款搜索引擎，它一刻不停的在寻找着所有和互联网关联的PLC、摄像头、红绿灯、打印机、路由器、交换机、服务器、数据库等等各种软硬件...

SRE实战

[置顶] Oracle12c跨平台迁移之linux至windows

4年前 (2020-01-26) 10090人围观抢沙发

近期应朋友邀请协助处理一起oracle数据库跨平台迁移的项目，需求为迁移centos 7.2 linux的oracle12.2数据库至windo...

Hadoop

第3章 Hadoop 2.x分布式集群搭建

6年前 (2018-07-10) 1738人围观抢沙发

目录 3.1 配置各节点SSH无密钥登录 1.将各节点的秘钥加入到同一个授权文件中 2.拷贝授权文件到各个节点 3...

Hadoop

Hive的内置函数

6年前 (2018-07-10) 661人围观抢沙发

定义： UDF(User-Defined-Function)，用户自定义函数对数据进行处理。 UDTF(User-Defined Table-G...

Hadoop

网站用户行为分析——在Ubuntu下安装MySQL及其常用操作

6年前 (2018-07-09) 866人围观抢沙发

安装MySQL 　　使用以下命令即可进行mysql安装，注意安装前先更新一下软件源以获得最新版本：　　sudo apt-get update 　　...

Hadoop

Hive命令行及参数配置

6年前 (2018-07-08) 1140人围观抢沙发

1 ． Hive 命令行　　　　输入$HIVE_HOME/bin/hive –H 或者 –help 可以显示帮助选项：　　　　说明：...

Hadoop

Hive的DML操作

6年前 (2018-07-07) 1374人围观抢沙发

1． Load 　　在将数据加载到表中时，Hive 不会进行任何转换。加载操作是将数据文件移动到与 Hive表对应的位置的纯复制/移动操作。　　语法结...

Hadoop

数据仓库和Hadoop大数据平台有什么差别？

6年前 (2018-07-07) 1212人围观抢沙发

广义上来说，Hadoop大数据平台也可以看做是新一代的数据仓库系统，它也具有很多现代数据仓库的特征，也被企业所广泛使用。因为MPP架构的...

Hadoop

Flume采集目录及文件到HDFS案例

6年前 (2018-07-07) 554人围观抢沙发

采集目录到HDFS 　　使用flume采集目录需要启动hdfs集群 vi spool-hdfs.conf # Name the componen...

Hadoop

Apache Flume简介及安装部署

6年前 (2018-07-07) 1340人围观抢沙发

概述 Flume 是 Cloudera 提供的一个高可用的，高可靠的，分布式的海量日志采集、聚合和传输的软件。 Flume 的核心是把数据从数据...

Hadoop

MapReduce序列化及分区的java代码示例

6年前 (2018-07-07) 1863人围观抢沙发

概述　　序列化（Serialization）是指把结构化对象转化为字节流。　　反序列化（Deserialization）是序列化的逆过程。把字节流转...

Hadoop

MapReduce输入输出的处理流程及combiner

6年前 (2018-07-07) 1855人围观抢沙发

MapReduce 的输入输出 MapReduce 框架运转在<key,value> 键值对上，也就是说，框架把作业的输入看成是一组&l...

Hadoop

HDFS的JavaAPI

6年前 (2018-07-07) 1208人围观抢沙发

配置windows平台的Hadoop环境　　在 windows 上做 HDFS 客户端应用开发，需要设置 Hadoop 环境,而且要求是wi...

Hadoop

HBase学习（一）：认识HBase

6年前 (2018-07-06) 1128人围观抢沙发

一.大数据发展背景现今是数据飞速膨胀的大数据时代，大数据强调3V特征，即Volume（量级）、Varity（种类）和Velocity（速度）。 &...

[置顶] 五分钟轻松了解Hbase面向列的存储

[置顶] OpenTSDB/HBase的调优过程整理

[置顶] 亿级 ELK 日志平台构建部署实践

[置顶] HBase数据压缩编码探索

[置顶] Ambari2.7.3 和HDP3.1.0搭建Hadoop集群

[置顶] Ambari2.6.2 HDP2.6.5 大数据集群搭建

[置顶] hadoop-2.7.7 HA完全分布式集群部署详解

[置顶] 可怕的黑暗料理之暗黑谷歌搜索神器

[置顶] Oracle12c跨平台迁移之linux至windows

第3章 Hadoop 2.x分布式集群搭建

Hive的内置函数

网站用户行为分析——在Ubuntu下安装MySQL及其常用操作

Hive命令行及参数配置

Hive的DML操作

数据仓库和Hadoop大数据平台有什么差别？

Flume采集目录及文件到HDFS案例

Apache Flume简介及安装部署

MapReduce序列化及分区的java代码示例

MapReduce输入输出的处理流程及combiner

HDFS的JavaAPI

HBase学习（一）：认识HBase

Petter

101481

12

121484300

« 2024年2月 »
一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29

[置顶] 五分钟轻松了解Hbase面向列的存储

[置顶] OpenTSDB/HBase的调优过程整理

[置顶] 亿级 ELK 日志平台构建部署实践

[置顶] HBase数据压缩编码探索

[置顶] Ambari2.7.3 和HDP3.1.0搭建Hadoop集群

[置顶] Ambari2.6.2 HDP2.6.5 大数据集群搭建

[置顶] hadoop-2.7.7 HA完全分布式集群部署详解

[置顶] 可怕的黑暗料理之暗黑谷歌搜索神器

[置顶] Oracle12c跨平台迁移之linux至windows

Petter

101481

12

121484300

User Login

帐号或密码错误,请重试.