五分钟轻松了解Hbase面向列的存储

[置顶] 五分钟轻松了解Hbase面向列的存储

说明:从严格的列式存储的定义来看,Hbase并不属于列式存储,有人称它为面向列的存储,请各位看官注意这一点。 行式存储 传统的数据库是关...

OpenTSDB/HBase的调优过程整理

[置顶] OpenTSDB/HBase的调优过程整理

背景 过年前,寂寞哥给我三台机器,说搞个新的openTSDB集群。机器硬件是8核16G内存、3个146G磁盘做数据盘。 我说这太抠了,寂寞哥说之前的TS...

亿级 ELK 日志平台构建部署实践

[置顶] 亿级 ELK 日志平台构建部署实践

本篇主要讲工作中的真实经历,我们怎么打造亿级日志平台,同时手把手教大家建立起这样一套亿级 ELK 系统。日志平台具体发展历程可以参考上篇 「从 ELK 到...

HBase数据压缩编码探索

[置顶] HBase数据压缩编码探索

摘要: 本文主要介绍了hbase对数据压缩,编码的支持,以及云hbase在社区基础上对数据压缩率和访问速度上了进行的改进。前言你可曾遇到这种需求,...

Ambari2.7.3 和HDP3.1.0搭建Hadoop集群

[置顶] Ambari2.7.3 和HDP3.1.0搭建Hadoop集群

一、环境及软件准备 1、集群规划...

Ambari2.6.2 HDP2.6.5 大数据集群搭建

[置顶] Ambari2.6.2 HDP2.6.5 大数据集群搭建

Ambari 2.6.2 中 HDFS-2.7.3 YARN-2.7.3 HIVE-1.2.1 HBASE-1.1.2 ZOOKEEPER-3.4.6 SP...

hadoop-2.7.7 HA完全分布式集群部署详解

[置顶] hadoop-2.7.7 HA完全分布式集群部署详解

1.Hadoop HA简介及工作原理Hadoop NameNode官方开始支持HA集群默认是从2.0开始,之前的版本均是不支持NameNode HA的高可用...

可怕的黑暗料理之暗黑谷歌搜索神器

[置顶] 可怕的黑暗料理之暗黑谷歌搜索神器

1.暗黑谷歌的由来 有这么一款搜索引擎,它一刻不停的在寻找着所有和互联网关联的PLC、摄像头、红绿灯、打印机、路由器、交换机、服务器、数据库等等各种软硬件...

Oracle12c跨平台迁移之linux至windows

[置顶] Oracle12c跨平台迁移之linux至windows

近期应朋友邀请协助处理一起oracle数据库跨平台迁移的项目,需求为迁移centos 7.2 linux的oracle12.2数据库至windo...

2018 商汤科技深度学习方向暑期实习电话面试

2018 商汤科技深度学习方向暑期实习电话面试

1.自我介绍? 主要介绍了本科的成绩和几个比赛获奖情况、保研时转专业到计算机、现在实验室的研究方向以及实习的目的。 2.计算机基础课程学过没有...

Day2 《机器学习》第二章学习笔记

Day2 《机器学习》第二章学习笔记

  这一章应该算是比价了理论的一章,我有些概率论基础,不过起初有些地方还是没看多大懂。其中有些公式的定义和模型误差的推导应该还是很眼熟的,就是之前在概率论课...

学习笔记CB012: LSTM 简单实现、完整实现、torch、小说训练word2vec lstm机器人

学习笔记CB012: LSTM 简单实现、完整实现、torch、小说训练word2vec lstm机器人

真正掌握一种算法,最实际的方法,完全手写出来。 LSTM(Long Short Tem Memory)特殊递归神经网络,神经元保存历史记忆,解决自然语言处...

【推荐系统】评估指标总结

【推荐系统】评估指标总结

准确率指标: 该类型的指标大部分是推荐算法优化的目标,衡量着推荐算法的优劣。 准确率。推荐给用户的商品中,属于测试集的比例,数学公式$P(L_{u...

NO.3:自学tensorflow之路------MNIST识别,神经网络拓展

NO.3:自学tensorflow之路------MNIST识别,神经网络拓展

引言   最近自学GRU神经网络,感觉真的不简单。为了能够快速跑完程序,给我的渣渣笔记本(GT650M)也安装了一个GPU版的tensorflow。顺便也...

关于运行“基于极限学习机ELM的人脸识别程序”代码犯下的一些错误

关于运行“基于极限学习机ELM的人脸识别程序”代码犯下的一些错误

代码来源 基于极限学习机ELM的人脸识别程序 感谢文章主的分享 我的环境是 win10 anaconda Command line clie...

机器学习1—简介及Python机器学习环境搭建

机器学习1—简介及Python机器学习环境搭建

简介 前置声明:本专栏的所有文章皆为本人学习时所做笔记而整理成篇,转载需授权且需注明文章来源,禁止商业用途,仅供学习交流.(欢迎大家提供宝贵的意见,共同进...

python之科学函数课——Numpy

python之科学函数课——Numpy

一般来讲,数据都是由行列表示的,也就是矩阵,类似于Excel表格一样的东西。 首先我们学习一下Numpy,装好anaconda之后默认是装好的,下面是nu...

机器学习算法 --- 线性回归

机器学习算法 --- 线性回归

一、线性回归算法的简介    线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。其...

小刘的机器学习---SVM

小刘的机器学习---SVM

前言: 这是一篇记录小刘学习机器学习过程的随笔。 正文: 支持向量机(SVM)是一组用于分类, 回归和异常值检测的监督学习方法。 在分类问题中,SVM就是...

数据挖掘_并行并发介绍和同步异步介绍

数据挖掘_并行并发介绍和同步异步介绍

  前面跟大家讲的request s和spynner都是单进程(单线程)的顺序抓取,而并发和并行执行的异步抓取会极大地提高抓取效率。 &nbs...

Day1 《机器学习》第一章学习笔记

Day1 《机器学习》第一章学习笔记

  《机器学习》这本书算是很好的一本了解机器学习知识的一本入门书籍吧,是南京大学周志华老师所著的鸿篇大作,很早就听闻周老师大名了,算是国内机器学习领域少数的...

User Login