hbase与mapreduce同时运行的问题 - - ITeye博客

`

kirayuan

浏览: 38727 次

最近访客更多访客>>

yr_zhang

wangkuangood3200

lzkcxn

QHT

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

全部博客 (79)

社区版块

存档分类

最新评论

hbase与mapreduce同时运行的问题

阅读更多

在hbase数据写入和mapreduce同时运行时出现hbase regionserver挂掉的问题，同时hdfs上的文件块出现miss。

目前看来mapreduce和hbase同时运行时出现的一个问题就是内存竞争，hbase的regionserver在数据录入时需要的内存很大，如果同时开启了mapreduce两者会冲突。

另一个问题是对hdfs的复用，两者同时操作hdfs是否会出现硬盘的频繁读写操作。

先mark一下，查查原因再来这里继续。

后续：在之后我对hbase相关参数和环境进行了调优，避免的region的频繁分裂和合并，减少full gc的频率。通过增加内存为hbase提供更好的性能。能够达到mapreduce和hbase同时运行的情况。不过磁盘读写io问题还是存在，造成mr入库hbase效率比client方式低。

分享到：

脚本不输密码执行scp命令（需要expect和se ... | SQL到NOSQL的思维转变

2011-04-19 13:39
浏览 459
评论(0)
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Hbase与zookeeper文档: HBase即Hadoop Database，是一个... Google运行MapReduce来处理Bigtable中的海量数据，HBase同样利用Hadoop MapReduce来处理HBase中的海量数据；Google Bigtable利用 Chubby作为协同服务，HBase利用Zookeeper作为对应。

Hbase 表设计与操作: HBase – Hadoop Database，是一...Google运行MapReduce来处理Bigtable中的海量数据，HBase同样利用Hadoop MapReduce来处理HBase中的海量数据；Google Bigtable利用 Chubby作为协同服务，HBase利用Zookeeper作为对应。

大数据云计算技术系列 Hadoop之Hbase从入门到精通（共243页）.pdf: Google运行MapReduce来处理Bigtable中的海量数据，HBase同样利用Hadoop MapReduce来处理HBase中的海量数据；Google Bigtable利用 Chubby作为协同服务，HBase利用Zookeeper作为对应。上图描述了Hadoop EcoSystem中的...

详解Hadoop核心架构HDFS+MapReduce+Hbase+Hive: 通过这一阶段的调研总结，从内部机理的角度详细分析，HDFS、MapReduce、Hbase、Hive是如何运行，以及基于Hadoop数据仓库的构建和分布式数据库内部具体实现。如有不足，后续及时修改。整个Hadoop的体系结构主要是通过...

Hbase中文文档: 2.4. HBase运行模式:单机和分布式 2.5. ZooKeeper 2.6. 配置文件 2.7. 配置示例 2.8. 重要配置 2.9. Bloom Filter 3. 升级 3.1. 从HBase 0.20.x or 0.89.x 升级到 HBase 0.90.x 3.2. 从 0.90.x 到 0.92.x 4. The ...

《HBase实战》: HBase是一种NoSQL存储系统，专门设计用来快速随机读写大规模数据。HBase运行在普通商用服务器上，可以平滑扩展，以支持从中等规模到数十亿行...阅读《HBase实战》不要求之前具备HBase、Hadoop或者MapReduce方面的知识。

hbase安装与hbase架构说明: HBase是Google Bigtable的开源实现...Google运行MapReduce来处理Bigtable中的海量数据，HBase同样利用HadoopMapReduce来处理HBase中的海量数据；Google Bigtable利用 Chubby作为协同服务，HBase利用Zookeeper作为对应。

hadoop相关知识习题: ①两者不是强关联关系，没有MapReduce，HBase可以正常运行②MapReduce可以直接访问HBase 7.下面哪些选项正确描述了HBase的特性？A 高可靠性B 高性能C 面向列D可伸缩 8.与Zookeeper类似的框架是？Chubby 9.下面与HDFS...

Hadoop之HBase简介: HBase – Hadoop Database，是一...Google运行MapReduce来处理Bigtable中的海量数据，HBase同样利用Hadoop MapReduce来处理HBase中的海量数据；Google Bigtable利用 Chubby作为协同服务，HBase利用Zookeeper作为对应。

HBase实战-Nick Dimiduk和Amandeep Khurana: 《HBase实战》是一本基于经验提炼而成的指南，它教给读者如何运用HBase设计、搭建及运行大数据应用系统。全书共分为4个部分。前两个部分分别介绍了分布式系统和大规模数据处理的发展历史，讲解HBase的基本原理模式...

Hbase 二级索引方案: Indexer 索引和搜索不会影响 HBase 运行的稳定性和 HBase 数据写入的吞吐量，因为索引和搜索过程是完全分开并且异步的。Lily HBase Indexer 在 CDH5 中运行必须依赖 HBase、 SolrCloud 和 Zookeeper 服务。

HBase技术介绍简介 NOSQL数据库入门: HBase – Hadoop Database，是一...Google运行MapReduce来处理Bigtable中的海量数据，HBase同样利用Hadoop MapReduce来处理HBase中的海量数据；Google Bigtable利用 Chubby作为协同服务，HBase利用Zookeeper作为对应。

hbase-0.90.5.tar.gz: HBase – Hadoop Database，是一...Google运行MapReduce来处理Bigtable中的海量数据，HBase同样利用Hadoop MapReduce来处理HBase中的海量数据；Google Bigtable利用 Chubby作为协同服务，HBase利用Zookeeper作为对应。

java大数据内容_3HBase: HBASE是Google Bigtable的开源实现，但是也有很多不同之处，比如：Google Bigtable利用GFS作为其文件存储系统，HBASE利用Hadoop HDFS作为其文件存储系统，Google运行MapReduce来处理Bigtable中的海量数据，HBASE同样...

Hbase实战中文版: 《HBase实战》是一本基于经验提炼而成的指南，它教给读者如何运用HBase设计、搭建及运行大数据应用系统。全书共分为4个部分。前两个部分分别介绍了分布式系统和大规模数据处理的发展历史，讲解HBase的基本原理模式...

hbase-saite.xml需要修改的详细配置: hbase-saite.xml需要修改的...Google运行MapReduce来处理Bigtable中的海量数据，HBase同样利用Hadoop MapReduce来处理HBase中的海量数据；Google Bigtable利用 Chubby作为协同服务，HBase利用Zookeeper作为对应。

hive 整合 hbase: HBase是建立在HDFS上的面上列的数据库。...hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的sql查询功能，可以将sql语句转换为MapReduce任务进行运行。

HBase数据库性能调优: HBase是一个分布式的、面向列的开源数据库，该技术来源于 Fay Chang 所撰写的Google论文“Bigtable：一个结构化数据的分布式存储系统”。...Google运行MapReduce来处理Bigtable中的海量数据，HBase同样利用Hadoop

利用hadoop的mapreduce和Hbase，基于lucene做的简单的搜索引擎.zip: 利用hadoop的mapreduce和Hbase，基于lucene做的简单的搜索引擎 ## 基本介绍 - InjectDriver 将本地的url注入到hbase数据库中等待下一步执行 - FetchDriver 负责抓取url对应的网页内容 - ParserUrlDriver 解析所抓取...

Global site tag (gtag.js) - Google Analytics