`
kirayuan
  • 浏览: 38727 次
文章分类
社区版块
存档分类
最新评论

hbase与mapreduce同时运行的问题

 
阅读更多

在hbase数据写入和mapreduce同时运行时出现hbase regionserver挂掉的问题,同时hdfs上的文件块出现miss。

目前看来mapreduce和hbase同时运行时出现的一个问题就是内存竞争,hbase的regionserver在数据录入时需要的内存很大,如果同时开启了mapreduce两者会冲突。

另一个问题是对hdfs的复用,两者同时操作hdfs是否会出现硬盘的频繁读写操作。

先mark一下,查查原因再来这里继续。

后续:在之后我对hbase相关参数和环境进行了调优,避免的region的频繁分裂和合并,减少full gc的频率。通过增加内存为hbase提供更好的性能。能够达到mapreduce和hbase同时运行的情况。不过磁盘读写io问题还是存在,造成mr入库hbase效率比client方式低。

分享到:
评论

相关推荐

    Hbase与zookeeper文档

    HBase即Hadoop Database,是一个... Google运行MapReduce来处理Bigtable中的海量数据,HBase同样利用Hadoop MapReduce来处理HBase中的海量数据;Google Bigtable利用 Chubby作为协同服务,HBase利用Zookeeper作为对应。

    Hbase 表设计与操作

    HBase – Hadoop Database,是一...Google运行MapReduce来处理Bigtable中的海量数据,HBase同样利用Hadoop MapReduce来处理HBase中的海量数据;Google Bigtable利用 Chubby作为协同服务,HBase利用Zookeeper作为对应。

    大数据云计算技术系列 Hadoop之Hbase从入门到精通(共243页).pdf

    Google运行MapReduce来处理Bigtable中的海量数据,HBase同样利用Hadoop MapReduce来处理HBase中的海量数据;Google Bigtable利用 Chubby作为协同服务,HBase利用Zookeeper作为对应。 上图描述了Hadoop EcoSystem中的...

    详解Hadoop核心架构HDFS+MapReduce+Hbase+Hive

    通过这一阶段的调研总结,从内部机理的角度详细分析,HDFS、MapReduce、Hbase、Hive是如何运行,以及基于Hadoop数据仓库的构建和分布式数据库内部具体实现。如有不足,后续及时修改。整个Hadoop的体系结构主要是通过...

    Hbase中文文档

    2.4. HBase运行模式:单机和分布式 2.5. ZooKeeper 2.6. 配置文件 2.7. 配置示例 2.8. 重要配置 2.9. Bloom Filter 3. 升级 3.1. 从HBase 0.20.x or 0.89.x 升级到 HBase 0.90.x 3.2. 从 0.90.x 到 0.92.x 4. The ...

    《HBase实战》

    HBase是一种NoSQL存储系统,专门设计用来快速随机读写大规模数据。HBase运行在普通商用服务器上,可以平滑扩展,以支持从中等规模到数十亿行...阅读《HBase实战》不要求之前具备HBase、Hadoop或者MapReduce方面的知识。

    hbase安装与hbase架构说明

    HBase是Google Bigtable的开源实现...Google运行MapReduce来处理Bigtable中的海量数据,HBase同样利用HadoopMapReduce来处理HBase中的海量数据;Google Bigtable利用 Chubby作为协同服务,HBase利用Zookeeper作为对应。

    hadoop相关知识习题

    ①两者不是强关联关系,没有MapReduce,HBase可以正常运行②MapReduce可以直接访问HBase 7.下面哪些选项正确描述了HBase的特性?A 高可靠性B 高性能C 面向列D可伸缩 8.与Zookeeper类似的框架是?Chubby 9.下面与HDFS...

    Hadoop之HBase简介

    HBase – Hadoop Database,是一...Google运行MapReduce来处理Bigtable中的海量数据,HBase同样利用Hadoop MapReduce来处理HBase中的海量数据;Google Bigtable利用 Chubby作为协同服务,HBase利用Zookeeper作为对应。

    HBase实战-Nick Dimiduk和Amandeep Khurana

    《HBase实战》是一本基于经验提炼而成的指南,它教给读者如何运用HBase设计、搭建及运行大数据应用系统。全书共分为4个部分。前两个部分分别介绍了分布式系统和大规模数据处理的发展历史,讲解HBase的基本原理模式...

    Hbase 二级索引方案

    Indexer 索引和搜索不会影响 HBase 运行的稳定性和 HBase 数据写入的吞吐量,因为索引和 搜索过程是完全分开并且异步的。Lily HBase Indexer 在 CDH5 中运行必须依赖 HBase、 SolrCloud 和 Zookeeper 服务。

    HBase技术介绍简介 NOSQL数据库 入门

    HBase – Hadoop Database,是一...Google运行MapReduce来处理Bigtable中的海量数据,HBase同样利用Hadoop MapReduce来处理HBase中的海量数据;Google Bigtable利用 Chubby作为协同服务,HBase利用Zookeeper作为对应。

    hbase-0.90.5.tar.gz

    HBase – Hadoop Database,是一...Google运行MapReduce来处理Bigtable中的海量数据,HBase同样利用Hadoop MapReduce来处理HBase中的海量数据;Google Bigtable利用 Chubby作为协同服务,HBase利用Zookeeper作为对应。

    java大数据内容_3HBase

    HBASE是Google Bigtable的开源实现,但是也有很多不同之处,比如:Google Bigtable利用GFS作为其文件存储系统,HBASE利用Hadoop HDFS作为其文件存储系统,Google运行MapReduce来处理Bigtable中的海量数据,HBASE同样...

    Hbase实战 中文版

    《HBase实战》是一本基于经验提炼而成的指南,它教给读者如何运用HBase设计、搭建及运行大数据应用系统。全书共分为4个部分。前两个部分分别介绍了分布式系统和大规模数据处理的发展历史,讲解HBase的基本原理模式...

    hbase-saite.xml需要修改的详细配置

    hbase-saite.xml需要修改的...Google运行MapReduce来处理Bigtable中的海量 数据 ,HBase同样利用Hadoop MapReduce来处理HBase中的 海量数据;Google Bigtable利用 Chubby作为协同服务,HBase利用Zookeeper作为对应。

    hive 整合 hbase

    HBase是建立在HDFS上的面上列的数据库。...hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。

    HBase数据库性能调优

    HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。...Google运行MapReduce来处理Bigtable中的海量数据,HBase同样利用Hadoop

    利用hadoop的mapreduce和Hbase,基于lucene做的简单的搜索引擎.zip

    利用hadoop的mapreduce和Hbase,基于lucene做的简单的搜索引擎 ## 基本介绍 - InjectDriver 将本地的url注入到hbase数据库中等待下一步执行 - FetchDriver 负责抓取url对应的网页内容 - ParserUrlDriver 解析所抓取...

Global site tag (gtag.js) - Google Analytics