登录 |  注册 |  繁體中文

文章中心
2015-12-15 13:44:07
ZooKeeper是Hadoop Ecosystem中非常重要的组件,它的主要功能是为分布式系统提供一致性协调(Coordination)服务,与之对应的Google的类似服务叫 Chubby。今天这篇文章分为三个部分来介绍ZooKeeper,第一部分介绍ZooKeeper的基本原理,第二部分介绍ZooKeeper提供的 Client API的使用,第三部分介绍一些ZooKeeper典型的应用场景。 ZooKeeper基本原理
2015-12-09 14:26:58
ZooKeeper是一个分布式开源框架,提供了协调分布式应用的基本服务,它向外部应用暴露一组通用服务——分布式同步(Distributed Synchronization)、命名服务(Naming Service)、集群维护(Group Maintenance)等,简化分布式应用协调及其管理的难度,提供高性能的分布式服务。ZooKeeper本身可以以Standalone模式安装运行,不过它的长处在于通过分布式Zo
2015-11-27 15:06:07
一、Jvm内存描述 Jvm管理的内存大致包括三种不同类型的内存区域:Permanent Generation space(永久保存区域)、Heap space(堆区域)、Java Stacks(Java栈)。 1, Permanent Generation space(永久保存区域)主要存放Class(类),Meta的信息,Class第一次被Load的时候,Class需要存储的内容主要包括方法和静态属性。 2, Heap
2015-11-26 16:44:07
YARN是开源项目Hadoop的一个资源管理系统,最初设计是为了解决Hadoop中MapReduce计算框架中的资源管理问题,但是现在它已 经是一个更加通用的资源管理系统,可以把MapReduce计算框架作为一个应用程序运行在YARN系统之上,通过YARN来管理资源。如果你的应用程序 也需要借助YARN的资源管理功能,你也可以实现YARN提供的编程API,将你的应用程序运行于YARN之上,将资源的分配与回收统一交给YARN去管 理,可以
2015-11-26 15:09:41
理解Yarn的内存管理与分配机制,对于我们搭建、部署集群,开发维护应用都是尤为重要的,对于这方面我做了一些调研供大家参考。 一、相关配置情况 1.1  RM的内存资源配置, 配置的是资源调度相关 RM1:yarn.scheduler.minimum-allocation-mb 分配给AM单个容器可申请的最小内存 RM2:yarn.scheduler.maximum-
2015-11-26 13:40:59
有时候,我们对运行几天或者几个月的hadoop或者hbase集群做停止操作,会发现,停止命令不管用了,为什么呢?   因为基于java开发的程序,想要停止程序,必须通过进程pid来确定,而hadoop和hbase默认的情况下,会把pid文件存储在Linux上的/tmp目录的某个目录下,进程名命令规则一般是  框架名-用户名-角色名.pid,而默认情况下,linux的tmp里面的东西,一天会删除一次,所以
2015-11-23 14:13:52
参考 https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL#LanguageManualDDL-AlterTable%2FPartitionStatements 这里主要列一些常用操作。   添加分区 ALTER TABLE table_name ADD PARTITION (partCol = '
2015-11-23 11:23:55
1. 编译执行Java程序 如果有以下代码 HelloWorld.java public class HelloWorld { public static void main(String[] args) { System.out.println("Hello World!"); } } 接下来我们使用 javac 命令来编译 Java 文件,并使用 jav
2015-11-20 18:19:41
javac编译源文件,源文件中import了第三方的源文件包,将会提示某些包不存在,二种解决方案如下。  解决方案一: javac命令中有一个选项是classpath -classpath 类路径  设置用户类路径,它将覆盖 CLASSPATH 环境变量中的用户类路径。若既未指定 CLASSPATH 又未指定 -classpa
2015-11-18 22:30:18
1、数据去重    "数据去重"主要是为了掌握和利用并行化思想来对数据进行有意义的筛选。统计大数据集上的数据种类个数、从网站日志中计算访问地等这些看似庞杂的任务都会涉及数据去重。下面就进入这个实例的MapReduce程序设计。   对数据文件中的数据进行去重。数据文件中的每行都是一个数据。   样例输入如下所示:     
2015-11-18 20:14:55
1 MapReduce编程模型 MapReduce采用"分而治之"的思想,把对大规模数据集的操作,分发给一个主节点管理下的各个分节点共同完成,然后通过整合各个节点的中间结果,得到最终结果。简单地说,MapReduce就是"任务的分解与结果的汇总"。   在Hadoop中,用于执行MapReduce任务的机器角色有两个:一个是JobTracker;另一个是 TaskTracker,J
2015-11-17 13:34:43
简介 iostat主要用于监控系统设备的IO负载情况,iostat首次运行时显示自系统启动开始的各项统计信息,之后运行iostat将显示自上次运行该命令以后的统计信息。用户可以通过指定统计的次数和时间来获得所需的统计信息。   语法 iostat [ -c ] [ -d ] [ -h ] [ -N ] [ -k | -m ] [ -t ] [ -V ] [ -x ] [ -z ] [ device [...] | ALL
27页/总38页  共456条记录  首页 上一页 下一页 尾页

回到顶部