1、Kudu概述Kudu 是一个针对 Apache Hadoop 平台而开发的列式存储管理器。
2、基础架构Kudu也采用了Master-Slave形式的中心节点架构,管理节点被称作Kudu Master,数据节点被称作Tablet Server(可对比理解HBase中的R髫潋啜缅egionServer角色)。一个表的数据,被分割成1个或多个Tablet,Tablet被部署在Tablet Server来提供数据读写服务。Kudu Master在Kudu集群中,发挥如下的一些作用:1. 用来存放一些表的Schema信息,且负责处理建表等请求。2. 跟踪管理集群中的所有的Tablet Server,并且在Tablet Server异常之后协调数据的重部署。3. 存放Tablet到Tablet Server的部署信息。Tablet与HBase中的Region大致相似,但存在如下一些明显的区别点:Tablet包含两种分区策略,一种是基于Hash Partition方式,在这种分区方式下用户数据可较均匀的分布在各个Tablet中,但原来的数据排序特点已被打乱。另外一种是基于Range Partition方式,数据将按照用户数据指定的有序的Primary Key Columns的组合String的顺序进行分区。而HBase中仅仅提供了一种按用户数据RowKey的Range Partition方式。
3、Kudu安装点击主机下面的Parcel
4、点击KUDU对应的下载,下载完后点击分配、激活
5、回到首页点击添加服务
6、选择KUDU 选择继续
7、分配角色
8、设置master和Tablet路径
9、启动过程出现错误启动kudu失败,错误日志提示:Service unavailable: Can艘绒庳焰not initialize 艘早祓胂clock: Error reading clock. Clock considered unsynchronized解决: 检查ntp服务,安装或重启ntp服务/etc/init.d/ntpd restart