Hbase2协处理器使用

2019-07-01

云存储

Hbase是大数据生态分布式现在的主流存储, 而它有一个高级功能可以实现代码逻辑的执行, 称之为协处理器(coprocessor), 这次尝试通过它, 看看能否实现图数据库计算的下推 (从而实现分布式计算的效果), 这是第一篇介绍背景和使用.

0x00. 简介

前言附上一张简洁的Hbase 全貌结构图:

然后在关系型DB中, 我们有学习过**”存储过程”** 和 “触发器” 的概念, 前者常是后端把一系列固定的操作下沉到DB层面, 降低RPC次数, 并且易于复用, 后者我觉得更像一个钩子(虽然我基本没用过它.. ) 以上二者在Hbase中的体现, 就被统称为”协处理器“ (coprocessor) . (推出于0.92版之后)

上面说的是类似点, 那不同之处呢? 从单词上可以看出一个它有一个前缀co , 那也就是不同于传统关系型DB的的地方, 它的”存储过程”代码是可以分布式执行的(在每台server上), 甚至有负载均衡 + 请求路由这样的功能, 和MR(Map-Reduce)有不少相似之处:

类似的, Hbase把协处理器划分为了两种:

类存储过程执行代码: endpoint 协处理器
类触发器: observer 处理器

我们目前关注的自然是第一种, 也就是后面主要说的都是endpoint 的设计和使用. (不过有些时候是需要二者结合的, 虽然核心还是endpoint)

补充:

开发环境基于HDFS3.x + Hbase2.x , 低版本可能有许多不同的地方(因为JDK版本也有大差别了), 注意甄别. (网上绝大多数文章基于0.x/1.x版本, 切勿照套)
Hbase2.0的核心读写实现可以参考NoSQL漫谈Hbase系列, 毕大写的真的很好. (这是对应的PPT合集)

0x01. 结构

1. 整体模型

endpoint 底层使用protobuf实现, 不过在了解底层之前, 先得对协处理器有个整体的认识, 这里先引用一张官方Blog的图:

其实这个模型也很类似Map-Reduce的模型, 不过需要注意的是, 在多个Region Server (后面简称RS)上分别计算之后的值并不会返回给Hbase-Master(后面简称HMaster), 而是直接返回给Client, 在Client做聚合/处理操作, 最简单的例子就是统计所有服务器上最大的一个数值, 那么就是每个RS算完之后返回一个最大值给Client, 再找出最大值.

3. 加载方式

协处理器有静态/动态/API三种加载方式,官方介绍了前面两种, 这里汇总一下全部写法..

静态加载: 通过在hbase-site.xml 里添加字段, 实现启动时全局影响, 多个类可以用, 分隔.

<property>
<name>hbase.coprocessor.user.region.classes</name>
<value>org.apache.hadoop.hbase.coprocessor.AggregateImplementation</value>
</property>

使用hbase-shell针对某个特定表开启. 三步走: (测试推荐, 简单快捷)

# 1.disable当前表
hbase> disable 'tableName'

# 2.1加载写好的协处理器类 (通常是hdfs路径,priority可省)
hbase> alter 'tableName',METHOD=>'table_att','coprocessor'=>'fullJarPath|fullClassName|priority|args|'
#实际写法例如:
alter 'huge_test:graph_v',METHOD=>'table_att','coprocessor'=>'/home/test/hbase_cop-1.0.jar|coprocessor.server.ReadRSEndpoint||'

 #如成功, 会提示Updating all regions with the new schema... All regions updated.  Done
# 2.2删除协处理器 (二选一)
hbase> alter 'tableName',METHOD=>'table_att_unset',NAME => 'coprocessor$1'

# 3.enable当前表
hbase> enable 'tableName'

# 可以desc看看
hbase> desc 'tableName'

我们实际编程里也可以考虑使用第三种, API直接调用 (注: 注释部分为Hbsae1.x版本API,很多方法已经过时, 但考虑兼容还是保留一下)

 // 添加Hbase协处理器 (Adaptor for Hbase2)
public static void setupToExistTable(Connection connection, Table table, String jarPath, Class<?>... cls) {
        try {
            if(jarPath != null && !jarPath.isEmpty()) {
                //Path path = new Path(jarPath);
                TableDescriptorBuilder tdb = TableDescriptorBuilder.newBuilder(table.getDescriptor());
                //HTableDescriptor hTableDescriptor = table.getTableDescriptor();
                for(Class cass : cls) {
                    tdb.setCoprocessor(CoprocessorDescriptorBuilder
                                       .newBuilder(cass.getCanonicalName())
                                       .setJarPath(jarPath)
                                       .build());
                    //tdb.addCoprocessor(cass.getCanonicalName(), path, Coprocessor.PRIORITY_USER, null);
                }
                connection.getAdmin().modifyTable(table.getDescriptor());
                //connection.getAdmin().modifyTable(table.getName(), hTableDescriptor);
            }

        } catch (IOException e) {
            e.printStackTrace();
        }
    }

    // 删除HBase表上的协处理器 (注释为过时写法)
    public static void deleteCoprocessor(Connection connection, Table table, Class<?>... cls) {
        System.out.println("begin delete " + table.getName().toString() + " Coprocessor......");
        try {
            TableDescriptorBuilder tdb = TableDescriptorBuilder.newBuilder(table.getDescriptor());
            //HTableDescriptor hTableDescriptor = table.getTableDescriptor();
            for(Class cass : cls) {
                //hTableDescriptor.removeCoprocessor(cass.getCanonicalName());
                tdb.removeCoprocessor(cass.getCanonicalName());
            }
            connection.getAdmin().modifyTable(table.getDescriptor());
            //connection.getAdmin().modifyTable(table.getName(), hTableDescriptor);
        } catch (IOException e) {
            e.printStackTrace();
        }
        System.out.println("end delete " + table.getName().toString() + " Coprocessor......");
    }

开启如果成功, 在Hbase的前端页面Table Description 中应该可以看到对应内容 (命令下desc 同理)

4. 实现步骤:

定义一个接口文件EndPointXxx.proto 用于自动生成接口定义类EndPointXxx.java .
Server端编写一个类实现协处理器接口, 打包上传.
动态加载实现好的协处理类
Client端调用协处理器, 使它开始工作

4.4 Client调用协处理器

这里比较关键的是第四点, 也就是如何在Client使用协处理器. 这里主要通过HTable 的coprocessorService 来实现, 而它有三种入参选择(需要理解区别) :

调用单个Region的协处理器, 标准Hbase-RPC调用
调用多个Region, 但不使用回调(callback)
(常用)调用多个Region, 且使用回调(callback), 参考下图:

然后,如果是访问多个RS(RegionServer), 还可以使用更高效的batchCoprocessorService , 这样访问一个RS的多个Region就只需要一次RPC, 而上面的调用方式, 访问每个Region都需要一次RPC, 理论上我们应该使用的是这种方式, 参考如图: (待确认?)

但是关于下面batchCoprocessorService的资料少的可怜, 所以先按常见的默认写, 再对比看看现在是不是这样吧(图引自Hbase1.x版, 新版实现和区别待确定) ,

待代码确认补充

0x02. 准备

因为协处理器的使用依赖一个框架, 所以在看看多个RegionServer之间能否互相访问读取数据之前, 我们先得做好准备, 这样之后就可以专注于开发了.

PS: 之后再考虑实现两个简单好理解的demo, 一个是统计所有节点总行数, 一个是统计某个最大值?

首先构建一个合适的pom 文件, 注意Protobuf Hbase官方使用的非最新3.x的版本, 所以请使用protobuf2的语法. (下面是可参考的依赖, 注意包版本)

<properties>
        <hbase.version>2.0.2</hbase.version>
        <hdfs.version>3.1.0</hdfs.version>
        <java.version>1.8</java.version>
        <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
    </properties>

    <dependencies>
        <dependency>
            <groupId>org.apache.hbase</groupId>
            <artifactId>hbase-client</artifactId>
            <version>${hbase.version}</version>
            <exclusions>
                <exclusion>
                    <artifactId>jetty-servlet</artifactId>
                    <groupId>org.eclipse.jetty</groupId>
                </exclusion>
            </exclusions>
        </dependency>
        <!-- 如果你要直接通过API控制协处理器,则需要HDFS的包 (可选)
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-hdfs-client</artifactId>
            <version>${hdfs.version}</version>
        </dependency> 
        -->
        <!-- 如果要测试官方的Demo,则引入此包
        <dependency>
            <groupId>org.apache.hbase</groupId>
            <artifactId>hbase-examples</artifactId>
            <version>${hbase.version}</version>
        </dependency>
        -->
    </dependencies>

最后编译的插件自行补充, 我就不单独贴了(网上或者书上说需要依赖hbase-server ,或者protobuf , 或其他依赖都可无视..因为没有一个是基于Hbase2.0的 )

然后就是把protobuf用起来也并不艰难, 核心就三步:

定义一个合适的.proto 文件 (如何写参考官方文档和Hbase-protobuf-example)
使用protobuf编译器编译它生成对应的java文件
使用Java的protobuf-API包去进行读写

官方demo学习

最新版的Protobuf使用非常简单, 下载解压包Protobuf后, 编写一个proto文件, 然后一行命令编译就行. 无需再做其他操作. (Mac也可以用Maven方式编译)

先看看官方提供的Examples.proto 写法: (头部不声明的话, 默认使用的是proto2的语法, 变量须有两个关键字)

option java_package = "org.apache.hadoop.hbase.coprocessor.example.generated";
option java_outer_classname = "ExampleProtos";
option java_generic_services = true;
option java_generate_equals_and_hash = true;
option optimize_for = SPEED;

message CountRequest {
}

message CountResponse {
  required int64 count = 1 [default = 0]; 
}

service RowCountService {
  rpc getRowCount(CountRequest)
    returns (CountResponse);
  rpc getKeyValueCount(CountRequest)
    returns (CountResponse);
}

新建两个文件夹, 例如input 和 output , 前者存放proto 文件, 后者存放编译后生成的java文件. 然后在protobuf-3.7.1 目录下执行一行命令 :

1	protoc -I=../input --java_out=../output ../input/Examples.proto

目前来看, Hbase2.x上是不建议一起打依赖包的, 会发生奇怪难以定位的包加载冲突问题, 导致协处理器甚至无法正常加载, 直接打裸包就正常 (网上说打依赖包可能适合旧版本..)

1	mvn clean install #可不用-Dmaven.test.skip=true

然后把包上传到HDFS目录, 方便之后从API或HShell读取

1	hadoop fs -put hbase-cpr1.0.jar /home/test

0x03. 运用

然后再试着跟图本身进行结合, 从图的表里直接读取数据. 并且尝试把RS自身当成一个客户端, 从而每个RS可以自由访问其它RS上的数据.

1.编写protobuf文件

新建文件命名为ReadRS.proto ,然后根据需要, 思考我们要哪些方法, 传入哪些参数, 接受哪些返回值. 参考官方文档, (zh-version.), 下面是个我写的实际例子:

option java_package = "protobuf";
option java_outer_classname = "ReadRSProtos";
option java_generic_services = true;
option java_generate_equals_and_hash = true;
option optimize_for = SPEED;


// request对象,在其中定义client需传入的属性
message ReadRSRequest {
    required string tableName = 1; // 必传的参数字段, 后面'1'是标识号. (局部唯一)
    optional int32 limit = 2 [default = 10]; // 可选的字段,标识'2'. 默认值10
    repeated string configs = 3; // 类似List<String> configs
    optional string temp = 4 ; // 临时使用
}

// response对象,在里面定义需要返回的属性,client端接收
message ReadRSResponse {
    optional string resultStr = 1; 
    optional int32 resultNum = 2;
    optional int64 rowCountAll = 3; // region总行数统计
    repeated string strList = 4;
    optional int32 rowCount = 5;  // region部分行统计
}

// service定义RPC的输入输出,多个函数对应多个实现
service ReadRSService {
  rpc readRS(ReadRSRequest)
    returns (ReadRSResponse);
  rpc rowCount(ReadRSRequest)
    returns (ReadRSResponse);
  rpc kstep(ReadRSRequest)
    returns (ReadRSResponse);
}

写完用上面protoc 的命令就可生成一个ReadRSProtos.java文件放进项目的protobuf包下了, 然后创建一个Server

2. 编写Server程序

这里其实就是编写协处理器的执行核心, 叫Server 是为了方便和Client 对应, 好理解一点. 比如我们要写一个ReadRSEndpoint类. 到时候让Hbase加载它, 让Client可以调用到, 这里放一下核心的代码, 完整代码可参考git. (这里为了更多的体验Cop的功能, 把几个功能都综合写了一下 , 也是方便对比和查看区别)

@Override
public void readRS(RpcController controller, ReadRSProtos.ReadRSRequest request,
                   RpcCallback<ReadRSProtos.ReadRSResponse> done) {

    ReadRSProtos.ReadRSResponse response = null;
    // Read config from request for client-connection (based on region-server)
    Configuration cfg = HBaseConfiguration.create();
    cfg.set("hbase.zookeeper.property.clientPort", request.getConfigs(0));
    cfg.set("hbase.zookeeper.quorum", request.getConfigs(1));
    
    try {
        // Get some info about Table & Region
        for (Store store : env.getRegion().getStores()) {
            LOG.info("Table name= '" + store.getTableName() +
                     "' Region name= '" + store.getRegionInfo().getRegionNameAsString() +
                     "' CF name='"+store.getColumnFamilyName()+"' Total size=" +store.getSize()+
                     " HFile num =" + store.getNumHFiles());
            //store.refreshStoreFiles();
        }

        // Start to read data from regions
        Connection connection = ConnectionFactory.createConnection(cfg);
        LOG.info("Enter Cop-readRS, ready to read..." + request.getTableName());
        String strResult = HBaseUtils.readTable(request.getTableName(), connection,
                                                request.getLimit());
        response = ReadRSProtos.ReadRSResponse.newBuilder()
                                              .setResultStr(strResult)
                                              .setResultNum(777)
                                              .build();
        LOG.info("[Test only] StrResult --> " + strResult);
    } catch (IOException ioe) {
        LOG.info("Exception while trying to get files: ", ioe);
        CoprocessorRpcUtils.setControllerException(controller, ioe);
    }

    LOG.info("Get response from Cop-readRS, done..." + request.getTableName());
    done.run(response);
}

3. 编写Client程序

同样, 这是client端接受和发送请求的核心部分:

public void readRS(final Table table, String... strs) throws Throwable {
        final ReadRSProtos.ReadRSRequest request;
        // 这里可以把Server需要的参数构造好一起发过去. 从而随时调整执行的条件.
        request = ReadRSProtos.ReadRSRequest.newBuilder()
                                            .setLimit(3) // check if it works
                                            .addConfigs("2181")
                                            .addConfigs("ZK_IP")
                                            .setTableName(strs[0])
                                            .build();
    
        // Use callback to get response data?
        // AtomicReference<String> strResult = new AtomicReference<>();
        AtomicInteger numResult = new AtomicInteger();
        // 目前来看,应该是使用final而不是使用AtomicReference<T>, 后者不能直接累加式更新.
        final StringBuilder str = new StringBuilder();
        Batch.Callback<ReadRSProtos.ReadRSResponse> callback =
                (bytes, bytes1, response) -> {
                    // 这里所有的操作都需要是原子的,所以必须使用Atomic类型获取.
                    str.append(response.getResultStr()); // 把每个Region的返回拼接
                    //System.out.println(response.getResultStr());
                    numResult.getAndAdd(response.getResultNum()); // 把每个Region的返回累加, 比如rowCount就这样算
                };
        table.coprocessorService(ReadRSProtos.ReadRSService.class,
                                 HConstants.EMPTY_START_ROW, HConstants.EMPTY_END_ROW,
                                 readRSService -> {
                                     ServerRpcController controller = new ServerRpcController();
                                     BlockingRpcCallback<ReadRSProtos.ReadRSResponse> rpcCallback =
                                             new BlockingRpcCallback<>();
                                     readRSService.readRS(controller, request, rpcCallback);
                                     if (controller.failedOnException()) {
                                         throw controller.getFailedOn();
                                     }
                                     return rpcCallback.get();
                                 }, callback);
        System.out.println("\nDone Read RS data, \ntable --> " + strs[0] + "'s result:" + strResult + "\nIntResult: " + numResult);
    }

更新: 由于内部 sec 要求, 文章开放后移除了与图数据库 + hbase 实现 kstep 下推的相关代码 (详见公司内分享及代码)

0x04. Q&A

1.更新了协处理器的内容覆盖上传, 为什么还是执行历史代码?

更换jar包的版本是最靠谱的做法:

每次修改了协处理器打包时, 更新一下版本比如V1.0 –>V1.1 . 可能是Hbase自身缓存可能就会出现类似问题? 很蛋疼

2. Win上运行的时候提示Hadoop环境不存在

参考此文, 实际上这个报错你不管一般也没什么本质影响, 而且我也很不建议在win的环境安装Hadoop … 但是那一大堆的报错实在糟心, 有什么办法解决么?

我发现可以通过设置巧妙利用log4j绕开它…让那一大堆报错不输出, 而不是浪费时间去配Hadoop环境变量 , 个人做法如下: 使用log4j需要一个对应的配置文件, 来设置相关日志参数log4j.properties, 我们修改日志输出为OFF ,就不会抛出那一大堆的错误/警告了.

1 2	#添加/修改这一行就行 log4j.rootLogger=OFF, stdout

3. protobuf中设置List属性的时候报错

这里注意几点:

list的属性, 不要使用setXxx(index, value) , 这样直接使用会报数组越界, 应使用add(value)
list的属性, 不要设置null 值(add(null)), 这样序列化的过程会有NPE (空指针)报错导致需要重新打包, 所以就算是测试也别传任何空进去.

参考资料: