一、RPC(Remote Procedure Call)简介
RPC 是远程过程调用(Remote Procedure Call),即远程调用其他虚拟机中运行的javaobject。RPC 是一种客户端/服务器模式,那么在使用时包括服务端代码和客户端代码,还有我们调用的远程过程对象。HDFS 的运行就是建立在此基础之上的。本章通过分析实现一个简单的RPC 程序来分析HDFS 的运行机理。
二、代码解析
1. 服务端代码
代码如下:
public class MyServer {
public static final int SERVER_PORT = 12345;
public static final String SERVER_ADDRESS = "localhost";
public static void main(String[] args) throws IOException {
final Server server = RPC.getServer(new MyBiz(), SERVER_ADDRESS,
SERVER_PORT, new Configuration());
7 server.start();
}
}
核心在于第5 行的RPC.getServer 方法,该方法有四个参数:
第一个参数是被调用的java服务对象。
第二个参数是服务器的地址。
第三个参数是服务器的端口。
获得服务器对象后,启动服务器。这样,服务器就在指定端口监听客户端的请求。
2. 被调用的远程对象类
代码如下:
public class MyBiz implements MyBizable{
public static long BIZ_VERSION = 2345234L;
@Override
public String hello(String name){
System.out.println("我被调用了");
return "hello "+name;
}
@Override
public long getProtocolVersion(String protocol, long clientVersion)
throws IOException {
return BIZ_VERSION;
}
}
被调用的远程对象实现了接口MyBizable,这里面有两个方法被实现,一个就是hello方法,另一个是getProtocalVersion 方法。这个hello 方法内部有个输出语句
3. 远程调用类的接口
代码如下:
public interface MyBizable extends VersionedProtocol{
public abstract String hello(String name);
}
这个接口中的方法就是刚才的Biz 中实现的方法。接口继承的VersionedProtocal,是hadoop 的RPC 的接口,所有的RPC 通信必须实现这个一接口,用于保证客户端和服务端的端口一致。服务端被调用的类必须继承这个接口VersionedProtocal。
4. 客户端代码,这里使用的调用对象的接口
代码如下:
public class MyClient {
public static void main(String[] args) throws Exception {
final MyBizable proxy = (MyBizable)RPC.getProxy(MyBizable.class,
4 MyBiz.BIZ_VERSION, new InetSocketAddress(MyServer.SERVER_ADDRESS,
MyServer.SERVER_PORT), new Configuration());
//调用接口中的方法
final String result = proxy.hello("world");
System.out.println(result);
//本质是关闭网络连接
10 RPC.stopProxy(proxy);
}
}
以上代码中核心在于RPC.getProxy(),该方法有四个参数:
第一个参数是被调用的接口类。
第二个是客户端版本号。
第三个是服务端地址。
返回的代理对象,就是服务端对象的代理,内部就是使用java.lang.Proxy 实现的。运行时,先启动服务端,再启动客户端。读者可以在服务端和客户端输出信息。
从上面的RPC 调用中,可以看出:在客户端调用的业务类的方法是定义在业务类的接口中的。该接口实现了VersionedProtocal 接口。
5. 现在我们在命令行执行jps 命令查看输出信息
如图2.1 所示。
图 2.1
可以看到一个java 进程,是“MyServer”,该进程正是我们刚刚运行的rpc 的服务端类MyServer。大家可以联想到我们搭建hadoop 环境时,也执行过该命令用来判断hadoop 的进程是否全部启动。那么可以判断,hadoop 启动时产生的5 个java 进程也应该是RPC 的服务端。我们观察NameNode 的源代码,我们可以看到如图下代码,可以看到NameNode 确实创建了RPC 的服务端。
// create rpc server
InetSocketAddress dnSocketAddr = getServiceRpcServerAddress(conf);
if (dnSocketAddr != null) {
int serviceHandlerCount =
conf.getInt(DFSConfigKeys.DFS_NAMENODE_SERVICE_HANDLER_COUNT_KEY,
DFSConfigKeys.DFS_NAMENODE_SERVICE_HANDLER_COUNT_DEFAULT);
this.serviceRpcServer = RPC.getServer(this, dnSocketAddr.getHostName(),
dnSocketAddr.getPort(), serviceHandlerCount,
false, conf, namesystem.getDelegationTokenSecretManager());
this.serviceRPCAddress = this.serviceRpcServer.getListenerAddress();
setRpcServiceServerAddress(conf);
}