上篇:C++分布式实时应用框架 (Cpp Distributed Real-time Application Framework)----(一):整体介绍
通讯平台作为C++分布式实时应用框架(Cpp Distributed Real-time Application Framework)的最核心模块,承担了分布式实时框架的基础通讯功能。通讯平台框架具备了基于Reactor模式的网络通讯能力,并且依赖于ZeroMQ库,因此支持非持久化的message queue的功能。基于配置文件来自动建立链接关系的功能,可以和状态中心一起配合,实现无需重启节点的动态扩容缩容等功能。强大的实时监控能力,可以实时上报每个通讯子节点的TPS和时延等关键性能数据。管控业务进程的能力,业务进程的心跳检测,故障时自动重启、保证系统正常运行。完善的平台工具,可以通过通讯平台向业务进程发送各种命令,如:调整日志级别,刷新业务参数,启停业务进程等等。下面将逐一介绍通讯平台的功能细节。
常见的分布式系统通常将进程间、节点间的各种通讯关系写死在业务代码中,这是导致代码复杂难以理解的原因。我们创新地将所有的通讯关系提取到AppInit.json配置文件中,业务代码中不再包含任何与通讯连接相关的内容,使业务代码可以更专注于业务处理,而不用分心于复杂的分布式节点通讯当中。下面我们将带大家看下图所示通讯关系的配置。
OLC作为数据分发节点,给多个业务处理节点分发消息。业务处理节点内部由OCDis接收外部消息,转发给内部的OCPro业务处理进程,并负责处理完后的回包。
OLC配置部分:
- "OLC": {
- "AUTO_START": "YES",
- "ENDPOINTS": [{ // 用于与SmartMonitor建立心跳
- "name": "MonitorSUB",
- "zmq_socket_action": "CONNECT",
- // ZMQ的连接模式
- "zmq_socket_type": "ZMQ_SUB" // ZMQ的通讯模式
- },
- { // 下发消息给OCDis,这边存在转发功能,支持业务实现按条件转发
- "downstream": ["OCDis2OLC"],
- "name": "NE2OLC",
- // 根据这个名字在业务代码中实现转发
- "zmq_socket_action": "BIND",
- "zmq_socket_type": "ZMQ_STREAM"
- },
- { // OLC到OCDis的链路
- "name": "OCDis2OLC",
- "statistics_on": true,
- "zmq_socket_action": "CONNECT",
- "zmq_socket_type": "ZMQ_DEALER"
- },
- { // OCDis回OLC的链路,之所以来去分开,主要用于实现优雅启停功能(启停节点保证不丢消息)
- "name": "OCDis2OLC_Backway",
- "statistics_on": true,
- "zmq_socket_action": "CONNECT",
- "zmq_socket_type": "ZMQ_DEALER",
- "backway_pair": "OCDis2OLC"
- },
- { // 用于与SmartMonitor的命令消息链路
- "name": "OLC2Monitor",
- "zmq_socket_action": "CONNECT",
- "zmq_socket_type": "ZMQ_DEALER"
- },
- ],
- "ENDPOINT_TO_MONITOR": "OLC2Monitor",
- "INSTANCE_GROUP": [{
- "instance_endpoints_address": [{
- "endpoint_name": "NE2OLC",
- "zmq_socket_address": "tcp://*:6701"
- },
- {
- "endpoint_name": "OCDis2OLC",
- "zmq_socket_address": ["tcp://127.0.0.1:7201" // 跨机的IP地址与端口,配合状态中心可实现自动管理,无需人工参与配置
- ]
- },
- {
- "endpoint_name": "OCDis2OLC_Backway",
- "zmq_socket_address": ["tcp://127.0.0.1:7202"]
- },
- {
- "endpoint_name": "OLC2Monitor",
- "zmq_socket_address": "ipc://Monitor2Business_IPC"
- },
- {
- "endpoint_name": "MonitorSUB",
- "zmq_socket_address": "ipc://MonitorPUB"
- }],
- "instance_group_name": "1"
- }]
- },
OLC程序:
- static const char * ENDPOINT_NE2OLC = "NE2OLC";
- static const char * ENDPOINT_OLC2OCDIS = "OCDis2OLC";
- static const char * ENDPOINT_MONITORSUB = "MonitorSUB";
- int main(int argc, char * argv[]) {
- SmartUtilities: :Daemonize();
- OLCProxyServer server(argc, argv);
- if (!server.Initialize(logger)) return - 1;
- // OLC与OCDis的消息处理
- server.SetCallbackOnReceivingMessage(ENDPOINT_OLC2OCDIS, bind( & OLCProxyServer: :ReceiveFromOCDis, &server, _1, _2, _3));
- // OLC与SmartMonitor的消息处理
- server.SetCallbackOnReceivingMessage(ENDPOINT_MONITORSUB, bind( & OLCProxyServer: :ReceiveFromMonitorSUB, &server, _1, _2, _3));
- // 解析消息包实现业务功能
- server.SetPacketParserFunction(ENDPOINT_NE2OLC, bind( & OLCProxyServer: :ParseStreamCCR, &server, _1, _2, _3));
- // 设置消息转发具体规则
- server.SetDownstreamSelector(ENDPOINT_NE2OLC, bind( & OLCProxyServer: :StreamSelector, &server, _1, _2));
- server.Run();
- return 0;
- }
通讯平台支持在线重新读取更新的配置文件,更新网络拓扑,自动建立新链接、断开旧链接的能力。配合状态中心可以实现无需重启节点的动态扩容缩容等功能。
业务进程可以跟SmartMonitor建立通讯联系,SmartMonitor可以检测业务进程的心跳,以保证业务进程的可用。SmartMonitor通过AppCount.json来管理节点业务进程,实现统一启停等功能。
- {
- "OCPro": {
- "IN": 2, // 业务进程可以有不同的种类,后面代表进程数
- "PS": 3,
- "SMS": 4,
- },
- "OCDis": 3,
- "SERVER_TYPE":"OCS" // 节点的类型
- }
还可以通过SmartTool工具进程,来给业务进程发送各种命令,如:调整日志级别,刷新业务参数,启停业务进程等等。
1. 启动平台
SmartMonitor
2. 停平台
SmartTool stop all
停指定进程(停止后会被SmartMonitor重新拉起)
SmartTool stop OCPro 停止所有业务的OCPro进程
SmartTool stop OCPro.IN 停止IN业务的OCPro进程
SmartTool stop 4829 停止PID为4829的进程
3. 调整应用层、框架层日志级别
其中,日志级别为error,warn,info,debug,trace
SmartTool log 进程名 level=日志级别,flush=日志级别
比如: SmartTool log OCPro level=debug,flush=debug
进程Z负载控制消息流量,进程A负责发、收消息,统计时延数据。进程B收到消息后负责回消息。
性能瓶颈主要在A机,既要负责收发包,又要统计时延数据,还要控制流量。
未完待续...
技术交流合作QQ群:436466587欢迎讨论交流
来源: http://www.cnblogs.com/cdap/p/7809381.html