手册游戏 WEB 字典单词在线工具

当前位置：

首页
/
IT
/
程序
/
爬虫架构 | 利用 Kafka 处理数据推送问题 (3) 架构图

爬虫架构 | 利用 Kafka 处理数据推送问题 (3) 架构图

一, 需求

1, 对于所有任务产生的实时数据, 通过 Kafka 及时推送.

2, 对于新加任务需要去历史全量数据表中获取该任务已有的历史数据.

3, 爬虫集群在生产数据时需要去全量数据中进行下匹配, 如果不存在才会推送给 Kafka.

二, 架构设计图

Kafka+MySQL 架构设计

三, 结语

欢迎相关人员一起交流.

来源: http://www.jianshu.com/p/be7ef1e723cc

与本文相关文章

暂无,快来抢沙发吧！