Docker 注册表的主要目的是存储和分发 Docker 镜像, 看似是一个相对简单的任务, 但是如果遇到了像 Uber 这样的大规模计算集群, 就很容易成为可伸缩性的瓶颈. 在多区域和混合云系统的计算环境中, 镜像分发会变得更具挑战性.
为了解决遗留 Docker 注册表堆栈的性能问题, Uber 的集群管理团队开发了一个开源对等 (P2P)Docker 注册表 kraken.
Docker 容器是 Uber 基础设施的基础构建块, 但是随着计算集群数量和大小的增加, 一个简单的带有 sharding 和缓存的 Docker 注册表设置无法跟上高效分发 Docker 映像所需的吞吐量.
Kraken 重点关注在可扩展性和可用性方面, 用于混合云环境中的 Docker 镜像管理, 复制和分发. 支持可插拔的后端, Kraken 可以作为分发层插入到现有的 Docker 注册表设置中.
架构
在 Kraken 研发时, Uber 探索了多种设计, 最终选择了 p2p 架构. Kraken 使用针对数据中心网络环境定制的 P2P 协议, 并在企业级改进了微服务生命周期管理.
代替管理数据块, Kraken 支持可插入存储选项, 可以插入可靠的 blob 存储选项, 如 S3,HDFS 或其他注册表, 且存储接口简单, 易于添加新选项.
另外, Kraken 在现有的成熟技术上建立了独特的数据分发解决方案, 支持自我修复, 易于维护, 支持集群之间的无损和基于规则的异步复制.
大规模的性能改进
2018 年年初, Kraken 首次部署在了 Uber 中, 其在遗留 Docker 注册表堆栈中遇到的性能问题迎刃而解.
据悉, 在 Uber 最繁忙的时候, Kraken 集群每天分发超过 100 万个 blob, 其中有 10 万个分发的 blob 大小超过 1GB 或更多. 在生产高峰期, Kraken 可以在 30 秒内分发 20000 个 100MB 到 1GB 的 blob.
Kraken 的高可扩展性使其能够支持至少 8000 台主机的集群, 并以超过集群中主机最大下载速度限制 50% 的速度分发 Docker 镜像. 另外, 对 Kraken 来说, 集群和镜像大小对下载速度没有显著影响.
自内部发布以来, Kraken 一直被用于管理和分发 Uber 的所有 Docker 镜像. 这次将该工具开源出来, Uber 表示希望能够激发有关工程和设计最佳实践的讨论, 以便与 Docker 一起构建一个适应性强且可靠的基础设施.
Kraken 的 GitHub 地址: https://github.com/uber/kraken
(本文章转载自 infoq, 如有侵权, 请联系作者删除)
来源: http://www.jianshu.com/p/f80a4640c1c0