Kubernetes vs Docker: 了解 2021 的容器

1. 什么是容器？
2. 什么是 Docker ？
3. 什么是 Kubernetes ？
4. 容器格式
5. Docker Vs. Kubernetes
6. Dockershim 的弃用
7. 弃用 Docker 之后对你有什么影响？
8. 结论

这是一篇译文，原文在：https://semaphoreci.com/blog/kubernetes-vs-docker

容器、容器化这几年发展飞快发生了很多的变革，如果不是从头跟到尾的话，会有些稀里糊涂。我之前翻译过一篇文章：Docker 生态一览基本上说了 Docker 的前世今生。但是 Docker 与 Kubernetes 的恩怨情仇并没有提到（那时候还没发生）。直到 Kubernetes v1.20 弃用 Docker 之后，一些人是一脸懵逼的，到底发生了什么？

这篇文章会给你一个解释，从根源上说一些问题。当然我不是逐字翻译的，而且会加上一些个人的理解。

这篇文章的图很帅，只看图也可以收获许多。

几周之前，Kubernetes 开发团队声明了弃用 Docker。这条新闻在社区和社交网络上掀起了波澜。Kubernetes 集群会崩溃吗？如果这样的话，我们该怎么运行自己的应用程序？现在应该怎么办？今天，我们会研究所有这些的疑问和更多的问题。

1. 什么是容器？

在 Docker 作为容器的代名词之前，事实上容器在很久之前就已经存在了。在 70 年代后期引入 chroot 之后，容器就已某种形式存在了。 Chroot 允许系统管理员在一种不是真正隔离的文件系统中运行程序。后来，这个想法被提炼并且扩展为容器引擎，比如：FreeBSD Jails，OpenVZ 或者 Linux Containers(LXC)。

什么是容器？

容器是一个逻辑分区，我们在其中运行与其它部分隔离的应用程序。每个应用程序都有属于自己的私有网络和虚拟文件系统，不会与其它的容器或者宿主机共享。

应用程序容器化之后的运行要比安装和配置软件要方便的多。一方面，容器是便携式的，在一台服务器上构建，就可以保证在任何服务器上运行。另外一个优点是我们可以同时运行同一个程序的多个副本，而不会发生冲突或者重叠。传统的部署方式很难做到这一点。

但是，要使这些工作正常运行，我们需要一个 容器运行时 ，它是一个能够运行容器的软件。

2. 什么是 Docker ？

从长远来看，Docker 是一个最受欢迎的容器运行时。因为 Docker，容器的概念才成为主流，后来启发了诸如 Kubernetes 之类的平台的诞生。

在 Docker 之前，运行容器是可能的，但是是一个艰巨的工作。Docker 使事情变得简单，因为它是一个完整的技术栈可以让你：

管理容器的生命周期；
往返容器的请求代理；
监控和记录容器活动；
挂载共享目录；
设置容器的资源限制；
构建镜像。 Dockerfile 用来构建容器镜像；
从镜像中心推送和拉取镜像；

在第一个迭代中，Docker 使用 LXC 作为底层的运行时。随着项目的发展，LXC 被 Containerd 给替换了，这是 Docker 自己的实现。现代的 Docker 安装分两个服务：

containerd 用来管理容器；
dockerd 完成其余的工作；

3. 什么是 Kubernetes ？

Kubernetes 利用了容器的概念并且提升了一个级别。Kubernetes 不在单个服务器上运行容器化的应用程序，而是将他们分布在一个集群中。应用程序在 Kubernetes 中运行行为类似一个独立的单元，即使，他们可能由一些松散耦合的容器排列组成。

Kubernetes 在容器的上层添加了分布式计算的特性：

Pods pods 是容器的逻辑分组，内部的容器共享诸如内存、CPU、存储和网络之类的资源；
自动伸缩（弹性扩容） Kubernetes 可以根据需求启动和停止 Pod 来自动适应不断变化的工作负载；
自我修复 容器会被监控，发生故障时自动重启；
负载均衡 请求会被分布在健康可用的容器上；
Rollouts Kubernetes 支持自动部署和回滚。像金丝雀和蓝绿复杂的发布策略变的简单;

Kubernetes 的架构是两个平面的组合：

控制平面 是集群协调的大脑。它包含一组 controller 来管理节点和服务， scheduler 将 Pod 分配给节点，还有 API Service 来处理通讯。配置和状态存储在一个称为 etcd 的高可用数据库中；
工作节点 是运行容器的机器。每个工作节点都运行一些组件，比如 kubelet 代理，网络代理，和容器的运行时。默认的运行时在 Kubernetes v1.20 之前都是 Docker；

4. 容器格式

在启动容器之前，我们首先要构建或者下载一个 容器镜像 ，它是一个打包了应用程序所需一切的文件系统：代码，二进制，配置文件，库和依赖。

容器受欢迎程度表明了需要一个开放的镜像标准。最终，Docker 公司和 CoreOS 在 2015 建立了 OCI，以生产和厂商无关的格式为使命。这项工作的结果是创建了两个标准：

镜像规范定义了镜像的二进制格式；
运行时规范描述了如何解压和运行容器。OCI 维护了一个称为 runc 的实现。containerd 和 CRI-O 后台都是用 runc 生成容器；

OCI 标准使得不同的容器解决方案之间可以相互操作。在系统中内置的镜像可以在其它兼容的堆栈中进行。

5. Docker Vs. Kubernetes

事情有点复杂。我之前说过 Kubernetes 工作节点需要一个容器运行时。在第一个初始设计中，Docker 和 Kubernetes 是密不可分的，因为它是唯一受支持的运行时。

但是 Docker 没有被设计成在 Kubernetes 中运行。意识到这个问题之后，Kubernetes 开发人员最终实现了一个称为 容器运行时接口（CRI） 的 API。这些接口使我们可以在不同的容器运行时中进行选择，从而使平台更加灵活，并且对 Docker 的依赖性降低。

这个变动为 Kubernetes 团队带来了新的困难，即 Docker 不了解或者不支持 CRI。因此，在引入 API 的同时，他们必须编写一个将 CRI 消息转换为 Docker 特定命令的配接器，也就是 Dockershim 。

6. Dockershim 的弃用

尽管 Docker 是第一个也是唯一一个被支持的引擎，但是它从未列入长期规划中。Kubernetes 1.20 版本废弃了 Dockershim，从 Docker 开始平滑转换。

转换完成之后，堆栈变得更小。从：

到：

减少了臃肿，而且减少了每个节点上的依赖项。

因此，为什么要这么做呢？

简单来说，Docker 太重了。轻量级的运行时，比如 containerd 或者 CRI-O 会有更佳的性能。例如，Google benchmarks 展示了 containerd 有更小的 CPU 和内存消耗，而且启动 Pod 的时间比 Docker 的时间更短。

此外，在一些方面 Docker 本身被认为存在技术债务。Kubernetes 对 Docker 的真实需要是运行时 containerd。其它的东西，至少对于 Kubernetes 而言，是开销。

7. 弃用 Docker 之后对你有什么影响？

事情并不像听起来那样有戏剧性。我们开始说的一句话，v1.20 的唯一变化是，只有在运行 Docker 时，你才会收到弃用的警告。就这些。

我依然可以在开发环境下使用 Docker ？

是的，当然可以，不管是现在还是可遇见的将来。如你所知，Docker 并不是使用符合 Docker 规范的镜像；它运行符合 OCI-兼容的容器。只要 Docker 继续使用这种格式，Kubernetes 就会持续接收他们。

我仍然可以使用 Docker 打包我的生产应用程序吗？

是的，和上一个问题的原因一样。Docker 打包的应用程序将继续运行 - 没有任何变化。因此，你仍然可以使用自己熟悉的和喜爱的工具来构建和测试容器。你不需要改变 CI/CD pipelines 或者切换到其它镜像中心。生产的 Docker 镜像会跟之前一样继续在你的集群中工作。

我需要做哪些变更？

目前，什么都不需要做。如果你的集群使用 Docker 作为运行时，升级到 v1.20 之后只会得到一个警告。但是，这一变化是 Kubernetes 社区明确表示这是他们未来的方向。现在是时候为为未来做一些规划了。

当 Dockershim 废弃之后，会发生什么？

届时，迫使 Kubernetes 集群管理员切换到符合 CRI 的容器运行时。

如果是最终用户 不会为你带来很多变化。除非你在使用某种节点定制，否则你可能什么都不用做。只要测试你的应用程序和新的容器运行时是否可以一起用。

下面这些是升级到 v1.23 后会硬气的问题或者中断的一些事情：

使用 Docker 指定的日志和监控。也就是说，从日志中解析 Docker 信息或者轮询 Docker API；
使用 Docker 优化；
运行依赖 docker CLI 的脚本；
在 Pod 中使用 Docker 特权命令。比如：使用 docker build 构建镜像。参阅 kaniko 之类的项目获取替代方案；
使用 Docker-in-Docker 的设置；
运行 Windows 容器。Containerd 确实可以在 Windows 中工作，但是支持的层级没有 Docker 那么深。它的目标是在 containerd 1.20 版本中有一个发布一个支持 Windows 的稳定版本。

如果你使用的托管集群 在云厂商上，比如 AWS EKS，Google GKE 或者 Azure AKS，在 Docker 支持消失之前，检查你的集群是不是使用了受支持的运行时。一些云供应商的版本落后一些，因此你可能有更多的时间进行规划。因此，请跟你的供应商联系。举个例子，Google 云宣布他们正在为新创建的将所有的默认是 Docker 的运行时更改成 containerd，但是你仍然可以选择使用 Docker。

如果你运行自己的集群： 除了检查上述的要点之外，你将需要评估转移到 CRI 完全兼容的另一个容器运行时。Kubernetes 文档详细的解释了这些步骤：

另外，如果您想要在 1.23 以上的版本，继续使用 Docker。关注 cri-dockered 项目，它计划保留作为运行时的替代方案。

8. 结论

Kubernetes 正在不断的壮大，但是这种变化不一定是一种痛苦的经历。大多数用户不需要采取任何措施。对于那些人，仍然有时间进行测试和计划。

要继续学习 Docker 和 Kubernetes，请阅读以下内容：

下载我们免费的书籍：使用 Docker 和 Kubernetes 作为 CI/CD
https://semaphoreci.com/product/docker
https://semaphoreci.com/blog/guide-continuous-deployment-kubernetes
Docker Image Size – Does It Matter?