节点和节点池

在 Rancher 中启动 Kubernetes 集群后,您可以在集群的节点页面中管理各个节点。根据创建集群的方式的不同,有不同的节点选项可用。

如果要管理的是集群而不是单个节点,请参阅设置集群

每种类型集群的节点选项

下表列出了 Rancher 中每个类型的集群可用的节点选项,”✓“表示该类型的集群可以使用这种节点选项,空白表示不支持这种节点选项。单击 选项 列中的链接以获得关于每个功能模块的更详细信息。

选项由基础设施提供商托管的节点自定义的节点托管的集群导入的节点描述
暂停将节点标记为不可调度。
驱散将节点标记为不可调度的, 将所有 pod 驱散出去。
编辑输入节点的自定义名称、描述、标签或污点。
查看 API查看 API 数据。
删除从集群中删除有缺陷的节点。
下载 Keys下载 SSH 密钥以便 SSH 到节点。
节点缩放增加或减少节点池中的节点数。

基础设施提供商托管的节点

如果您的集群是 RKE 集群,并且其中的节点是由 Rancher 通过节点驱动在基础设施提供商中创建的,那么节点池在这个集群中可用。

编辑节点池可以对节点池进行扩容或者缩容。

如果启用了节点自动替换功能,则节点池还可以自动维护在初始集群配置期间设置的节点规模。scale 值定义了 Rancher 要为集群维护的活动节点数量。

Rancher 使用节点模板来替换节点池中的节点。每个节点模板都需要配置基础设施提供商的相关凭据,从而允许 Rancher 在基础设施中配置节点。

托管的 Kubernetes 集群的节点

在 Rancher 中,管理由 Kubernetes 供应商托管的集群中的节点时,将会受到一些限制。例如,您不能在 Rancher UI 里单击”+“或”-“调整节点的数目,而需要直接编辑集群。

导入的 Kubernetes 集群的节点

虽然您可以使用 Rancher 将工作负载部署到导入的集群,但无法直接管理这类集群的节点。导入集群节点的所有管理必须在 Rancher 之外进行。

管理和编辑单个节点

您可以使用编辑节点功能完成以下操作:

  • 更改名称
  • 更改描述
  • 添加/删除标签
  • 添加/删除污点

要管理单个节点,请浏览至要管理的集群,然后从主菜单中选择节点。您可以通过单击节点的省略号图标来打开其选项菜单。

查看节点 API

选择此选项以查看节点的API endpoints

删除节点

可以单击删除在基础设施提供商托管的节点池中删除有缺陷的节点。当启用了节点自动替换功能时,一个有缺陷的节点被删除后,Rancher 会自动添加一个具有相同配置的好的节点。

提示: 如果您的集群由基础设施提供商托管,并且您希望降低集群规模,而不是删除有缺陷的节点,那么降低规模而不是删除。

缩放节点

对于由基础设施提供商托管的节点,您可以使用 scale 插件,增加或减少每个节点池中的节点数量,此选项不适用于其他集群类型。

SSH 到由基础设施提供商托管的节点

对于由基础设施提供商托管的节点,您可以选择下载它的 SSH 密钥,然后使用密钥远程访问该节点。

  1. 在由基础设施提供商托管的集群中,从主菜单中选择 节点

  2. 找到要远程进入的节点。选择 省略号 (...)> 下载 Keys.

    步骤结果:下载了一个 ZIP 文件,内含节点的 SSH 密钥

  3. 解压 ZIP 文件。

  4. 打开终端,切换到解压缩的 ZIP 文件目录。

  5. 输入以下命令,把<IP_OF_HOST>替换为节点的 IP 地址:

    ssh -i id_rsa root@<IP_OF_HOST>

节点池节点注意事项

如果您使用了这个节点池选项,那么 Rancher 会自动维护创建的集群在初始集群配置期间设置的节点规模。这个 scale 值决定了 Rancher 为集群维护的活动节点的数量。

暂停节点

暂停一个节点则将其标记为不可调度。此功能对于在小型维护窗口(如重启、升级或销毁)期间在节点上执行短任务非常有用。完成后,重启节点并取消对节点的暂停,可以恢复调度。

驱散节点

驱散 的过程是首先暂停节点,然后驱散节点上所有的 Pod。该功能对于执行节点维护(如内核升级或硬件维护)非常有用。它可以防止新的 Pod 部署到节点,同时重新分配现有的 Pod ,这样用户就不会遇到服务中断。

  • 对于具有副本集的 Pod,当前的 Pod 会被一个新的 Pod 替换并被调度到一个新节点。另外,如果当前的 Pod 关联于某个 Servcie,那么访问这个 Service 的客户端将自动重定向到新的 Pod。

  • 对于没有副本集的 Pod,您需要调出一个新的 Pod 副本,并假设它不是服务的一部分,将客户端重定向到它。

您可以驱散处于 已暂停(cordoned) 或者 活跃(active) 状态的节点。当您驱散一个节点时,节点被暂停,评估节点必须满足的条件来驱散,然后(如果它满足条件)节点驱散在其之上所有的 Pod。

当然,您可以在初始化驱散时覆盖驱散条件,您还可以设置一个优雅停止时长和超时值等。

激进的和安全的驱散选项

不同的 Rancher 版本会有不同的节点驱散选项。

Rancher v2.2.x+

两种驱散模式:主动的和安全的。

  • 主动模式

    在这种模式下,Pod 不会被重新调度到一个新节点,即使它们没有控制器。Kubernetes 希望您有自己的逻辑来处理删除这些 Pod。

    Kubernetes 还希望实现能够决定如何使用 emptyDir 处理 Pod。如果 Pod 使用 emptyDir 存储本地数据,您可能无法安全地删除它,因为一旦从节点删除了 Pod,emptyDir 中的数据将被删除。选择主动模式将删除这些 Pod。

  • 安全模式

    如果一个节点有独立的 Pod 或临时数据,它将被暂停,但不会被驱散。

Rancher v2.2.x 之前的版本

下面的列表描述了每个驱散选项:

  • 如果存在不受 ReplicationController、ReplicaSet、Job、DaemonSet 或 StatefulSet 管理的 Pod

    这些类型的 Pod 不会被重新调度到一个新节点,因为它们没有控制器。Kubernetes 希望您有自己的逻辑来处理删除这些 Pod。Kubernetes 强迫您选择这个选项(它将会删除/驱散这些 Pod)或者驱散不会继续。

  • 如果有 Daemonset 管理的 Pod

    与上面类似,如果您有任何 Daemonset,则仅在选中此选项时才会进行驱散。即使打开了这个选项,Pod 也不会被删除,因为它们会立即被替换。在启动时,Rancher 当前在系统中有几个默认运行的守护进程集,因此该选项在默认情况下是打开的。

  • 如果有使用 emptyDir 的 Pod

    如果 Pod 使用 emptyDir 存储本地数据,您可能无法安全地删除它,因为一旦从节点删除了 Pod, emptyDir 中的数据将被删除。与第一个选项类似,Kubernetes 希望实现能够决定如何处理这些 Pod。选择此项将删除这些 Pod。

优雅停止时长

给予每个 Pod 清理的时间,这样它们就有机会优雅地停止服务。例如,当 Pod 可能需要完成任何未完成的请求时,回滚事务或将状态保存到某个外部存储中。否则,将使用每个 Pod 中指定的默认值。

超时

在放弃驱散节点操作之前应该继续等待的时间。

Kubernetes 已知问题: 在 Kubernetes 1.12 之前的版本中驱散节点时,不能强制执行超时设置

驱散和暂停状态

如果有任何与用户输入相关的错误,节点将进入 已暂停(cordoned) 状态,因为驱散失败。您可以更正输入并尝试再次驱散该节点,也可以通过解除该节点的暂停来中止。

如果驱散继续且没有错误,节点进入 驱散中(draining) 的状态。当节点处于这种状态时,您可以选择停止驱散,这将停止驱散过程并将节点的状态更改为 已暂停

一旦驱散成功完成,节点将处于已驱散(drained)状态。然后可以关闭或删除节点。

想知道更多关于暂停和驱散的信息吗? 请查阅Kubernetes 文档

标记需要被 Rancher 忽略的节点

自 2.3.3 起可用

一些解决方案,例如 F5 的 BIG-IP 集成,可能需要创建一个永远不会注册到集群的节点。

由于该节点永远不会完成注册,因此在 Rancher UI 中始终将其显示为不正常。

在这种情况下,您可能希望通知 Rancher 忽略该节点,以便 Rancher 仅在真实的节点发生故障时将其显示为不正常。

您可以使用 Rancher UI 或使用kubectl来标记要忽略的节点。

注意: Rancher 存在一个未解决的问题,在 Rancher UI 上查看被标记为忽略的节点时,节点会一直保持Updataing状态。

使用 Rancher UI 标记要被忽略的节点

  1. 全局视图中,单击设置选项卡。
  2. 转到 ignore-node-name 设置,然后单击 省略号> 编辑
  3. 输入 Rancher 需要忽略节点的名称。具有该名称的所有节点将被忽略。
  4. 单击保存

结果: Rancher 不会等待使用该名称注册的节点。在用户界面中,节点将显示为灰色。该节点仍然是集群的一部分,可以用 kubectl 列出。

即便以后更改了 ignore-node-name ,这个已被忽略的节点将继续被忽略。

使用 kubectl 标记要被忽略的节点

添加需要被 Rancher 忽略的节点,请使用 kubectl 创建具有以下标签的节点:

cattle.rancher.io/node-status: ignore

结果: 如果将节点添加到集群,Rancher 将不会尝试与此节点同步。该节点仍然是集群的一部分,并且可以用 kubectl 列出。

如果在将节点添加到集群之前添加了这个标签,则该节点将不会显示在 Rancher UI 中。

如果在将节点添加到 Rancher 集群后添加标签,UI 会继续显示该节点。

如果您使用 Rancher UI 或 Rancher API 从 Rancher Server 中删除节点时,如果节点名称与 Rancher 的设置的 ignore-node-name匹配,则 Rancher 不会从集群中删除该节点。

最后由 yzeng25更新 于