内存解决k8s集群环境内存不足导致容器被kill问题-FinClip官网

内存解决k8s集群环境内存不足导致容器被kill问题

网友投稿 2190 2022-11-30

内存解决k8s集群环境内存不足导致容器被kill问题

最近线上环境上出现了一个问题， k8s集群环境Pod中的tomcat容器运行一段时间后直接被killd，但有时一切看起来正常，不能准确判断在什么时机出现被Killd问题。

本文就此问题介绍了Linux内存不足原因以及为什么特定进程会被杀死。并提供了Kubernetes集群环境故障排除指南教程。

tomcat进程被杀死原因分析

当这个应用程序被kill问题进行故障排除时，很大程度上确定是操作系统杀死的，因为整个过程确认没有进行kill操作。当我查看tomcat日志时发现，tomcat只是简单的提示了killd，至于原因，日志中没有给出详尽的提示。紧接着我查看了syslog日志grep -i kill /var/log/messages*， syslog给出比较详细的提示，大概意思是该应用占用内存超过cgroup限制，直接被Kill。如下所示:

Oct 1 20:37:21 k8swork kernel: Memory cgroup out of memory: Kill process 13547 (java) score 1273 or sacrifice child

如果当服务已经挂掉，使用free查看内存占用，对我们排除问题不会有太大帮助，因为这个时候服务占用内存已经随着服务的挂掉而释放。如下所示:

[root@k8swork log]# free -lm total used free shared buffers cachedMem: 498 93 405 0 15 32Low: 498 93 405High: 0 0 0-/+ buffers/cache: 44 453Swap: 1023 0 1023

但是Linux vmstat可以使用以下命令将的输出重定向到文件。我们甚至可以调整持续时间和次数以监控更长的时间。当命令运行时，我们可以随时查看输出文件以查看结果。我们每120秒查看内存1000次。该&行末尾的允许我们将其作为一个进程运行并重新获得终端。

vmstat -SM 120 1000 > memoryuse.out &

通过如上信息可以判定罪魁祸首是这个Java进程占用内存超过资源限制，直接被系统杀死。为什么会出现这个问题呢?

首先第一点，已经在编排文件中限制资源最大使用量为4G，理论上Pod中容器是不可能占用这么多资源，默认情况下Java占用物理资源的1/4左右，但是既然出现了这个问题，说明Java进程占用资源超过了这个限制。

于是在网上找到了如下信息，大概意思是说，jdk从131版本之后开始通过选项支持对容器对内存和CPU 的限制，如下图所示:

于是开始查找之后的版本，最后找到191版本，可以看到Java对容器做出了支持。

明显是低于这个版本的，确定了问题所在。

“Java虚拟机感知不到Pod中资源限制，所以直接占用了宿主机1/4左右内存(宿主机是32G内存)， cgroup检测到Pod占用内存超过限制(Pod限制为4G)，进行了Kill操作。”

解决方式也很简单，直接在tomcat服务中配置最大最小内存占用，在Java层面限制其内存占用。但是具体Java进程为什么占用这么高的内存就需要业务开发人员排查解决了。

总结

通过本文可以看出基于Java虚拟机构建项目，在容器化过程中要尽量适配高版本或者对docker容器有亲和性的Jdk版本，如果没有，一定要在虚拟机层面限制Java服务占用内存大小。另外一定要在服务上添加存活探针，如果没有添加存活探针，类似于tomcat这种容器类服务，即使内部服务挂了了， Kubernetes不会自动帮你拉起的，原因很简单，它无法感知到你的服务是否存活。所以服务一定要添加Http存活探针(基于TCP层面的探针只是检测端口是否存活，大多数情况下，服务会出现假死问题，但端口依然可以正常访问)。

react 前端框架如何驱动企业数字化转型与创新发展

2190 2022-11-30

内存解决k8s集群环境内存不足导致容器被kill问题

小程序容器助力企业在金融与物联网领域实现高效合规运营，带来的新机遇与挑战如何管理？

react 前端框架如何驱动企业数字化转型与创新发展

轻量级前端框架助力开发者提升项目效率与性能

最近发表

更多内容

小程序SDK

Finclip技术文档

小程序开发

小程序容器

小程序框架

Finclip小程序平台

Finclip用户投稿

车联网

推荐文章

小程序SDK是什么意思？小程序sdk和插件有什么区别？

小程序支付功能怎么实现？

企业app开发流程是什么？

app运营模式有哪些？

小程序多端引流怎么做？

小程序生态分析的机会和威胁

Flutter入门这一篇效率文章就够了

原生与跨平台解决方案分析,跨平台软件开发技术方案

热更新技术：让软件更新变得更加轻松快速

解决方案

银行解决方案

证券解决方案

互联网解决方案

政企OA解决方案

科技解决方案

loT解决方案

信任解决方案

热评文章

AppCan:基于混合模式的移动应用开发,移动混合模

Hybrid App混合模式开发的了解

小程序容器技术助力券商数字营销突围，小程序容器化的意

用mpvue开发微信小程序基础知识（vue.js开发

小程序多端框架全面测评对比，强烈推荐！

券商app架构 - 解析券商应用程序的构建与设计

内存 解决k8s集群环境内存不足导致容器被kill问题

最近发表

更多内容

推荐文章

解决方案

热评文章

内存解决k8s集群环境内存不足导致容器被kill问题