“踩内存”引发的,内存问题分析总结
背景
日常开发中,后端服务为了追求性能,常常会采用C/C++进行开发,享受C/C++带来性能提升的同时,开发者需要自己实现内存管理,只要程序实现上有缺陷,就会导致服务不可用,最近就遇到一次“踩内存”导致的服务不可用。
问题现象
同事A的新版本发布上线后,就收到告警消息,模块产生[……]
日常开发中,后端服务为了追求性能,常常会采用C/C++进行开发,享受C/C++带来性能提升的同时,开发者需要自己实现内存管理,只要程序实现上有缺陷,就会导致服务不可用,最近就遇到一次“踩内存”导致的服务不可用。
同事A的新版本发布上线后,就收到告警消息,模块产生[……]
最近在开发中,有个模块在测试时偶尔会出现卡死现象,进程状态处于futex状态。网络搜索发现这种状态下,进程大概率发生了死锁。最近的代码修改不涉及到锁的使用,可能是其它方面引入的问题。
在日常开发中,死锁并不陌生。只要能有堆栈就很容易解决。使用stace 命[……]
最近有个relay模块在线上进行紧急发布,一共600台机器半天之内发布完成。晚上6点开始手机就开始持续震动,realy模块信令都出现异常,用户进房间失败率突增。监控曲线上跑出了一个凹字形。赶紧回退realy模块恢复业务,同时开始紧急定位问题原因。
后台服务采用特定框架进行开发,在回退的过程[……]