纵横小说的上云之路

纵横小说业务从传统IDC迁移到云上的过程,历经数月,我们技术中心也是经历了一场全面的业务优化和改变的过程。整个上云的过程是复杂且繁琐的,是在所有运维、后端、测试、产品等同学的一点点一轮轮的调研、讨论、测试中一步步完成的,其中的细枝末节都要经过数次的沟通测试,最终才成功完成上云的迁移。…

OpenResty + Lua 实现灰度发布

七猫作为一家成熟的互联网公司,业务有超百万QPS的高并发。我们的产品开发逃不开的特色就是不停的升级升级再升级。随着敏捷小组的建立,发版频率也逐渐提升至每两周一次或者每周一次。然而系统升级总是会伴随着各种风险,一些系统风险比如:宕机风险,服务不可用的风险;还有一些用户体验风险:业务改动使得用户体验改变导致用户流失等风险。为了规避或者提前预知这些风险,灰度发布的概念应运而生。…

浅谈ClickHouse故障处理

ClickHouse 是一款比较新型的列式分析型数据库。相比较传统的关系型数据库,ClickHouse能解决大数据量数据的查询场景。本文主要站在ClickHouse运维的角度上,结合业务实际运行中的具体场景,参考ClickHouse经典案例,总结故障实践经验,用于参考学习和对问题的分析。…

MySQL 主备延迟优化案例

本文根据MySQL主备延迟问题解决、分析的过程,描述数据库主备延迟可能的原因和实际的处理方法。业务差异造就了数据库的场景不同、配置不同、参数不同,但是技术上都有共通的原理,希望各位同学能从本文中得到借鉴。附件中总结了主备同步的基础知识,以供参考。…

K8S节点负载异常排查

k8s是目前主流的部署模式,这项技术让应用封装变得简单了许多。优点有故障迁移、资源调度、资源隔离、安全等。古人云“工欲善其事,必先利其器”,用的好同样也需要维护的好,否则一旦出现故障就会悔之晚矣。所以平时的监控和巡检工作要时刻保持警惕,多观察多思考会有意想不到的收获。…

redis调优:服务器numa架构和网卡中断处理的分配

随着业务发展,请求量越来越大,web可以水平扩。单线程的redis缓存一般最先成为业务的性能瓶颈,32核心的物理服务器不进行优化会有资源抢占和cpu资源分配不合理的问题。将导致大量的慢查询、甚至web到redis连接数耗尽,形成阻塞影响整个系统。…