标签目录:运维管理

以下是与标签 “运维管理” 相关联的文章

一次生产事故的优化经历

在一次正常的活动促销之后,客服开始陆续反馈有用户反应在抢标的时候打不开网页或者APP,在打开的时候标的就已经被抢光了,刚开始没有特别的上心,觉得抢标不就是这样吗,抢小米手机的时候也不就这样吗?随着活动继续推进,有更多的用户强烈抗议,用户领了加息卷或者抵现卷之后抢不上标的,认为是平台作假故意不让使用以达到节省资源。 分析过程 其实以前也会有……

nginx的502问题

1.配置错误 因为nginx找不到php-fpm了或者socket文件权限不对,所以报错,一般是fastcgi_pass后面的路径配置不当,后面可以是socket或者是ip:port,从php5.4版本之后如果使用socket方式,默认权限给的比较低,所以需要把监听权限改为777,对应配置为 listen.mode=0777 2.资源耗尽……

TCP的三次握手与四次分手

TCP的位置 TCP工作在网络OSI的七层模型中的第四层——Transport层,IP在第三层——Network层,ARP在第二层——Data Link层; 在第二层上的数据,我们把它叫Frame,在第三层上的数据叫Packet,第四层的数据叫Segment。 数据从应用层发下来,会在每一层都会加上头部信息,进行封装,然后再发送到数据接收……

老板,来碗鸡汤。

看这个标题貌似觉得我们不思进取,其实这么说只是想表明我们的一种态度,事情千万不要等你认为所有条件都完美了才去做,因为所有都完美的状态基本是不可能会出现的,特别是在互联网行业,因为试错成本普遍很低,你只要保证你这次更新比上一次更好基本就要去更新了。特斯拉汽车当年刚出来的时候肯定比很多现有的汽车差非常多,五年后的现在,它的车不一定比其他车好非……

深度好文-饿了么进化史(你一定会有收获)

大家都知道这两年饿了么的发展迅速,作为一名运维人员如果你工作在饿了么,你可曾这样分析过?之前分享过一篇关于饿了么的文章。 大家好,首先,先简单介绍下自己,我是徐巍,目前在饿了么负责基础设施的运维及开发工作,早些年就职于PPTV、携程、游族等公司,也算是一个运维的老兵了。饿了么成立于2008年,2014年底开始迎来业务的大规模爆发性增长,2……

如何保证2站点或多站点在负载均衡下站点内容保持一致呢?

现实环境中,随着业务量的不断增加,web 服务器也有之前的一台变成了多台,但是问题是,在负载均衡下,不可能再次搭建一个站点,这样当用户访问的时候其站点内容绝对不是一致的,如何操作呢? 实验机器: IP 地址 功能 192.168.230.150 WEB 1 (线上在使用中) 192.168.230.151 WEB 2 (新机器) 192…….

Linux安装配置蒲公英VPN 私网环境轻松实现异地SSH远程管理

由于不少中小型公司的宽带网络是没有固定IP的私网环境,同时还由于预算有限,因此通过传统方式很难建立VPN(Virtual Private Network),对于运维人员而言异地SSH远程管理、维护就成了相当头疼的问题。不过面对此类问题,使用蒲公英异地组网后,就可以轻松实现异地SSH远程管理,而且支持纯软件组网,即使在没有预算的情况下同样可……

浅谈web网站架构演变过程

前言 我们以javaweb为例,来搭建一个简单的电商系统,看看这个系统可以如何一步步演变。 该系统具备的功能: 用户模块:用户注册和管理 商品模块:商品展示和管理 交易模块:创建交易和管理 阶段一、单机构建网站 网站的初期,我们经常会在单机上跑我们所有的程序和软件。此时我们使用一个容器,如tomcat、jetty、jboos,然后直接使用……

饿了么的架构设计及演进之路(转)

一个产业的模型,快速地将它产生出来。“快”是第一位的,不需要花太多精力在架构设计上。在网站进入扩张期才需要对架构投入更多的精力来承载网站在爆发时的流量。饿了么成立已经8年,现在日订单量突破900万,我们也有了较为完善的网站架构。 一、网站基础架构 初期,我们使用了能够更容易拓展SOA的框架。我们用SOA的框架解决两件事情: 1.分工协作 ……

HP服务器Linux下hpacucli常用命令

HP服务器官方管理工具hpacucli,通过该工具可以查看HP服务器的Raid状态是否正常(如果Raid卡出问题,会影响数据的读写速度),服务器硬盘是否正常(如果硬盘坏掉,严重的情况会丢失数据),服务器电源是否有故障等信息。 HP服务器官方管理工具hpasmcli,通过该工具可以很详细查看服务器CPU,内存,处理器,电源等的温度信息。 软……

负载均衡、集群、高可用解决方案

企业需求: 搭建一个高可用负载均衡集群架构出来,并运行三个站点,具体需求如下。 —————————————————————————————— 基础: 1 设计你认为合理的架构,用visio把架构图画出来 7 所有服务器要……

tomcat+nginx反向代理(实现一个服务器,一个ip共用80端口)

在搞定之前一直认为,认为nginx站点(discuz,dedecms)和tomcat站点(zrlog)不可以共存的,绞尽脑汁也咩有想到一个共存的例子,唯一的突破点全部放在了,访问的时候添加“8080”, 幸运的是成功了,也可以使用8080去访问,但是作为一个用户你觉得我会在访问百度的时候再次输入www.baidu.com:8080, 这样……

使用mysql-proxy配置mysql读写分离

简介 对于很多大型网站(pv值百万、千万)来说,在所处理的业务中,其中有70%的业务是查询(select)相关的业务操作(新闻网站,插入一条新闻。查询操作),剩下的则是写(insert、update、delete,只要能对MySQL的数据造成更改的操作都叫写操作)操作。在使用负载均衡集群之后,可以很大程度的提升网站的整体性能,但是最终的数……

Linux 系统添加操作记录审计

有时候我们需要对线上用户操作记录进行历史记录待出现问题追究责任人,但Linux系统自带的history命令用户有自行删除权限,那怎么设置可以让用户的操作记录实时记录,并保证普通用户无权删除呢? 一般小型架构添加这个足够了,如果中大型的架构建议使用 jumpserver 创建记录目录 mkdir -p /usr/local/domob/re……

告警监控系统开发

一、需求分析 需求: 使用shell定制各种个性化告警工具,但需要统一化管理、规范化管理。 思路: 指定一个脚本包,包含主程序、子程序、配置文件、邮件引擎、输出日志等。 主程序: 作为整个脚本的入口,是整个系统的命脉。 配置文件: 是一个控制中心,用它来开关各个子程序,指定各个相关联的日志文件。 子程序: 这个才是真正的监控脚本,用来监控……

每天必用的几个小命令

常见工作中,计算机系统的资源主要包括CPU,内存,硬盘以及网络,过度使用这些资源将使系统陷入困境。事实上,当上述服务器系统资源中的任何一个遭遇瓶颈,都会带来服务器性能的下降,典型的症状就是系统运行迟缓。 内存负载: free -m 以MB为单位显示整个系统的内存使用情况; free -h 则自动选择以适合理解的容量单位显示: top -c……

md5sum命令的使用

md5sum命令可以同时对一批文件进行256位的MD5编码,并可以通过比较前后二次编码值来检测一个文件是否给修改过。由于此命令执行效率较高,所以常可用于大批文件的编译过程中,比如执行第一次编译时,产生每个文件的MD5编码,当第二次或以后编译时,通过MD5编码来确定一个文件是否有修改,而只对有变化的文件进行编译,这样可以大大节省编译的时间。……

cpu频繁有序的忽高忽低

今天有空给大家分享一个我刚刚遇到的小问题,标题就是今天的问题。上图: CPU 忽高忽低的发现了吧,对于我这个纠结者,必须得弄清楚是怎么回事。 先看看进程 top -c    (一切都是显得那么正常) vmstat 2 1000   也没有查出任何不对的地方,且平均负载很小。 最后使用sar -u 2 1000   终于查到了 每到每分钟的……