- A+
领500g书库,关注公众号:程叫兽的宝藏 (长按可复制!)
热门下载区==>点此链接进入<<<
本文节选自《卓有成效的工程师》
况,也不知道人们是如何使用它的.……我们的团队一直在走下
坡路,因为我们看不到发生了什么。”\"用户开始习惯于看到“失
败钴允\"的图片〈一群红色小乌衔着网强拉起一头巨大的馈
鱼) ,因为Twitter网站经浓超载。直到Twitter的工程师们开始监
控和检测系统之后,他们才能够发现问题并构建更可靠的服
务,如今每月有超过2.4亿人在使用Twitter。
当看不到软件的运行情况时,我们所能做的就只能是胡乱
骨测哪里出了问题。这就是2013年HealthCare. 和
败的主要原因。该网站是美国《平价医疗法案》回〈又名“奥巴
马医改计划”) 的核心部分,政府承包商花费近2.92亿美元建了
一个饱受技术问题困扰的网站。才据估计,在第1周注册的370
万用户中,只有1%的人真正注册成功,其余人在注册时遇到错
误消息、超时或登录问题,甚至无法加载网站。25没有什么能
文过饰非,”奥巴马承认,“网站太慢了,人们在申请过程中束
被卡住了,我认为绝对没有人比我更肖丧。””2更糟糕的是,正
如一位记者所报道的那样,外包的软件工程师们试图修复这个
网站, “了吏像我们对竺笔记本电脑的故障一 ON
使用其他一些办法,指望频猪碰到死耗子,摘定这个烂推子。,
2由于没有监控体系,他们只能盲目改行,凭感觉猜测解决方
案。
一个由硅谷资深人士组成的团队最终飞抵华盛顿,帮助修
复这个网站。他们做的第一件事吏是为系统的关键部分设置监
控,并构建一个监控仪表盘,可以显示有多少人在使用该网
站、网站的啊应时间以及流量的去癌。对现状有了一定的了解后,他们就能够添加缓存,将页面加载时间从8秒减少到2秘;
通过修复bug,将错误率从怀人的6%降低到0.5%; 并扩展站点
以使其能够文持超过83,000个用户同时在线。”在应急小组抵
达并增加监控体系的6周以后,该网站终于能正常工作。由于他
们的努力,目前超过800万美国人能够注册私人医疗保险。和
Twitter和奥巴马医改的故事说明,在诊断网站问题时,监
控系统是至关重要的。假设用户登录错误的数量激增,那么是
引入了新的错误,还是后端验证遇到了网络故障? 或者,是恶
意用户在以编程方式猜测密码? 还有别的原因吗? 为了有效地
回答这些问题,我们需要知道问题何时开始出现、最新代码的
部署时间、身份验证服务的网络流量、在不同时间窗口内每个
账户的身份验证最多可沦试几次,以及可能有关的更多信息。
如果没有这些指标数据,我们只能猜测原因,最终可能会在没
有问题的地方白白浪费精力。
假设我们的网络应用程序突然无法在生产环境中加载,是
Reddit的流量激增使服务器过载了吗,还是Memcached绥存层或
MySQL数据库层耗凡了空间或开始抛出错误信息? 是不是团队
不小心部署了有问题的模块?在寻找可能的故障原因时,带有
流量来源的数据表、数据存储性能图和应用程序错误分布图的
仪表盘可以帮助我们缩小寻找的范围。
与此类似,要有效地优化一个核心指标,需要系统地度量
一系列其他文持性指标。为了提升整体注册率,就需要根据用
户的来源〈是否来自Facebook、Twitter、搜索、直接导航、电
子邮件营销活动等) 、登录页面和其他很多维度来度量注册
| 工程师成果业绩 | 卓有成效的工程师 epub |
| 卓有成效的工程师 epub | 工程师的贡献 |
| 卓有成效的工程师 epub | 卓有成效的工程师pdf |
综上:《【工程师成果业绩】况也不知道人们是如何》值得推荐阅读

