运维前线:一线运维专家的运维方法、技巧与实践.html.pdf
《运维前线:一线运维专家的运维方法、技巧与实践.html.pdf》由会员分享,可在线阅读,更多相关《运维前线:一线运维专家的运维方法、技巧与实践.html.pdf(84页珍藏版)》请在三一文库上搜索。
1、推荐序 许式伟,七牛云CEO。曾就职于金山、百度、盛大,拥有超过15年的技术积累,连续8年组织ECUG实效云计算开发组年会。曾获国家科学技术进步奖二等奖。 2011年,与吕桂华一起创立七牛云,现已服务50多万家企业。 非常荣幸能受邀为本书作序。 2011年我从盛大离职,创办了七牛云。 在移动互联网时代,初创企业和巨头们之间的力量相差悬殊,这滋生了创业扶持产业的出现与兴起。所谓创业扶持产业,从技术革新上看就是“云”,云服务让所有的初创企业有了和巨头们一样的基 础设施。 很快,云服务的时代就在预期中到来了。很多人开始担心,自己的业务知识能否胜任“新运维”的需求。其实我想告诉大家,互联网中各类技术的
2、革新总是很快的,无论你做哪一类工作,当跟不上技 术发展的时候,就会面临被淘汰的危险。传统运维的革新是一个必然的过程,如果你对运维知识的了解一直停留在原地,那你离悬崖就不远了。 云服务下的运维相较于传统服务器的模式,优势已相当明显。企业无需花费巨额的资金来购买新的服务器和托管机房的机位,就能够低成本、低风险地实现新增业务。同时,运维人员不再只能利用传 统的网管手段来定位系统故障,他们可以通过云计算管理平台以及虚拟设备管理平台进行分析。 此外,云服务的蓬勃发展也令互联网产业发生了巨变,互联网产业整体的蛋糕做大了,这使得其对运维的总体需求呈现上升的趋势。这对运维人员是一个非常好的机会,只要知识与能力
3、满足了岗位需 求,你的待遇和发展就能上一个台阶。 作为云服务行业以及创业公司的代表,七牛云深谙创业的艰辛。我们反复说,七牛云的目标是打造一个场景化的PaaS(Platform-as-a-Service,平台即服务)平台,帮助开发者缩短从想法到产品的距 离。我们打造了很多子产品,包括大数据、通用计算、云计算等。从我们发布产品的服务类型来看,第一类是对象存储服务,第二类是融合CDN服务,第三类是数据处理服务,第四类是直播云以及实时流 网络LiveNet服务。 运维前线这本书集合14位资深运维专家的实践经验,覆盖了互联网和传统行业运维的各个领域。其中所述的运维方法、技巧与实践,都和七牛云息息相关,这
4、也正是我为本书作序的原因。 这里我举两个例子: 在本书第3章中讲到,动静分离的架构是基于Web开发的互联网服务中常见的架构的,它是指将数据库中的动态内容存储和文件存储分开,常见的做法是将动态内容存储在原有的数据库系统中,而将静 态文件,如图片和音视频等,托管存储在七牛云提供的对象存储服务中,这样可以更方便地维护不同类型的数据。 在本书第12章中讲到,CDN节点由于数量众多,承受的流量巨大,再加上国内网络的复杂度极高,因此真正商用CDN的建设有一定难度,并且硬件和运维成本都不低,因此一般而言,企业不会去自建 CDN,而是选择七牛云这样的企业来解决问题。 云服务的兴起改变了运维,而这种改变不会停止
5、。 云服务厂商可以将所有事情标准化,然后以服务的形式打包提供给客户。而运维人员将告别烦琐的工作内容,但是他们可能要承担更多的职责解决监控、评估、采购、报修等问题。 当然,你如果在云服务厂商做运维工作,便需要对传统运维有更深刻的理解了。 前言 为什么要写这本书 运维前线:一线运维专家的运维方法、技巧与实践(以下简称运维前线)是前线系列的一个子集,前线系列图书的出版理念是邀请多位业界专家,总结所在行业的最新理念或深度实践经验。 前线系列图书不同于市面上的很多图书,这类书并不系统,有的只是一线专家的实战经验,人们常称之为“干货”。一篇文章、一家公司、一个案例、一个场景,独立成篇,在满足碎片化阅读的同
6、时,也 能让读者进行横向比较和深入思考。本系列图书不强调大而全,追求的是每篇文章都是精品,希望能给读者带来深度的启发和收获。 按照这个理念,之前著名产品经理兰军(笔名Blues)策划的产品前线,出版之后大获成功,随之而来的运维前线令我感觉到压力巨大。运维前线的出版犹如十月怀胎,中间充满波折,好 几次我都以为要半途而废了,最后终于得以出版,在此要特别感谢机械工业出版社华章公司著名出版人杨福川,是他的坚持和鼓励让我总能在迷茫中看到希望。我和福川有共同的理念,希望把运维前 线做成精品,如果有哪点不符合要求,那么我们宁愿耗时长一些,多打磨打磨,很庆幸能与福川一起合作。 本书共有14位作者,包含了在腾讯
7、、YY语音、UC、京东、盛大游戏、金山西山居、猎豹移动、广发银行、优维科技等多家公司工作的实践经验,基本覆盖了互联网和传统行业运维的各个领域,估计 这是迄今为止第一本由这么多资深运维专家联合写成的图书,也是第一本分享了众多一线运维专家亲身实践的图书。本书的出版也充分体现了互联网开放合作的精神。 看到本书的目录时,我激动不已,即使书中的内容我已经看了好多遍,但是在回顾目录的时候,我依然感到这是一本非常有吸引力的书,是一本每名运维工程师都应该案头常备的书! 本书特色 当前IT领域的概念层出不穷,云计算、物联网、移动互联网、大数据、人工智能、VR,所有的这一切都基于IT系统,IT系统正在向规模更大、
8、更复杂、更高级的方向演进,一切IT资源都掌握在运维手 里,通过运维来操作。这个时代对运维的要求越来越高,运维如果稍有不慎,就会造成重大的损失,所以随着IT系统的发展,运维的重要性也越来越高。 根据量子力学理论,世界由基本粒子组成,因此世界是不连续的,这个理论在运维知识体系的建立上同样适用。仔细回想一下自己运维体系的建立,就是逐个攻克和掌握知识点,再进一步通过实践不 断加深的过程。运维前线也是这样,其中的每一篇文章都能够协助读者更快地掌握一个或多个知识点,相信通过运维前线系列的逐步出版,最终能够覆盖更多的运维知识点,为读者带来更多的实践经 验和理念。 作为运维前线系列的第一本书,本书覆盖了运维自
9、动化、系统运维、云及虚拟化、Web运维、游戏运维、DBA运维等6个方面14个知识点,都是各位作者总结自己多年实践经验的干货,每一篇文章都 很精彩,都值得读者仔细品味。 本书作者 本书第1章“自动化运维之深度解码”,来自订阅号“互联网运维杂谈”的作者、优维科技创始人王津银,人称“老王”。我在多个场合听过“老王”的分享,有40分钟的,也有长达3个小时的,令我 惊讶的是,“老王”每次总能带来新的东西。这篇“自动化运维之深度解码”也是如此,凝结了老王许多最新的见解,值得深读。 胥峰是我在盛大游戏的前同事,从胥峰身上我学到了不少知识,比如解决问题的思路和方法,有时候碰到运维难题,也许换一个角度就能迎刃而
10、解。 刘宇、尹会生、陈立军是我多年的同事。刘宇、会生已经出版了多本运维图书,他们都是非常资深的运维专家。刘宇无论演讲还是文章都逻辑清晰,丝丝入扣。会生和立军分享的都是我亲眼所见的、 在工作中碰到的难题及解决方法。 张观石是欢聚时代(YY)互娱事业部业务运维负责人,有多年的将PHP运用到日常运维中的经验。观石将PHP用到了极致,即使不懂PHP,也可以通过本书一窥观石在运维方面的丰富经验。 马亮有多年的游戏运维经验,目前在腾讯云专注做游戏云的架构设计,对游戏运维有深刻的理解。 本书的作者还有冉宏元(老男孩)、余洪春(抚琴煮酒)、吴传玉、彭华盛、蒋迪、赵旻、赵海军。虽然我与他们未曾谋面,但是彼此都是
11、熟悉的网友,他们的文章我都曾仔细拜读并多次请教过,其 中的运维思想让我深深折服,非常期待能有机会向他们当面请教。 读者对象 本书面向所有的运维工程师,无论是资深运维,还是刚入行的运维,相信都能从本书中获益。本书的读者对象包括如下几类: 系统运维工程师 安全工程师 数据库运维工程师 业务运维工程师 网络运维工程师 运维系统开发工程师及架构师 云计算/虚拟化运维工程师 其他对运维感兴趣的读者 勘误和支持 由于作者的水平有限,编写时间比较仓促,书中难免会出现一些错误或不准确的地方,恳请读者批评指正。如果您有更多宝贵的意见,欢迎关注我的订阅号“云技术实践”,然后在后台将您的宝贵意 见发送给我。本书的勘
12、误也会通过订阅号进行发布,关注订阅号请扫描下面的二维码: “运维前线”是一个系列,欢迎在平时工作中积累了实战经验的广大运维工程师继续参与“运维前线”的写作,带来更多的干货分享! 期待能够得到你们的真挚反馈,在运维之路上互勉共进。 致谢 从开始构思到运维前线的出版,本书的创作过程犹如十月怀胎,期间也获得了无数的支持与肯定。借此机会,向所有为此奉献力量的人表示深深的感谢。 感谢参与本书写作的14位行业专家,他们在百忙之中伏案写作,将自己的经验共享给广大读者。能够和你们合作,我深感荣幸,经过将近一年时间的沟通和交流,你们的专业和执着深深地打动了我, 同时也让我学到了不少东西。 感谢机械工业出版社华章
13、公司的首席策划杨福川,编辑高婧雅、孙海亮。在近一年的时间中,你们的敬业精神不断地鼓舞着我前进,你们的鼓励、帮助和坚持引导了本书的完成。 这里,我还要特别感谢七牛云。七牛云是我见过的最具技术气质的云服务企业,肩负“帮助开发者缩短从想法到产品的距离”的使命,立志打造以数据为核心的场景化PaaS服务。七牛云主张技术共享 并热衷于技术的传播,发起架构师实践日,推出各类创业扶持计划,这些都是七牛云正在做的事。 特别致谢 本书在成书过程中,得到了一批热心志愿者的协助,他们是陈家豪、曹学朋、邓荣兴、刘海文、李斯朗、韩海林,尤其刘海文做了大量的义务工作,在此特别感谢! 肖力 志愿者的话 能在力哥组织的这本书中
14、担任助理,我感到非常荣幸。本书出自一群经验老到并乐于分享的运维前辈之手,是一本案头必备的好书。 刘海文 第1章 自动化运维之深度解码 作者简介 王津银,2005年硕士毕业,参与电信BOSS系统研发两年。而后于2007年进入腾讯公司接触运维,经历服务器从百到万的运维历程,先后在YY和UC参与不同业务形态的运维,期间带过前端运维、数据 存储运维、YY语音、游戏运维、运维研发等多种运维团队,对运维有着全面的理解。极力倡导互联网价值的运维理念,即面向用户的价值是由自动化平台来交付和传递,同时由数据化来提炼和衡量的。 “精益运维”理论的创始人。个人微信公众号“互联网运维杂谈”(waynewang_ops
15、),粉丝2.5万人,现创办优维科技公司,旨在缩短企业到达互联网运维的路径。 自动化运维是一个人让人兴奋且容易失控的话题!兴奋是因为我想做一次尝试,把它的全貌和细节说清楚;容易失控是因为涉及点太多,一则怕遗漏,二则怕顾此失彼。带着这份复杂的心情,我们来 一次自动化运维的解析之旅吧。说实话,一个运维团队的运维能力究竟如何,其实看一个自动化管理系统便可得知! 1.1 概述 作为开篇,首先让我们来熟悉一下运维全平台的规划体系吧,如图1-1所示。 很多人看到这样一个架构图,可能会纳闷,难道对于一个小型企业来说,也要实施如此复杂的运维自动化体系吗?其实,对于不同规模的企业来说,对运维自动化的诉求的确是不同
16、的。对于大规模企 业,如BAT,这些能力基本上都是必不可少的;而对于小型互联网企业,比如说App开发公司,则核心的自动化诉求可能更多的是配置管理工具,比如说Puppet、SaltStack或Jenkins+Rsync等。 图1-1 运维全平台规划体系 我们不禁要问,有什么样的准则可以让我们作为依据来判断何时该如何导入自动化?应该导入自动化的哪些部分?当你需要持续、频繁地进行一些事情时,此时就需要引入自动化,比如说版本发布, 如果这个时候你感觉到很痛苦,那么此时就需要引入自动化了。关于应该导入自动化的哪些部分,我个人的经验是根据角色去梳理他的工作现状(持续、频繁的工作),然后引入自动化的能力,再
17、根据角 色人数的多与少来确定事情的优先级,比如说系统管理和业务发布,很明显业务发布的优先级更高,因为它的自动化所带来的人力解放的收益更大。当然还有一种更理想的情况,那就是根据整体业务交付 流来构建,以它的全流程自动化为目标,此时引入的是该交付链上所有的自动化能力,当然对于很多企业来说,这种自动化实现的代价很高,而得到的收益却很小。 1.2 运维自动化的三重境界 宋代禅宗大师青原行思(六祖门下首座)提出参禅的三重境界: 参禅之初,看山是山,看水是水; 禅有悟时,看山不是山,看水不是水; 禅中彻悟,看山仍然山,看水仍然是水。 这三重境界其实和我们眼中运维自动化的三重境界是类似的。 运维自动化第一重
18、境界:看山是山,看水是水。开始接触运维自动化的时候,我们看到了很多工具认为它们就代表着自动化,比如说早期将Expect+SSH封装在一起之后,就认为可以实现批量运维 了。看到有人说Puppet可以做配置管理,这个时候就会认为Puppet可以做配置管理,甚至是发布管理。这个时期的典型问题就是以偏概全,对于某个开源自动化工具来说,还没法去界定它的使用场景和 范围,这样将直接影响系统的建设效益。这个时候才开始知道我们看到的山不是真正的山,而是迷雾环绕的深山。 运维自动化第二重境界:看山不是山,看水不是水。此时我们已经知道只有Expect+SSH还不够,随着业务规模的变化,我们还需要一个更完整的概念来
19、做发布系统,真正的发布系统要做版本管理、 环境管理、配置管理,还有生命周期管理等;配置管理工具想让自动化变得更加完美,其实还要依赖于OS和应用层的标准化规范,比如说应用交付规范、应用打包规范、OS的统一等等。对于其他资源对 象的管理来说,生命周期的概念均穿行其中,比如说DNS、LVS、接口、配置、应用包等。为了有效地标识资源的生命周期状态,需要用大量的数据来实时反馈。这是运维自动化更具体的层面,将一个个 的山貌都看清楚了。 运维自动化第三重境界:看山还是山,看水还是水。这是一种自动化本质上的追究,站在高山之巅,俯览众山,会发出原来如此的感叹:所有自动化的本质都是为了可视化,让所有的人看到一致的
20、服 务,从而确保结果一致;从底层来说,你可以认为所有自动化的本质都是指令+文件分发的组合;你会进一步抽象系统的运维自动化能力,提供即插即用的机制;结合服务化的需求,进一步云化所有的运 维系统,确保内外使用的一致性,最终自动化的平台就是一个整合的持续交付平台。这是化境! 1.3 运维自动化的困境和价值 1.3.1 运维自动化的困境 谈到运维自动化的困境,我觉得要带着两大行业特点去看待这个问题,一个是互联网行业、另外一个就是传统行业。这两个行业面临的运维自动化的困境完全不同,普遍的共性是运维研发资源能力的 不足。 对于互联网行业,业务的发展速度很快,底层运维自动化能力可通过IaaS公有云来解决。在
21、OS之上的运维自动化,则是通过一些开源工具来解决的,比如说Puppet、SaltStack、Ansible等。大部分都 是以开源工具为主,开源产品的引入,也在不断加大维护的难度和复杂度,带来的另外一个问题就是平台可扩展的能力非常弱。所以一般成规模的互联网企业,最后都走向了自研的道路。不过有利于互联 网行业运维平台建设的条件是互联网的基础比较标准,在硬件和软件的差异上不像传统企业那么大。 对于传统行业,业务的互联网是瞬间展开的,另外传统的封闭式系统架构也走向了开放式x86架构,导致运维维护的基础设施对象和上层的业务对象提升了一个数量级。而传统企业的运维手段之前都依 赖于商业产品和人肉运维等方式。
22、 无论是成规模的互联网企业还是传统企业,在业务的倒逼之下,运维的突破力都是不断向前的,但是这个整体的规划蓝图是什么样的、实施路径如何、需要什么样的方法论,则需要有一个全面的解 答。 1.4 运维自动化的多维解读 1.4.1 基于应用变更场景的维度划分 我们曾经探讨过,所有运维的价值导向最终都是面向业务、面向用户,所以自然而然就需要从业务的维度进行划分。而运维是有很多种场景的,但从业务的角度来说,核心的业务场景一般就包括如下5 种:业务上线、业务下线、业务扩容、业务缩容和应用升级。下面将以其中一种场景为例,将整个流程穿起来看看,以此识别流程的节点到底对接了哪些系统?针对其他的业务场景,我们也可以
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 前线 一线 专家 方法 技巧 实践 html
链接地址:https://www.31doc.com/p-5518993.html