说实话, 之前并没有将计算机体系纳入我的写作范围的打算.
虽然我从事计算机行业多年, 对计算机行业也算有一些自己的见解, 且偶尔也会写写技术文档.
但我一直都觉得, 计算机思维与文学思维是属于两种思想的东西, 不可混为一谈.
不过, 后来想想, 有些体会还是拿笔写下来好一些, 不说是给别人带来些什么吧, 只是想记住偶尔灵光一闪的体会, 留到日后细细品味.
这里的话, 就说说我对运维这个职位的见解吧.
实际上, 一开始的时候, 我和很多人一样, 并没有运维这个概念.
什么是运维?
当别人问起来的时候, 我是一脸懵逼的.
后来, 偶尔有闲暇的时候, 我都会去思考这个问题 "运维是什么? 什么是运维? 怎么做好一个运维?", 于是, 慢慢地, 对于运维我有了一些自己的看法.
运维是什么?
在我看来, 它是一个贯穿整个计算机体系, 从最底层硬件到上层软件应用层都存在它影子的职业.
为什么这么说?
因为在我看来, 无论是底层的硬件维护, 机房运维, 还是往上软件层次的桌面运维, 系统管理员, 以及监控组, 运维工程师, 运维开发, 他们都属于运维.
所以, 再次回到那个问题, 运维是什么?
运维就是维护计算机体系, 保证计算机体系可以正常稳定且安全运行的一群人.
这时候很多人都会说, 那不就是修机吗?
没错, 是修机, 桌面运维修普通电脑, 系统管理员修 ERP, 机房运维修服务器.
但运维仅仅只是修机吗? 不, 不是的, 如果只是修机就可以称之为运维的话, 那它也不可能自立一个体系, 称之为一个职业了.
在我看来, 修机只是最低层的运维, 只是运维工作的一部分.
实际上, 一个合格的运维是需要做到走在错误发生之前的.
什么叫走在错误发生之前?
比如说, 在你的电脑即将崩溃之前, 这边已经通过软件检测到你 CPU 温度过高而提前给你加了散热硅胶.
"运维, 运维, 以预防为主!"
这是我一直坚信的理念, 运维是需要在错误可能出现之前, 就能估算到它出现的可能性, 并提供足够的预备方案, 保证哪怕出现了这个错误, 也不会影响计算机体系的正常运行.
所以, 我们再次回到那个运维的宗旨, 保证计算机体系正常稳定且安全地运行.
怎样才能保证计算机体系正常稳定且安全地运行?
难道仅仅是靠出了问题的时候去维修吗? 不, 那样可不是运维, 那是救火队员.
运维真正要做的是做合理的规划, 建立规范的体系, 提供足量的应急方案, 然后在此基础上对整个计算机体系进行合理的优化, 性能的改进, 安全性的提升.
反正不管是用什么手段, 通俗一点来讲, 就是尽你所能, 保证你要维护的电脑 (不管是普通电脑还是服务器), 一年 365 天都不出问题.
当然这里所说的不出问题, 指的不是电脑本身不出问题, 而是理论上的不出问题, 指的主要是出了问题, 也能有解决方案, 把损失降到最小.
就像为了防止 ERP 服务器出问题而影响分院业务, 所以我需要搭建双机热备和负载均衡机制, 而为了防止服务器性能过高, 导致服务器崩溃, 我需要搭 zabbix 做服务器监控并配置性能过高报警.
时间损耗产生的损失才是最大的损失, 而如何能预防问题的出现, 并提供预备方案在问题出现的时候能迅速解决, 这是身为一个运维人员最主要的工作.
以上, 就是我理解中的运维!
来源: http://www.jianshu.com/p/ff40f83df59f