Linux 操作系统是一个开源产品, 也是一个开源软件的实践和应用平台, 在这个平台下有无数的开源软件支撑, 我们常见的 apache,tomcat,MySQL,PHP 等等, 开源软件的最大理念是自由, 开放, 那么 Linux 作为一个开源平台, 最终要实现的是通过这些开源软件的支持, 以最低廉的成本, 达到应用最优的性能. 因此, 谈到性能问题, 主要实现的是 Linux 操作系统和应用程序的最佳结合.
一, 性能问题综述
系统的性能是指操作系统完成任务的有效性, 稳定性和响应速度. Linux 系统管理员可能经常会遇到系统不稳定, 响应速度慢等问题, 例如在 Linux 上搭建了一个 web 服务, 经常出现网页无法打开, 打开速度慢等现象, 而遇到这些问题, 就有人会抱怨 Linux 系统不好, 其实这些都是表面现象. 操作系统完成一个任务时, 与系统自身设置, 网络拓朴结构, 路由设备, 路由策略, 接入设备, 物理线路等多个方面都密切相关, 任何一个环节出现问题, 都会影响整个系统的性能. 因此当 Linux 应用出现问题时, 应当从应用程序, 操作系统, 服务器硬件, 网络环境等方面综合排查, 定位问题出现在哪个部分, 然后集中解决.
在应用程序, 操作系统, 服务器硬件, 网络环境等方面, 影响性能最大的是应用程序和操作系统两个方面, 因为这两个方面出现的问题不易察觉, 隐蔽性很强. 而硬件, 网络方面只要出现问题, 一般都能马上定位. 下面主要讲解操作系统方面的性能调优思路, 应用程序方面需要具体问题具体对待.
以下从影响 Linux 性能的因素, 分析性能涉及的人员, 系统性能优化工具, 系统性能评价标准四个方面介绍优化 Linux 的一般思路和方法.
二, 影响 Linux 性能的因素
2.1 系统硬件资源
1.CPU
CPU 是操作系统稳定运行的根本, CPU 的速度与性能在很大程度上决定了系统整体的性能, 因此, CPU 数量越多, 主频越高, 服务器性能也就相对越好. 但事实并非完全如此.
目前大部分 CPU 在同一时间内只能运行一个线程, 超线程的处理器可以在同一时间运行多个线程, 因此, 可以利用处理器的超线程特性提高系统性能. 在 Linux 系统下, 只有运行 SMP 内核才能支持超线程, 但是, 安装的 CPU 数量越多, 从超线程获得的性能方面的提高就越少. 另外, Linux 内核会把多核的处理器当作多个单独的 CPU 来识别, 例如两个 4 核的 CPU, 在 Lnux 系统下会被当作 8 个单核 CPU. 但是从性能角度来讲, 两个 4 核的 CPU 和 8 个单核的 CPU 并不完全等价, 根据权威部门得出的测试结论, 前者的整体性能要比后者低 25%~30%.
可能出现 CPU 瓶颈的应用有 db 服务器, 动态 Web 服务器等, 对于这类应用, 要把 CPU 的配置和性能放在主要位置.
2.内存
内存的大小也是影响 Linux 性能的一个重要的因素, 内存太小, 系统进程将被阻塞, 应用也将变得缓慢, 甚至失去响应; 内存太大, 导致资源浪费. Linux 系统采用了物理内存和虚拟内存两种方式, 虚拟内存虽然可以缓解物理内存的不足, 但是占用过多的虚拟内存, 应用程序的性能将明显下降, 要保证应用程序的高性能运行, 物理内存一定要足够大; 但是过大的物理内存, 会造成内存资源浪费, 例如, 在一个 32 位处理器的 Linux 操作系统上, 超过 8GB 的物理内存都将被浪费. 因此, 要使用更大的内存, 建议安装 64 位的操作系统, 同时开启 Linux 的大内存内核支持.
由于处理器寻址范围的限制, 在 32 位 Linux 操作系统上, 应用程序单个进程最大只能使用 4GB 的内存, 这样以来, 即使系统有更大的内存, 应用程序也无法 "享" 用, 解决的办法就是使用 64 位处理器, 安装 64 位操作系统. 在 64 位操作系统下, 可以满足所有应用程序对内存的使用需求 , 几乎没有限制.
可能出现内存性能瓶颈的应用有 NOSQL 服务器, 数据库服务器, 缓存服务器等, 对于这类应用要把内存大小放在主要位置.
3.磁盘 I/O 性能
磁盘的 I/O 性能直接影响应用程序的性能, 在一个有频繁读写的应用中, 如果磁盘 I/O 性能得不到满足, 就会导致应用停滞. 好在现今的磁盘都采用了很多方法来提高 I/O 性能, 比如常见的磁盘 RAID 技术.
通过 RAID 技术组成的磁盘组, 就相当于一个大硬盘, 用户可以对它进行分区格式化, 建立文件系统等操作, 跟单个物理硬盘一模一样, 唯一不同的是 RAID 磁盘组的 I/O 性能比单个硬盘要高很多, 同时在数据的安全性也有很大提升.
根据磁盘组合方式的不同, RAID 可以分为 RAID0,RAID1,RAID2,RAID3,RAID4,RAID5,RAID6,RAID7,RAID0+1,RAID10 等级别, 常用的 RAID 级别有 RAID0,RAID1,RAID5,RAID0+1, 这里进行简单介绍.
? RAID 0: 通过把多块硬盘粘合成一个容量更大的硬盘组, 提高了磁盘的性能和吞吐量. 这种方式成本低, 要求至少两个磁盘, 但是没有容错和数据修复功能, 因而只能用在对数据安全性要求不高的环境中.
? RAID 1: 也就是磁盘镜像, 通过把一个磁盘的数据镜像到另一个磁盘上, 最大限度地保证磁盘数据的可靠性和可修复性, 具有很高的数据冗余能力, 但磁盘利用率只有 50%, 因而, 成本最高, 多用在保存重要数据的场合.
? RAID5: 采用了磁盘分段加奇偶校验技术, 从而提高了系统可靠性, RAID5 读出效率很高, 写入效率一般, 至少需要 3 块盘. 允许一块磁盘故障, 而不影响数据的可用性.
? RAID0+1: 把 RAID0 和 RAID1 技术结合起来就成了 RAID0+1, 至少需要 4 个硬盘. 此种方式的数据除分布在多个盘上外, 每个盘都有其镜像盘, 提供全冗余能力, 同时允许一个磁盘故障, 而不影响数据可用性, 并具有快速读 / 写能力.
通过了解各个 RAID 级别的性能, 可以根据应用的不同特性, 选择适合自身的 RAID 级别, 从而保证应用程序在磁盘方面达到最优性能.
4.网络宽带
Linux 下的各种应用, 一般都是基于网络的, 因此网络带宽也是影响性能的一个重要因素, 低速的, 不稳定的网络将导致网络应用程序的访问阻塞, 而稳定, 高速的网络带宽, 可以保证应用程序在网络上畅通无阻地运行. 幸运的是, 现在的网络一般都是千兆带宽或光纤网络, 带宽问题对应用程序性能造成的影响也在逐步降低.
2.2 操作系统相关资源
基于操作系统的性能优化也是多方面的, 可以从系统安装, 系统内核参数, 网络参数, 文件系统等几个方面进行衡量, 下面依次进行简单介绍.
1.系统安装优化
系统优化可以从安装操作系统开始, 当安装 Linux 系统时, 磁盘的划分, SWAP 内存的分配都直接影响以后系统的运行性能, 例如, 磁盘分配可以遵循应用的需求: 对于对写操作频繁而对数据安全性要求不高的应用, 可以把磁盘做成 RAID 0; 而对于对数据安全性较高, 对读写没有特别要求的应用, 可以把磁盘做成 RAID 1; 对于对读操作要求较高, 而对写操作无特殊要求, 并要保证数据安全性的应用, 可以选择 RAID 5; 对于对读写要求都很高, 并且对数据安全性要求也很高的应用, 可以选择 RAID10/01. 这样通过不同的应用需求设置不同的 RAID 级别, 在磁盘底层对系统进行优化操作.
随着内存价格的降低和内存容量的日益增大, 对虚拟内存 SWAP 的设定, 现在已经没有了所谓虚拟内存是物理内存两倍的要求, 但是 SWAP 的设定还是不能忽略, 根据经验, 如果内存较小(物理内存小于 4GB), 一般设置 SWAP 交换分区大小为内存的 2 倍; 如果物理内存大于 8GB 小于 16GB, 可以设置 SWAP 大小等于或略小于物理内存即可; 如果内存大小在 16GB 以上, 原则上可以设置 SWAP 为 0, 但并不建议这么做, 因为设置一定大小的 SWAP 还是有一定作用的.
2.内核参数优化
系统安装完成后, 优化工作并没有结束, 接下来还可以对系统内核参数进行优化, 不过内核参数的优化要和系统中部署的应用结合起来整体考虑. 例如, 如果系统部署的是 Oracle 数据库应用, 那么就需要对系统共享内存段 (kernel.shmmax,kernel.shmmni,kernel.shmall), 系统信号量(kernel.sem), 文件句柄(fs.file-max) 等参数进行优化设置; 如果部署的是 Web 应用, 那么就需要根据 Web 应用特性进行网络参数的优化, 例如修改 net.ipv4.ip_local_port_range.NET.ipv4.tcp_tw_reuse.NET.core.somaxconn 等网络内核参数.
3.文件系统优化
文件系统的优化也是系统资源优化的一个重点, 在 Linux 下可选的文件系统有 ext2,ext3,ReiserFS,ext4,xfs, 根据不同的应用, 选择不同的文件系统.
Linux 标准文件系统是从 VFS 开始的, 然后是 ext, 接着就是 ext2, 应该说, ext2 是 Linux 上标准的文件系统, ext3 是在 ext2 基础上增加日志形成的, 从 VFS 到 ext4, 其设计思想没有太大变化, 都是早期 UNIX 家族基于超级块和 inode 的设计理念.
XFS 文件系统是一个高级日志文件系统, XFS 通过分布处理磁盘请求, 定位数据, 保持 Cache 的一致性来提供对文件系统数据的低延迟, 高带宽的访问, 因此, XFS 极具伸缩性, 非常健壮, 具有优秀的日志记录功能, 可扩展性强, 快速写入性能等优点.
目前服务器端 ext4 和 xfs 是主流文件系统, 如何选择合适的文件系统, 需要根据文件系统的特点加上业务的需求综合来定.
2.3 , 应用程序软件资源
应用程序的优化其实是整个优化工程的核心, 如果一个应用程序存在 BUG, 那么即使所有其他方面都达到了最优状态, 整个应用系统还是性能低下, 所以, 对应用程序的优化是性能优化过程的重中之重, 这就对程序架构设计人员和程序开发人员提出了更高的要求.
三, 分析系统性能涉及的人员
3.1,Linux 运维人员
在做性能优化过程中, Linux 运维人员承担着很重要的任务, 首先, Linux 运维人员要了解和掌握操作系统的当前运行状态, 例如系统负载, 内存状态, 进程状态, CPU 负荷等信息, 这些信息是检测和判断系统性能的基础和依据; 其次, Linux 运维人员还有掌握系统的硬件信息, 例如磁盘 I/O,CPU 型号, 内存大小, 网卡带宽等参数信息, 然后根据这些信息综合评估系统资源的使用情况; 第三, 作为一名 Linux 运维人员, 还要掌握应用程序对系统资源的使用情况, 更深入的一点就是要了解应用程序的运行效率, 例如是否有程序 BUG, 内存溢出等问题, 通过对系统资源的监控, 就能发现应用程序是否存在异常, 如果确实是应用程序存在问题, 需要把问题立刻反映给程序开发人员, 进而改进或升级程序.
性能优化本身就是一个复杂和繁琐的过程, Linux 运维人员只有了解了系统硬件信息, 网络信息, 操作系统配置信息和应用程序信息才能有针对性地的展开对服务器性能优化, 这就要求 Linux 运维人员有充足的理论知识, 丰富的实战经验以及缜密分析问题的头脑.
3.2, 系统架构设计人员
系统性能优化涉及的第二类人员就是应用程序的架构设计人员. 如果 Linux 运维人员在经过综合判断后, 发现影响性能的是应用程序的执行效率, 那么程序架构设计人员就要及时介入, 深入了解程序运行状态. 首先, 系统架构设计人员要跟踪了解程序的执行效率, 如果执行效率存在问题, 要找出哪里出现了问题; 其次, 如果真的是架构设计出现了问题, 那么就要马上优化或改进系统架构, 设计更好的应用系统架构.
3.3, 软件开发人员
系统性能优化最后一个环节涉及的是程序开发人员, 在 Linux 运维人员或架构设计人员找到程序或结构瓶颈后, 程序开发人员要马上介入进行相应的程序修改. 修改程序要以程序的执行效率为基准, 改进程序的逻辑, 有针对性地进行代码优化. 例如, Linux 运维人员在系统中发现有条 SQL 语句耗费大量的系统资源, 抓取这条执行的 SQL 语句, 发现此 SQL 语句的执行效率太差, 是开发人员编写的代码执行效率低造成的, 这就需要把这个信息反馈给开发人员, 开发人员在收到这个问题后, 可以有针对性的进行 SQL 优化, 进而实现程序代码的优化.
从上面这个过程可以看出, 系统性能优化一般遵循的流程是: 首先 Linux 运维人员查看系统的整体状况, 主要从系统硬件, 网络设备, 操作系统配置, 应用程序架构和程序代码五个方面进行综合判断, 如果发现是系统硬件, 网络设备或者操作系统配置问题, Linux 运维人员可以根据情况自主解决; 如果发现是程序结构问题, 就需要提交给程序架构设计人员; 如果发现是程序代码执行问题, 就交给开发人员进行代码优化. 这样就完成了一个系统性能优化的过程.
四, 调优总结
系统性能优化是个涉及面广, 繁琐, 长久的工作, 寻找出现性能问题的根源往往是最难的部分, 一旦找到出现问题的原因, 性能问题也就迎刃而解. 因此, 解决问题的思路变得非常重要.
例如, Linux 系统下的一个网站系统, 用户反映, 网站访问速度很慢, 有时无法访问.
针对这个问题, 第一步要做的是检测网络, 可以通过 ping 命令检查网站的域名解析是否正常, 同时, ping 服务器地址的延时是否过大等等, 通过这种方式, 首先排除网络可能出现的问题; 如果网络没有问题, 接着进入第二步, 对 Linux 系统的内存使用状况进行检查, 因为网站响应速度慢, 一般跟内存关联比较大, 通过 free,vmstat 等命令判断内存资源是否紧缺, 如果内存资源不存在问题, 进入第三步, 检查系统 CPU 的负载状况, 可以通过 sar,vmstat,top 等命令的输出综合判断 CPU 是否存在过载问题, 如果 CPU 没有问题, 继续进入第四步, 检查系统的磁盘 I/O 是否存在瓶颈, 可以通过 iostat,vmstat 等命令检查磁盘的读写性能, 如果磁盘读写也没有问题, Linux 系统自身的性能问题基本排除, 最后要做的是检查程序本身是否存在问题. 通过这样的思路, 层层检测, 步步排查, 性能问题就 "无处藏身", 查找出现性能问题的环节也就变得非常简单.
如何深入学习调优技能
说了这么多, 那么问题来了, 怎么深入学习性能调优呢, 我将多年来企业一线调优经验进行了总结和提炼, 写成了专栏《Linux 性能调优攻略》点击前往 https://blog.51cto.com/cloumn/detail/60 ,15 篇文章打通性能调优任通二脉, 让经验和案例说话:
专栏《Linux 性能调优攻略》点击前往 https://blog.51cto.com/cloumn/detail/60
来源: http://www.bubuko.com/infodetail-3066729.html