程序员学堂
微信扫描二维码,访问我们的微信店铺

高性能计算的问题解决之道:Linux态势感知方法、实用工具及实践技巧

58.44
运费: ¥6.00
库存: 1000 件
商品图
商品缩略图

商品详情

作者简介
伊戈尔·卢布希斯,曾任Intel工程计算部门的操作系统架构师,为优选高性能Linux计算环境提供解决方案;还曾任Rackspace云计算中心的首席工程师;现在是一名自由作家和商业顾问。他在高性能计算领域深耕十余年,专注于数据中心和物联网技术等,拥有15项美国专利,编著了7本开源技术方面的书籍。此外,他还是一名奇幻小说书作家。
目录
译者序
前  言
致  谢
引言  数据中心与高端计算1
数据中心一览1
现代数据中心布局1
欢迎来到BORG,抵抗是徒劳的2
那就是力量2
企业与Linux2
经典的办公室2
Linux计算环境3
Linux云3
10000个1不等于100003
问题的非线性扩展3
大数定律4
同质化4
企业的当务之急4
7天24小时全天候开放5
任务危急5
停机时间等于金钱5
千里之堤溃于蚁穴5
参考文献5
*章  你有问题吗6
问题的识别6
如果森林里有一棵树倒下,没人能听到6
一步一步地识别7
总是优先使用简单工具7
过多的知识导致误区9
问题的定义9
当前发生或可能的问题10
停机规模和严重性与业务需求11
已知与未知13
问题的再现13
你能隔离问题吗13
偶发性问题需要特殊处理14
计划如何控制混乱14
放手是*难的事15
因与果16
不要流连于症状16
先有鸡还是先有蛋16
严格控制环境改变,直到你理解了问题的本质18
如果改变,确保你知道预期结果是什么18
结论19
参考文献19
第2章  开始研究20
隔离问题20
推动从生产到测试20
重新运行获得结果所需的*小集21
忽略偏见信息,避免假设21
与健康系统和已知参考的比较22
那不是程序错误,而是一个特性22
将预期结果与正常系统作比较23
性能和行为的参考是*需的24
对变化的线性与非线性响应24
一次一个变量25
线性复杂度的问题25
非线性问题25
响应可能会延迟或掩盖25
Y到X而不是X到Y26
组件搜索26
结论26
第3章  基础研究27
刻画系统状态27
环境监控27
机器可访问性、响应性和正常
运行时间27
本地和远程登录以及管理控制台29
喊狼来了的监控29
读取系统信息和日志30
使用ps和top30
系统日志36
进程记账39
检查命令执行的模式40
与问题表现相关41
避免快速的结论41
统计作为辅助41
vmstat41
iostat43
系统活动报告(SAR)47
结论49
参考文献50
第4章  深入探讨系统51
使用/proc51
层次52
每个进程的变量52
内核数据56
进程空间60
检查内核可调参数63
sys子系统63
内存管理64
文件系统管理65
网络管理65
SunRPC66
内核67
sysctl69
结论70
参考文献70
第5章  变身极客——跟踪和调试应用72
使用strace和ltrace72
strace72
ltrace86
结合两种工具获得*结果87
其他工具90
使用perf93
介绍93
为什么不用OProfile94
前提94
基本使用94
基础实例99
高级实例103
小结107
使用gdb107
介绍107
前提108
简单实例108
不那么简单的实例113
其他有用的命令122
结论124
参考文献124
第6章  极客进级——应用和内核核心、内核调试器126
收集应用核心126
如何转储应用核心127
收集内核核心(Kdump)132
Kdump服务概览133
Kdump配置137
测试配置143
Kdump网络转储功能145
Kdump使用146
小结147
崩溃分析(crash)147
前提147
运行crash148
内核崩溃核心分析156
超级极客技能:C代码分析167
小例子168
中级例子172
困难的例子176
内核崩溃的bug报告182
崩溃分析结果184
内核bug与硬件错误185
小结186
内核调试器186
内核编译186
进入调试器187
基本命令187
小结189
结论189
参考文献189
第7章  问题的解决方案191
如何处理收集到的数据191
文档191
数据的杂乱193
*实践195
搜索引擎、邮件列表以及供应商支持202
找到根本原因203
消除问题204
实现和跟踪206
结论207
参考文献208
第8章  监控和预防209
监控什么数据209
过多的数据比没有数据更糟209
Y到X将定义你所需要的监控210
不要害怕改变210
如何监控和分析趋势211
设置你关心的监控211
监控不等于报告212
不监控随机指标212
定义数学趋势213
如何应对趋势215
当它来得太晚216
内务管理217
预防是解决问题的关键217
配置审核218
为什么审核有用218
控制环境的变化219
安全方面219
系统数据收集工具219
定制工具220
商业支持220
结论221
参考文献221
第9章  让你的环境更安全、更健壮222
版本控制222
为什么需要版本控制222
Subversion、Git及相关软件223
简单回滚223
配置管理223
变懒:自动化224
大环境下的熵225
掌控混乱225
配置管理软件225
环境中引入变化的正确方法226
一次一个变化226
不要急着冲到截止时间227
理解影响228
没报告问题意味着什么都没有228
连锁反应228
结论229
参考文献229
*0章  微调系统性能230
日志大小与日志轮转230
系统日志会一直增长230
慢点,倒带232
确定消息的内容232
文件系统调优234
Ext3/4文件系统234
XFS文件系统235
sysfs文件系统236
层次236
……
结论


程序员学堂
扫描二维码,访问我们的微信店铺

高性能计算的问题解决之道:Linux态势感知方法、实用工具及实践技巧

手机启动微信
扫一扫购买

收藏到微信 or 发给朋友

1. 打开微信,扫一扫左侧二维码

2. 点击右上角图标

点击右上角分享图标

3. 发送给朋友、分享到朋友圈、收藏

发送给朋友、分享到朋友圈、收藏

微信支付

扫一扫购买

支付宝

扫一扫购买

打开微信,扫一扫

或搜索微信号:

收藏到微信 or 发给朋友

1. 打开微信,扫一扫左侧二维码

2. 点击右上角图标

点击右上角分享图标

3. 发送给朋友、分享到朋友圈、收藏

发送给朋友、分享到朋友圈、收藏