[计算机]oracle巡检_v01.doc
《[计算机]oracle巡检_v01.doc》由会员分享,可在线阅读,更多相关《[计算机]oracle巡检_v01.doc(76页珍藏版)》请在三一文库上搜索。
1、OracleOracle 巡检巡检 (V 0.1.0) 20112011 年年 1010 月月 Oracle 巡检 - 1 - 修改记录 日期作者版本修改记录 分发记录 拷贝No.姓名单位 1 2 3 参考文档 No. 文档名称作者 1 2 3 Oracle 巡检 - 2 - 目录目录 1 1巡检概述巡检概述- 5 - 1.1巡检方法- 5 - 1.2巡检范围- 5 - 2 2巡检总结巡检总结- 8 - 2.1巡检评价- 8 - 2.2巡检建议- 9 - 3 3系统描述系统描述- 10 - 3.1硬件配置- 10 - 3.2操作系统数据库相关要求补丁- 11 - 3.2.1共享内存参数.- 1
2、1 - 3.2.2信号量.- 11 - 3.3数据库配置- 12 - 3.4基于 ORACLE 数据库的应用- 14 - 4 4数据库主机性能数据库主机性能- 15 - 4.1磁盘空间利用率- 15 - 4.2CPU 利用率.- 16 - 4.3内存利用率- 17 - 4.4网络性能- 18 - 5 5数据库配置数据库配置- 19 - 5.1数据库版本和单独补丁- 19 - 5.2数据库产品信息- 19 - 5.3数据库参数- 23 - 5.4数据库运行日志和跟踪文件- 23 - 5.5控制文件- 25 - Oracle 巡检 - 3 - 5.6REDO LOG文件.- 25 - 5.7归档
3、REDO LOG文件- 27 - 5.8数据文件- 27 - 5.9表空间- 28 - 5.9.1表空间使用率.- 28 - 5.9.2表空间存储参数.- 29 - 5.9.3段扩展.- 30 - 5.9.4系统表空间.- 31 - 5.9.5临时表空间.- 32 - 5.10回滚段管理- 33 - 5.11数据库对象- 33 - 5.11.1数据库中的失效对象.- 33 - 5.11.2用户表和索引使用同一表空间.- 35 - 5.12总结及建议- 36 - 6 6CLUSTERWARE 配置配置- 37 - 6.1CRS 版本和单独补丁- 37 - 6.2CLUSTERWARE配置.- 3
4、7 - 6.3CRS 日志文件- 39 - 6.4检查 OCR FILE 及 VOTING DISK- 39 - 6.5总结及建议- 40 - 7 7数据库安全数据库安全- 41 - 7.1DBA 用户.- 41 - 7.2SYSDBA 用户.- 41 - 8 8SQLNET 概况概况- 42 - 8.1监听器 LISTENER.- 42 - 8.2SQL*NET- 42 - 8.3TNSNAMES.- 42 - Oracle 巡检 - 4 - 9 9数据库性能数据库性能- 43 - 9.1数据库各项基于时间模型的统计信息- 43 - 9.2数据库负荷压力分析- 46 - 9.3各项命中率-
5、47 - 9.4内存信息统计- 49 - 9.5等待事件- 50 - 9.6统计信息分析- 52 - 9.6.1关于CPU数据库使用情况.- 52 - 9.6.2关于DBWR写脏数据- 52 - 9.6.3关于长短表扫描统计信息.- 53 - 9.6.4关于数据库事务提交/回滚性能指标- 53 - 9.6.5回滚段统计.- 53 - 9.7数据库 I/O 性能.- 54 - 9.8索引/行迁移/行链- 55 - 9.8.1索引.- 55 - 9.8.2行链.- 55 - 9.8.3行迁移.- 56 - 9.9ENQUEUE等待分析- 57 - 9.10LATCH分析- 59 - 9.11RES
6、OURCE LIMIT分析- 59 - 9.12TOP SQL 语句- 60 - 9.13CLUSTER INTERCONNECTION 性能 - 61 - 1010数据库备份策略数据库备份策略(待补充待补充).- 64 - 10.1备份- 64 - 10.2恢复- 64 - 附录附录: :初始化参数文件初始化参数文件- 65 - Oracle 巡检 - 5 - 1 1巡检概述巡检概述 1.11.1巡检方法巡检方法 数据库性能检查的工具是: ORACLE 工具 RDA( REMOTE DIAGNOSTIC AGENT) 进行系统信息收集。 dba_snapshot_database_10g.s
7、ql。 OSW(OS Watcher),操作系统工具和命令检查操作系统。 SQL 命令检查数据库配置,SQL 命令在 ORACLE 工具 SQL*PLUS 中运行。 ORACLE 工具 AWR 进行数据库性能资料的收集。 ORACLE 工具 EM 进行数据库运行情况的监控及分析。 操作系统及数据库后台日志分析。 上述输出结果为建议提供依据。 工具使用说明: 文档主要参考 oracle 官方文档以及 metalink 文档,因此部分连接访问时,需要有 oracle 官方网站帐号或 metalink 帐号。 1.RDA RDA 是 Remote Diagnostic Agent 的简称,是 Ora
8、cle 用来收集、分析数据库的工具, 运行该工具不会改变系统的任何参数,RDA 收集的相关数据非常全面,可以简化我们日常 监控、分析数据库的工作,Oracle Support 也建议我们在反馈相关问题时,提供 RDA 收 集的数据, 这样可以为快速解决问题提供一个有力的保证。 RDA 支持主流操作平台,如 Linux、Windows、AIX、HP-UX、Solaris 等。通过 RDA 工具,可以收集包括 Oracle RDBMS Server,Oracle RAC Cluster,Oracle WebLogic,Oracle Tuxedo 在内的软件的信息和日志,以前操作系统相关的版本,补丁
9、, 内核参数等信息。 Oracle 巡检 - 6 - 使用方法: 解压 RDA 工具: tar -xvf rda.tar 初始化 RADA 工具:/rda.sh -S 收集数据:./rda.sh 日志信息:./output/RDA.$machine_name.zip. 阅读方式:RDA_start.htm 详细说明参见:Remote Diagnostic Agent (RDA) 4 - Getting Started ID 314422.1 2.dba_snapshot_database_10g.sql 该脚本用来收集数据库详细信息,包括数据库、实例信息,存储信息,性能信息,对 象信息等多方面
10、内容,执行脚本需要有访问动态性能试图的权限,建议有 SYSDBA 权限的 用户执行。 使用方法: SQL conn sys/oracle as sysdba Oracle 巡检 - 7 - Connected. SQL dba_snapshot_database_10g.sql 文件生成在 sqlplus 执行目录下格式为 配置未处理近期 5优化数据库资源消耗高的 SQL 语句性能未处理长期 6 主机 /acct 目录,磁盘空间采用率 90%, 建议清理日志或扩容 配置未处理近期 Oracle 巡检 - 14 - 3 3系统描述系统描述 3.13.1硬件配置硬件配置 机器名dlsdb 用途 (
11、Prod, Test, Development)Test 所在城市,物理位置(机房,远程) 硬件供货商HP 型号ia64 hp superdome server SD32B 操作系统HP-UX 操作系统版本B.11.31 操作系统 Block Size8K 内存32701 MB CPU 个数8 剩余磁盘空间(in %)具体看下面 4.1 数据库文件是否裸设备是 ORACLE 实例数量1 可用性需求(e.g. M-F 8-5, 7x24, etc.)7x24 建议: 1. 通过操作系统命令,获取补丁安装信息: prtconf machinfo prtdiag dmidecode Oracle 巡
12、检 - 15 - 3.23.2操作系统数据库相关要求补丁操作系统数据库相关要求补丁 3.2.13.2.1 共享内存参数共享内存参数 以下列出有关内存使用的系统核心参数的设置情况。 kctune | grep shm Parameter NameValue max shared memory segment size (SHMMAX)53687091200 shared memory identifiers (SHMMNI)3072 max attached shm segments per process(SHMSEG)2048 3.2.23.2.2 信号量信号量 以下列出有关信号量系统核心参
13、数的设置情况,其中数据库服务器的系统信号量参数 如下。 kctune | grep sem Parameter NameValue semaphore identifiers (SEMMNI)8192 semaphores in system (SEMMNS)96767 undo structures in system (SEMMNU)28000 max semaphores per id (SEMMSL)10000 max undo entries per process (SEMUME)100 semaphore maximum value (SEMVMX)32767 adjust on
14、 exit max value (SEMAEM)16384 建议: 1. 通过官方认证文档,获取数据库安装所需的操作系统、补丁信息: a)Oracle Database on Unix AIX,HP-UX,Linux,Mac OS X,Solaris,Tru64 Unix Operating Systems Installation and Configuration Requirements Quick Reference (8.0.5 to 11.2) ID 169706.1 Oracle 巡检 - 16 - 2. 通过操作系统命令,获取补丁安装信息: lslpp -l | more sw
15、list | more pkginfo | more rpm -qa | more 3. 检查数据库 SGA 使用的共享内存是否分为多段,如果有多段共享内存,需要检查 SHMMAX 参数设置是否合理,通过 ipcs -ma | grep oracle 命令检查。 3.33.3数据库配置数据库配置 是否 RAC否 实例名 服务器名 用途(oltp,dss,batch)oltp RDBMS 版本10.2.0.4 Clusterware 版本- SQL*Net 版本10.2.0.4 所有数据文件所占磁盘空间1076.93 GB 使用到的磁盘数- SGA sizeShared pool size 15
16、968MB Database Buffers 4000MB Redo Buffers 14688256 PGA size2G DB_BLOCK Size8192 表空间个数61 数据文件个数164 Oracle 巡检 - 17 - 控制文件个数3 日志文件大小572MB 日志组数目3 每组日志文件成员数量2 归档方式No Archive Mode 并发用户量235 数据库访问方式(C/S,3 layer)3 layer 可用性需求 (e.g. M-F 8-5, 7x24, etc.) 7x24 分析: 1. 通过 AWR 报告或数据库脚本获取数据库参数: a)查询数据库名称相关试图: V$IN
17、STANCE V$DATABASE b)查询数据库版本相关试图: V$VERSION c)查询数据库是否是集群命令、试图: show parameter cluster_database; V$OPTION d)查询表空间、数据文件相关试图: DBA_DATA_FILES DBA_TEMP_FILES DBA_TABLESPACES e)查询内存结构相关试图、命令: V$SGA show sga; show pga_aggregate_target; f)查询控制文件相关试图: V$CONTROLFILE Oracle 巡检 - 18 - g)查询重做日志文件相关试图: V$LOG V$LOG
18、FILE h)查询系统归档模式命令、试图: archive log list; SELECT LOG_MODE FROM V$DATABASE; 3.43.4基于基于 Oracle 数据库的应用数据库的应用 应用名称帐务系统 应用类型(OLTP,DSS,batch)OLTP 开发工具Java, C+ 数据库访问方式(C/S,3 layer)3 layer 分析: 由应用厂商提供相关信息。 Oracle 巡检 - 19 - 4 4数据库主机性能数据库主机性能 4.14.1磁盘空间利用率磁盘空间利用率 bdf Filesystem kbytes used avail %used Mounted o
19、n /dev/vg00/lvol3 2097152 390720 1693160 19% / /dev/vg00/lvol1 2051553 428498 1417899 23% /stand /dev/vg00/lvol7 10485760 3954168 6484584 38% /var /dev/vg00/lvol6 8388608 3083728 5263440 37% /usr /dev/vg00/lv_nbu 5242880 3917691 1242399 76% /usr/openv /dev/vg00/lvol5 5242880 1517688 3697720 29% /tmp
20、 /dev/vg00/oralog_lv 8290304 1168731 6676518 15% /oraclelog /dev/vg00/ora_lv 10485760 9069111 1328897 87% /oracle /dev/vg00/lvol4 10485760 5721328 4727224 55% /opt /dev/vg00/lvol8 2097152 711200 1375168 34% /home /dev/vgjftest02/lv_acct 51380224 47493306 3644718 93% /acct 分析: 1. 数据库服务器中硬盘空间使用率不得大于 9
21、0%。如果有大于 90%,需要检查是因为数 据增加导致,还是由于日志或 core 文件导致。由于日志或 core 文件导致的空间使用率过 大,建议进行清理操作,如果由于数据增加导致,建议增加磁盘空间。 2. 通过操作系统命令,获取磁盘空间信息、挂载点信息: df bdf du mount Oracle 巡检 - 20 - 建议: 1. 主机 /acct 目录空间使用率超过 93%,建议清理日志或增加磁盘空间。 4.24.2CPU 利用率利用率 CPU 利用率通过统计单位时间(YYYY-MM-DD HH24:MI - YYYY-MM-DD HH24:MI)内 CPU 的使用情况获取。 sar /
22、 top / glance vmstat 2 20 分析: 最大 CPU 使用率:60%-70% 系统进程与用户进程占用 CPU 最大比率:40/60 执行队列值不大于 CPU 数 大量的换页操作、IO 等待都会造成 CPU 使用率过高 实例 xxxx procs memory faults cpu r b w avm free in sy cs us sy id 8 6 0 5360472 33575135 28526 431257 9498 8 2 91 8 6 0 5360472 33573794 41668 406150 14426 15 2 83 10 7 0 5241242 335
23、74885 40924 392735 14010 16 2 83 10 7 0 5241242 33570066 38353 347502 13112 14 2 84 12 5 0 5121249 33564344 37850 349364 13464 14 2 85 12 5 0 5121249 33568509 38183 341637 13416 14 2 84 9 6 0 4901960 33568953 36838 312697 12646 15 2 83 CPU 空闲率在 80%以上。 建议: Oracle 巡检 - 21 - 1. 当 CPU 的使用率超过 80%,要注意监控是否
24、有僵死进程,如果有僵死进程占用 CPU, 需要将僵死进程 kill 掉。如果有正常进程占用大量 CPU,需要查看是否属于正常业务进程, 是否需要优化相应 SQL 语句等。 2. 建议使用 OSW,EM 等类监控工具,对 CPU 的使用情况形成图表,便于监控和评估。 4.34.3内存利用率内存利用率 内存利用率通过统计单位时间(YYYY-MM-DD HH24:MI - YYYY-MM-DD HH24:MI)内内 存的使用情况获取。 top / glance vmstat 2 20 分析: 最大内存使用率:60%-70% 不存在大量的换页操作 实例 nmjftest Memory: 130875
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机 oracle 巡检 _v01
链接地址:https://www.31doc.com/p-1990666.html