HelloDBA [English]
搜索Internet 搜索 HelloDBABA
  Oracle技术站。email: fuyuncat@gmail.com  MSN: fuyuncat@hotmail.com   acoug  acoug 

Oracle10g数据库自动诊断监视工具(ADDM)使用指南(1)

[English]

作者: fuyuncat

来源: www.HelloDBA.com

日期: 2006-03-07 14:50:13

分享到  新浪微博 腾讯微博 人人网 i贴吧 开心网 豆瓣 淘宝 推特 Facebook GMail Blogger Orkut Google Bookmarks

第一章 ADDM简介

     

Oracle9i及之前,DBA已经拥有了很多很好用的性能分析工具,比如,tkprofsql_tracestatspackset event 10046&10053等等。这些工具能够帮助DBA很快的定位性能问题。但这些工具都只给出一些统计数据,然后再由DBA们根据自己的经验进行优化。

那能不能由机器自动统计数据的基础上给出优化建议呢?Oracle10g中就推出了新的优化诊断工具:数据库自动诊断监视工具(Automatic Database Diagnostic Monitor ADDM)和SQL优化建议工具(SQL Tuning Advisor STA)。这两个工具的结合使用,能使DBA节省大量优化时间,也大大减少了系统宕机的危险。简单点说,ADDM就是收集相关的统计数据到自动工作量知识库(Automatic Workload Repository AWR)中,而STA则根据这些数据,给出优化建议。例如,一个系统资源紧张,出现了明显的性能问题,由以往的办法,做个一个statspack快照,等30分钟,再做一次。查看报告,发现 db file scattered read事件在top 5 events里面。根据经验,这个事件一般可能是因为缺少索引、统计分析信息不够新、热表都放在一个数据文件上导致IO争用等原因引起的。根据这些经验,我们需要逐个来定位排除,比如查看语句的查询计划、查看user_tableslast_analysed子段,检查热块等等步骤来最后定位出原因,并给出优化建议。但是,有了STA以后,它就可以根据ADDM采集到的数据直接给出优化建议,甚至给出优化后的语句(抢了DBA的饭碗喽)。

ADDM能发现定位的问包括:

·         操作系统内存页入页出问题
·         由于Oracle负载和非Oracle负载导致的CPU瓶颈问题
·         导致不同资源负载的Top SQL语句和对象——CPU消耗、IO带宽占用、潜在IO问题、RAC内部通讯繁忙 
·         按照PLSQLJAVA执行时间排的Top SQL语句. 
·         过多地连接 (login/logoff). 
·         过多硬解析问题——由于shared pool过小、书写问题、绑定大小不适应、解析失败原因引起的。 
·         过多软解析问题
·         索引查询过多导致资源争用. 
·         由于用户锁导致的过多的等待时间 (通过包dbms_lock加的锁)
·         由于DML锁导致的过多等待时间(例如锁住表了) 
·         由于管道输出导致的过多等待时间(如通过包dbms_pipe.put进行管道输出) 
·         由于并发更新同一个记录导致的过多等待时间(行级锁等待) 
·         由于ITL不够导致的过多等待时间(大量的事务操作同一个数据块)
·         系统中过多的commitrollback(logfile sync事件).
·         由于磁盘带宽太小和其他潜在问题(如由于logfile太小导致过多的checkpointMTTR设置问题,过多的undo操作等等)导致的IO性能问题I 
·         对于DBWR进程写数据块,磁盘IO吞吐量不足 
·         由于归档进程无法跟上redo日至产生的速度,导致系统变慢 
·         redo数据文件太小导致的问题
·         由于扩展磁盘分配导致的争用
·         由于移动一个对象的高水位导致的争用问题 
·         内存太小问题——SGA Target, PGA, Buffer Cache, Shared Pool 
·         在一个实例或者一个机群环境中存在频繁读写争用的热块 
·         在一个实例或者一个机群环境中存在频繁读写争用的热对象 
·         RAC环境中内部通讯问题 

 
·         LMS进程无法跟上导致锁请求阻塞 
·         RAC环境中由于阻塞和争用导致的实例倾斜 
·         RMAN导致的IOCPU问题
·         StreamsAQ问题
·         资源管理等待事件
 

有一点要记住:AWR集的数据时放到内存中(share pool),通过一个新的后台进程MMON定期写到磁盘中。所以10gshare pool要求比以前版本更大,一般推荐比以前大15-20%。另外,还要求系统参数STATISTICS_LEVEL设置为TYPICAL(推荐)或ALL;

ALTER SESSION SET STATISTICS_LEVEL= TYPICAL;
     

第二章 工作采集、诊断过程

Oracle10g提供了一图形化的界面(通过OEM),使这个工具使用起来非常简单。下面这里介绍一下如何通过sqlplus使用这个工具。这个工具的使用非常简单,它是不需要安装的。

第一步:创建测试用的表

SQL> CREATE TABLE bigtab AS SELECT rownum as "id", a.* FROM dba_objects a;
 
Table created.




SQL> create table smalltab as select rownum as "id", a.* FROM dba_tables a;
Table created.




SQL> ALTER TABLE bigtab MODIFY (empno NUMBER);
 
Table altered.





SQL> DECLARE 2       n NUMBER; 3    BEGIN 4       FOR n IN 1..100 5       LOOP 6           INSERT INTO bigtab SELECT rownum as "id", a.* FROM dba_objects a; 7           COMMIT; 8       END LOOP; 9   END;
/
 
PL/SQL procedure successfully completed.




第二步:采集一次工作量快照

SQL> begin
  2   dbms_workload_repository.create_snapshot('TYPICAL');
  3  end;
  4  /
 
PL/SQL procedure successfully completed.
 

第三步:进行一些高负荷操作

DECLARE



    v_var number;



BEGIN



    FOR n IN 1..6



    LOOP



        select count(*) into v_var from bigtab b, smalltab a;



    END LOOP;



END;



 /




PL/SQL procedure successfully completed.
 

第四步:再次采集一次工作量快照

要注意的是:两次快照之间的间时间必须足够(一般推荐30分钟左右),否则得到的ADDM报告中就会提示:THERE WAS NOT ENOUGH DATABASE TIME FOR ADDM ANALYSIS.

SQL> begin
  2   dbms_workload_repository.create_snapshot('TYPICAL');
  3  end;
  4  /
 
PL/SQL procedure successfully completed.
 

第五步:创建一个优化诊断任务并执行

先获取到两次快照ID:

SQL> select snap_id from
  2  (SELECT * FROM dba_hist_snapshot
  3  ORDER BY snap_id desc)
  4  where rownum <=2;
 
 SNAP_ID
--------
      66
      65
 

然后创优化任务,并执行。

 
DECLARE



    task_name VARCHAR2(30) := 'DEMO_ADDM01';



    task_desc VARCHAR2(30) := 'ADDM Feature Test';



    task_id NUMBER;



BEGIN



    dbms_advisor.create_task('ADDM', task_id, task_name, task_desc, null);



    dbms_advisor.set_task_parameter(task_name, 'START_SNAPSHOT', 65);



    dbms_advisor.set_task_parameter(task_name, 'END_SNAPSHOT', 66);



    dbms_advisor.set_task_parameter(task_name, 'INSTANCE', 1);



    dbms_advisor.set_task_parameter(task_name, 'DB_ID', 1712582900);



    dbms_advisor.execute_task(task_name);



END;



/




PL/SQL procedure successfully completed.
 

其中,set_task_parameter是用来设置任务参数的。START_SNAPSHOT是起始快照IDEND_SNAPSHOT是结束快照IDINSTANCE是实例号,对于单实例,一般是1,在RAC环境下,可以通过查询视图v$instance得到,DB_ID是数据库的唯一识别号,可以通过查询v$database查到。

 
 

Top

Copyright ©2005,HelloDBA.Com 保留一切权利

申明
by fuyuncat