[English]
作者:
fuyuncat
来源:
www.HelloDBA.com
Global Temporary Table是Oracle 8i中出现的特性,可以用于存储事务或会话中的临时数据。它的出现大大方便了开发人员。但是在使用上面,由于它本身的特性,一直存在一些问题。
简单说一下临时表,它的数据只对调用它的会话可见,一个会话是无法访问其他会话中的临时表的数据。可以在创建时指定它是事务级的还是会话级的。它被创建在用户的默认临时表空间上,在创建时不会分配段,而是在会话中第一次insert的时候从零时表空间分配数据段。DML时,不会产生redo log,但是会产生undo log。并且无法生成临时表或者临时表上索引的统计信息(势必会影响CBO下的查询计划)。
下面研究一下临时表的数据是如何存储,又是如何获得的,如何cache在内存中的:
我们知道,对于普通表(regular tables),第一对表进行扫描时,会将扫描到的数据放到buffer cache中,以便以后如果有其他事务需要扫描相同数据时,直接从内存中读,而不产生disk read。并且,同时在LUR和MUR链中记录一个点,以决定这些数据什么时候被page out。
那对于临时表呢?以前我是这样认为的,既然临时表的数据只对会话可见,那它的数据就不应该放在公用的buffer cache中,而放在每个会话的PGA里面更合适。那这个观点正确吗?我查了很多资料,并没有明确的指出临时表的数据应该是cache在内存的哪一块。由于这些都是Oracle internal的东东,没有任何公布的资料可查,我们下面来做一些试验来看看Oracle到底怎么管理临时表的数据的。
临时表中的数据到底cache在哪里?
首先,创建测试用的对象:
创建一张普通表:
CREATE TABLE pga_ttt ( A VARCHAR2(100) );给表插入测试数据:
INSERT INTO pga_ttt values(1);创建临时表:
CREATE GLOBAL TEMPORARY TABLE PGA_TEST ( A VARCHAR2(3000), B VARCHAR2(2000),C VARCHAR2(2000) ) ON COMMIT PRESERVE ROWS;
测试过程:
1. 修改db cache size为一个较小的值:
ALTER SYSTEM SET DB_CACHE_SIZE = 50M;
2. 重起数据库:
STARTUP FORCE这时的数据库的内存中应该是比较干净的。
3. 先看一下一些什么对象已经cache在buffer cache中了:
SELECT DISTINCT objd FROM v$bh ORDER BY objd;OBJD----23678... ...42949672944294967295这些对象应该都是系统启动时载入的一些系统对象。
4. 另外启动两个会话,分别执行以下语句:
INSERT INTO PGA_TEST VALUES(1, 1, 1);SELECT * FROM PGA_TEST;
5. 再看下buffer cache中的对象:
SELECT DISTINCT objd FROM v$bh ORDER BY objd;OBJD----2367... ...6693385669351342949672944294967295这时,可以发现多出两个对象来了。但不能确定和pga_test有什么关系,也许又是两个系统对象。
6. 查一下pga_test的object number
SELECT object_id FROM dba_objects WHERE object_name = 'PGA_TEST';53513比较失望L,这个object number和刚才那两个新cache到buffer cache中的object number并不相同。但是这还并不能说明临时表的数据一定没有cache到buffer cache中去。
接下来继续测试,将buffer cache dump出来!
7. Dump出buffer cache
用level 3将整个buffer cache都dump出来,这将会产生一个比较大的trace文件(折就是为什么要把buffer cache设小一些的原因)
oradebug setmypidoradebug dump buffers 3
8. 打开trace文件
在trace文件中,找到一下两段:
· 第一段:
BH (183EBEEC) file#: 201 rdba: 0x0066220a (1/2499082) class: 1 ba: 18114000set: 3 blksize: 8192 bsi: 0 set-flg: 2 pwbcnt: 574dbwrid: 0 obj: 6693385 objn: 53513 tsn: 3 afn: 201hash: [201d7a88,201d7a88] lru: [183ebff0,183ebe90]ckptq: [NULL] fileq: [NULL] objq: [1ea81d98,183ec044]st: XCURRENT md: NULL tch: 2flags: buffer_dirty temp_data gotten_in_current_mode redo_since_readLRBA: [0x0.0.0] HSCN: [0xffff.ffffffff] HSUB: [65535]buffer tsn: 3 rdba: 0x0066220a (1/2499082)scn: 0x0000.00550a09 seq: 0x00 flg: 0x08 tail: 0x0a090600frmt: 0x02 chkval: 0x0000 type: 0x06=trans dataHex dump of block: st=0, typ_found=1Dump of memory from 0x18114000 to 0x1811600018114000 0000A206 0066220A 00550A09 08000000 [....."f...U.....]... ...... ...... ...18115830 20202020 20202020 20202020 20202020 [ ]Repeat 123 times18115FF0 20202020 20202020 20202020 0A090600 [ ....]Block header dump: 0x0066220aObject id on Block? Yseg/obj: 0x662209 csc: 0x00.00 itc: 2 flg: O typ: 1 - DATAfsl: 0 fnx: 0x0 ver: 0x01Itl Xid Uba Flag Lck Scn/Fsc0x01 0x0006.01b.00000c9d 0x0080142b.088a.20 ---- 1 fsc 0x0000.000000000x02 0x0000.000.00000000 0x00000000.0000.00 ---- 0 fsc 0x0000.00000000data_block_dump,data header at 0x1811405c===============tsiz: 0x1fa0hsiz: 0x14pbl: 0x1811405cbdba: 0x0066220a76543210flag=--------ntab=1nrow=1frre=-1fsbo=0x14fseo=0x824avsp=0x810tosp=0x8100xe:pti[0] nrow=1 offs=00x12:pri[0] offs=0x824block_row_dump:tab 0, row 0, @0x824tl: 6012 fb: --H-FL-- lb: 0x1 cc: 3col 0: [2000]31 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20... ...20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20col 1: [2000]31 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20... ...20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20col 2: [2000]31 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20... ...20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20end_of_block_dump
· 第二段:
BH (183EC04C) file#: 201 rdba: 0x0066228a (1/2499210) class: 1 ba: 18118000set: 3 blksize: 8192 bsi: 0 set-flg: 2 pwbcnt: 574dbwrid: 0 obj: 6693513 objn: 53513 tsn: 3 afn: 201hash: [201e8d88,183e6a5c] lru: [183ec150,183ebff0]ckptq: [NULL] fileq: [NULL] objq: [1ea81dd0,183ec1a4]st: XCURRENT md: NULL tch: 2flags: buffer_dirty temp_data gotten_in_current_mode redo_since_readLRBA: [0x0.0.0] HSCN: [0xffff.ffffffff] HSUB: [65535]buffer tsn: 3 rdba: 0x0066228a (1/2499210)scn: 0x0000.00550a08 seq: 0x00 flg: 0x08 tail: 0x0a080600frmt: 0x02 chkval: 0x0000 type: 0x06=trans dataHex dump of block: st=0, typ_found=1Dump of memory from 0x18118000 to 0x1811A00018118000 0000A206 0066228A 00550A08 08000000 [....."f...U.....]... ...... ...... ...18119830 20202020 20202020 20202020 20202020 [ ]Repeat 123 times18119FF0 20202020 20202020 20202020 0A080600 [ ....]Block header dump: 0x0066228aObject id on Block? Yseg/obj: 0x662289 csc: 0x00.00 itc: 2 flg: O typ: 1 - DATAfsl: 0 fnx: 0x0 ver: 0x01Itl Xid Uba Flag Lck Scn/Fsc0x01 0x0005.014.00000c58 0x008044a3.060a.08 ---- 1 fsc 0x0000.000000000x02 0x0000.000.00000000 0x00000000.0000.00 ---- 0 fsc 0x0000.00000000data_block_dump,data header at 0x1811805c===============tsiz: 0x1fa0hsiz: 0x14pbl: 0x1811805cbdba: 0x0066228a76543210flag=--------ntab=1nrow=1frre=-1fsbo=0x14fseo=0x824avsp=0x810tosp=0x8100xe:pti[0] nrow=1 offs=00x12:pri[0] offs=0x824block_row_dump:tab 0, row 0, @0x824tl: 6012 fb: --H-FL-- lb: 0x1 cc: 3col 0: [2000]31 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20... ...20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20col 1: [2000]31 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20... ...20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20col 2: [2000]31 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20... ...20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20end_of_block_dump
这两段都是cache在buffer cache中的数据段。注意他们的基础系统中的以下内容:
obj: 6693385 objn: 53513
obj: 6693513 objn: 53513object number是53513,这正是pga_test的object number,对比一下后面数据块的内容:
col 0: [2000]
31 20 20 20 ...(即’1 ’)
col 1: [2000]
31 20 20 20 ...(即’1 ’)
col 2: [2000]
31 20 20 20 ...(即’1 ’)正是从pga_test中的扫描到的数据。
再看objn前面的数字,是不是很眼熟?对了,这就是从v$bh中查到的在扫描临时表后buffer cache中多出两个对象的object number!这因该是为了保持各自会话的数据的独立,Oracle创建了一个系统临时对象(丛v$bh中看,这个临时对象时属于sys用户的,不属于当前用户的),保持了与临时表相同的结构,然后在buffer中开辟了一片区域,以系统临时对象的名义存放各自数据,使之相互不影响。同时我们还可以留意到它们的LRU值是不同的。
另外看下他们的flags:
flags: buffer_dirty temp_data gotten_in_current_mode redo_since_readbuffer_dirty:因为临时表需要先插入数据,所以被置了dirty标志;
temp_data:临时表在第一次INSERT时,才在临时表空间上分配临时段,所以是属于临时数据;
gotten_in_current_mode:显然,当前会话这在获取各自临时表中的数据,因此是当前被获取模式下;
redo_since_read:这个不是十分明白。因为临时表的DML是不会产生redo log的,会产生undo log,同时会产生针对这些undo的redo log(而不是临时表的)。
现在,我们基本上可以得出这样的推论:
推论1:临时表的数据是cache在buffer cache中的。并且,为了保持各自会话的数据独立,在buffer cache中为各个会话开辟一片区域来cache它们各自的数据。
以上推论可以和普通表来做一个对比。
在两个会话中分别查询普通表:
SELECT * FROM pga_ttt;Dump 出cache buffer:
oradebug setmypidoradebug dump buffers 3查询普通表的object number
SELECT object_id FROM dba_objects WHERE object_name = 'PGA_TTT';53514看看trace文件中的内容:虽然我们在两个会话中都扫描了这张表,但是buffer cache只有一段它的数据段:
BH (18BE658C) file#: 5 rdba: 0x014097be (5/38846) class: 1 ba: 18810000set: 3 blksize: 8192 bsi: 0 set-flg: 2 pwbcnt: 64dbwrid: 0 obj: 53514 objn: 53514 tsn: 5 afn: 5hash: [202153d8,202153d8] lru: [18be6690,18be6530]ckptq: [NULL] fileq: [NULL] objq: [18be6584,18be66e4]st: XCURRENT md: NULL tch: 2flags: only_sequential_accessLRBA: [0x0.0.0] HSCN: [0xffff.ffffffff] HSUB: [65535]buffer tsn: 5 rdba: 0x014097be (5/38846)scn: 0x0000.005513e7 seq: 0x01 flg: 0x06 tail: 0x13e70601frmt: 0x02 chkval: 0xa15f type: 0x06=trans dataHex dump of block: st=0, typ_found=1Dump of memory from 0x18810000 to 0x1881200018810000 0000A206 014097BE 005513E7 06010000 [......@...U.....]... ...... ...... ...18810080 00000000 00000000 00000000 00000000 [................]Repeat 502 times18811FF0 00000000 2C000000 31010101 13E70601 [.......,...1....]Block header dump: 0x014097beObject id on Block? Yseg/obj: 0xd10a csc: 0x00.5513bd itc: 2 flg: E typ: 1 - DATAbrn: 0 bdba: 0x14097b9 ver: 0x01 opc: 0inc: 0 exflg: 0Itl Xid Uba Flag Lck Scn/Fsc0x01 0x0006.01b.00000c9d 0x0080142b.088a.21 --U- 1 fsc 0x0000.005513e70x02 0x0000.000.00000000 0x00000000.0000.00 ---- 0 fsc 0x0000.00000000data_block_dump,data header at 0x18810064===============tsiz: 0x1f98hsiz: 0x14pbl: 0x18810064bdba: 0x014097be76543210flag=--------ntab=1nrow=1frre=-1fsbo=0x14fseo=0x1f93avsp=0x1f7btosp=0x1f7b0xe:pti[0] nrow=1 offs=00x12:pri[0] offs=0x1f93block_row_dump:tab 0, row 0, @0x1f93tl: 5 fb: --H-FL-- lb: 0x1 cc: 1col 0: [ 1] 31end_of_block_dump
另外,检查它的基础信息,这时obj和objn是相同的,都是ojb$表中对应的object#。
会话之间的临时表数据是否可以复用?
以上的问题应该可以告一个段落了。下面我想到另外一个问题:如果各个会话的写入临时表中数据都一样,那么会话之间的数据能不能复用呢(即从其他会话的buffer cache中得到一份数据拷贝,而不需要读写临时表空间)?
其实,这个问题应该可以通过一个比较简单的测试来推断:
1. 在两个不同的会话中分别向临时表插入数据:
INSERT INTO PGA_TEST VALUES(1, 1, 1);
2. 然后刷新buffer cache,将buffer中的数据都写入到磁盘中去:
ALTER SYSTEM FLUSH BUFFER_CACHE;以上语句之适用于10g,如果是9i,可以用下面的语句:
ALTER SYSTEM SET EVENTS ‘IMMEDIATE TRACE NAME FLUSH_CACHE’;
3. 分别在两个会话中查询临时表:
· SESSION 1:
SQL> SET AUTOT TRACESQL> SELECT * FROM PGA_TEST;Execution Plan----------------------------------------------------------Plan hash value: 30787903--------------------------------------| Id | Operation | Name |--------------------------------------| 0 | SELECT STATEMENT | || 1 | TABLE ACCESS FULL| PGA_TEST |--------------------------------------Note------ rule based optimizer used (consider using cbo)Statistics----------------------------------------------------------165 recursive calls0 db block gets20 consistent gets7 physical reads0 redo size6533 bytes sent via SQL*Net to client385 bytes received via SQL*Net from client2 SQL*Net roundtrips to/from client4 sorts (memory)0 sorts (disk)1 rows processed可以看到第一个会话产生了physical read,显然是从临时数据段上读取了数据。
再在这个会话上查询一次:
SQL> /Execution Plan----------------------------------------------------------Plan hash value: 30787903--------------------------------------| Id | Operation | Name |--------------------------------------| 0 | SELECT STATEMENT | || 1 | TABLE ACCESS FULL| PGA_TEST |--------------------------------------Note------ rule based optimizer used (consider using cbo)Statistics----------------------------------------------------------0 recursive calls0 db block gets3 consistent gets0 physical reads0 redo size6533 bytes sent via SQL*Net to client385 bytes received via SQL*Net from client2 SQL*Net roundtrips to/from client0 sorts (memory)0 sorts (disk)1 rows processed可以看到,以及没有physical read了,这时不是动临时段上读取数据了,而是直接读取buffer cache了。
· SESSION 2:
SQL> SET AUTOT TRACESQL> SELECT * FROM pga_test;Execution Plan----------------------------------------------------------Plan hash value: 30787903--------------------------------------| Id | Operation | Name |--------------------------------------| 0 | SELECT STATEMENT | || 1 | TABLE ACCESS FULL| PGA_TEST |--------------------------------------Note------ rule based optimizer used (consider using cbo)Statistics----------------------------------------------------------1 recursive calls0 db block gets3 consistent gets2 physical reads0 redo size6533 bytes sent via SQL*Net to client385 bytes received via SQL*Net from client2 SQL*Net roundtrips to/from client0 sorts (memory)0 sorts (disk)1 rows processed请注意,尽管SESSION 1已经是从buffer cache中读取数据了,但是SESSION 2还是有physical read,说明它还是从自己所分配到的临时段上读取的数据,而不是copy其他会话的!
再作一次查询:
SQL> /Execution Plan----------------------------------------------------------Plan hash value: 30787903--------------------------------------| Id | Operation | Name |--------------------------------------| 0 | SELECT STATEMENT | || 1 | TABLE ACCESS FULL| PGA_TEST |--------------------------------------Note------ rule based optimizer used (consider using cbo)Statistics----------------------------------------------------------0 recursive calls0 db block gets3 consistent gets0 physical reads0 redo size6533 bytes sent via SQL*Net to client385 bytes received via SQL*Net from client2 SQL*Net roundtrips to/from client0 sorts (memory)0 sorts (disk)1 rows processed这时就是从它自己的buffer cache中读取数据了。
推论2:每个会话在第一次INSERT是分配临时段,他们的数据读写是完全独立的,不会有任何联系,即使他们的数据内容完全一样。
我们再与普通表进行对比:
在第一个SESSION中查询普通表:
SQL> SELECT * FROM pga_ttt;Execution Plan----------------------------------------------------------Plan hash value: 3071005808-----------------------------------------------------------------------------| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |-----------------------------------------------------------------------------| 0 | SELECT STATEMENT | | 1 | 52 | 2 (0)| 00:00:01 || 1 | TABLE ACCESS FULL| PGA_TTT | 1 | 52 | 2 (0)| 00:00:01 |-----------------------------------------------------------------------------Statistics----------------------------------------------------------163 recursive calls0 db block gets24 consistent gets15 physical reads0 redo size407 bytes sent via SQL*Net to client385 bytes received via SQL*Net from client2 SQL*Net roundtrips to/from client4 sorts (memory)0 sorts (disk)1 rows processed这时产生了physical read,说明数据是从磁盘读取的。
再在第一个SESSION查询这张表:
SQL> SELECT * FROM pga_test;Execution Plan----------------------------------------------------------Plan hash value: 30787903--------------------------------------| Id | Operation | Name |--------------------------------------| 0 | SELECT STATEMENT | || 1 | TABLE ACCESS FULL| PGA_TEST |--------------------------------------Note------ rule based optimizer used (consider using cbo)Statistics----------------------------------------------------------0 recursive calls0 db block gets3 consistent gets0 physical reads0 redo size6533 bytes sent via SQL*Net to client385 bytes received via SQL*Net from client2 SQL*Net roundtrips to/from client0 sorts (memory)0 sorts (disk)1 rows processed没有physical read,它的数据是从buffer cache中得到的。
根据以上的推论,对现在遇到的关于临时表的几个性能问题作了设计和处理上的调整,取得了较好的效果J
另外,以上主要测试的是会话级的临时表。但是我认为事务级的临时表的结果应该是查不多的,因为每个临时表中的数据之在当前会话中重用。