This Is A FineDay

  BlogJava :: 首页 :: 新随笔 :: 联系 :: 聚合  :: 管理 ::
  93 随笔 :: 0 文章 :: 69 评论 :: 0 Trackbacks

Oracle 备份与恢复案例

By Piner

 

. 理解什么是数据库恢复
  
当我们使用一个数据库时,总希望数据库的内容是可靠的、正确的,但由于计算机系统的故障(硬件故障、软件故障、网络故障、进程故障和系统故障)影响数据库系统的操作,影响数据库中数据的正确性,甚至破坏数据库,使数据库中全部或部分数据丢失。因此当发生上述故障后,希望能重构这个完整的数据库,该处理称为数据库恢复。恢复过程大致可以分为复原 (Restore) 与恢复 (Recover) 过程。

 

数据库恢复可以分为以下两类:

 

1.1 实例故障的一致性恢复

当实例意外地(如掉电、后台进程故障等)或预料地(发出 SHUTDOUM ABORT 语句)中止时出现实例故障,此时需要实例恢复。实例恢复将数据库恢复到故障之前的事务一致状态。如果在在线后备发现实例故障,则需介质恢复。在其它情况 Oracle 在下次数据库起动时(对新实例装配和打开),自动地执行实例恢复。如果需要,从装配状态变为打开状态,自动地激发实例恢复,由下列处理:

( 1 为了解恢复数据文件中没有记录的数据,进行向前滚。该数据记录在在线日志,

包括对回滚段的内容恢复。

( 2 回滚未提交的事务,按步 1 重新生成回滚段所指定的操作。

( 3 释放在故障时正在处理事务所持有的资源。

( 4 解决在故障时正经历一阶段提交的任何悬而未决的分布事务。


1.2
介质故障或文件错误的不一致恢复

介质故障是当一个文件、一个文件的部分或磁盘不能读或不能写时出现的故障。文件错误一般指意外的错误导致文件被删除或意外事故导致文件的不一致。这种状态下的数据库都是不一致的,需要 DBA 手工来进行数据库的恢复,这种恢复有两种形式,决定于数据库运行的归档方式和备份方式。

 

1 完全介质恢复可恢复全部丢失的修改。一般情况下需要有数据库的备份且数据库运行在归档状态下并且有可用归档日志时才可能。对于不同类型的错误,有不同类型的完全恢复可使用,其决定于毁坏文件和数据库的可用性。

 

2 不完全介质恢复是在完全介质恢复不可能或不要求时进行的介质恢复。重构受损的数据库,使其恢复介质故障前或用户出错之前的一个事务一致性状态。不完全介质恢复有不同类型的使用,决定于需要不完全介质恢复的情况,有下列类型:基于撤消、基于时间和基于修改的不完全恢复。

基于撤消 (CANCEL) 恢复:在某种情况,不完全介质恢复必须被控制, DBA 可撤消在指定点的操作。基于撤消的恢复地在一个或多个日志组(在线的或归档的)已被介质故障所破坏,不能用于恢复过程时使用,所以介质恢复必须控制,以致在使用最近的、未损的日志组于数据文件后中止恢复操作。

 

基于时间 (TIME) 和基于修改 (SCN) 的恢复:如果 DBA 希望恢复到过去的某个指定点,是一种理想的不完全介质恢复,一般发生在恢复到某个特定操作之前,恢复到如意外删除某个数据表之前。

 

第二章. 数据库恢复案例测试环境


2.1
数据库环境

以下的所有案例都是通过测试经过,环境为:

  OS Windows 2000 Server

  DB Oracle 816

  DBNAME TEST

数据文件:

SQL> select file#,status,enabled,name from v$datafile;

 

    FILE# STATUS  ENABLED      NAME

----------------------------------------------------------------

         1 SYSTEM  READ WRITE D:\Oracle\ORADATA\TEST\SYSTEM01.DBF

         2 ONLINE  READ WRITE D:\Oracle\ORADATA\TEST\RBS01.DBF

         3 ONLINE  READ WRITE D:\Oracle\ORADATA\TEST\USERS01.DBF

         4 ONLINE  READ WRITE D:\Oracle\ORADATA\TEST\TEMP01.DBF

         5 ONLINE  READ WRITE D:\Oracle\ORADATA\TEST\TOOLS01.DBF

         6 ONLINE  READ WRITE D:\Oracle\ORADATA\TEST\INDX01.DBF

控制文件:

SQL> select * from v$controlfile;

 

STATUS  NAME

---------------------------------------------------------------------

        D:\Oracle\ORADATA\TEST\CONTROL01.CTL

        D:\Oracle\ORADATA\TEST\CONTROL02.CTL

        D:\Oracle\ORADATA\TEST\CONTROL03.CTL


联机日志:

SQL> select * from v$logfile;

 

    GROUP# STATUS      MEMBER

---------------------------------------------------------------------

      1     STALE      D:\Oracle\ORADATA\TEST\REDO01.LOG

      2               D:\Oracle\ORADATA\TEST\REDO02.LOG

      3     STALE      D:\Oracle\ORADATA\TEST\REDO03.LOG

 

2.2 数据库备份脚本

冷备份脚本 :

rem     script:coldbak.sql

rem     creater:chenjiping

rem     date:5.8.2003

rem     desc:offline full backup database

 

--connect database

connect internal/password;

--shutdown database

shutdown immediate;

--Copy Data file

!xcopy d:\Oracle\oradata\test\*.dbf d:\database/H/R;

--Copy Control file

!xcopy d:\Oracle\oradata\test\*.ctl d:\database/H/R;

--Copy Log file

!xcopy d:\Oracle\oradata\test\*.log d:\database/H/R;

--startup database

startup;

 

说明:

1 、以上脚本在数据库关闭状态下备份数据库所有的数据文件,联机日志,控制文件(在一个目

录下),如果成功备份,所有文件是一致的 ;

2 、没有备份参数文件,参数文件可以另外备份,没有必要每次都备份,只需要在改变设置后备份一次 ;

3 、如果以上命令没有成功依次执行,那么备份将是无效的,如连接数据库不成功,那么肯定关闭数据库也不成功,那么备份则无效 ;

4 、冷备份建议下人工干预下执行。

 

数据库 OS 热全备份脚本

rem     script:hotbak.sql

rem     creater:chenjiping

rem     date:5.8.2003

rem     desc:backup all database datafile in archive

 

--connect database

connect internal/password;

 

--archive

alter system archive log current;

--start

 

alter tablespace system begin backup;

!xcopy d:\Oracle\oradata\test\system01.dbf d:\databak/H/R;

alter tablespace system end backup;

 

alter tablespace rbs begin backup;

!xcopy d:\Oracle\oradata\test\rbs01.dbf d:\databak/H/R;

alter tablespace rbs end backup;

 

alter tablespace users begin backup;

!xcopy d:\Oracle\oradata\test\users01.dbf d:\databak/H/R;

alter tablespace users end backup;

 

alter tablespace tools begin backup;

!xcopy d:\Oracle\oradata\test\tools01.dbf d:\databak/H/R;

alter tablespace tools end backup;

 

alter tablespace indx begin backup;

!xcopy d:\Oracle\oradata\test\indx01.dbf d:\databak/H/R;

alter tablespace indx end backup;

--end

 

--bak control file

--binary

alter database backup controlfile to 'd:\databak\controlbinbak.000';

--ascii

alter database backup controlfile to trace;

 

alter system archive log current;

说明:

1 、热备份必须在数据库归档方式下才可以运行;

2 、以上脚本可以在数据库运行状态下备份数据库所有的数据文件(除了临时数据文件),没有必要备份联机日志;

3 、归档日志至少需要一次完整备份之后的所有日志;

4 、如果以上命令没有成功依次执行,那么备份也是无效的,如连接数据库不成功,那么备份则无效。

 

RMAN 备份只讲叙有恢复目录的情况,如果没有恢复目录,情形大致相似。以下是 RMAN 的热备份全备份的脚本:

#   script:bakup.rcv

#   creater:chenjiping

#   date:5.8.2003

#   desc:backup all database datafile in archive with rman

 

# connect database

connect rcvcat rman/rman@back;

connect target internal/virpure;

 

# start backup database

run{

allocate channel c1 type disk;

backup full tag 'dbfull' format 'd:\backup\full%u_%s_%p' database

include current controlfile;

sql 'alter system archive log current';

release channel c1;

}

# end

 

说明:

1 数据库必须运行在归档模式下 ;

2 RMAN 将自动备份数据文件,运行可靠 ;

3 归档日志另外备份处理,但至少需要保存一次备份来的日志 ;

4 没有必要用 RMAN 做冷备份,效果不好。

 

以上举例说明了数据库的恢复案例的测试环境与部分备份测试脚本,其它的备份脚本可以根据以上脚本演变而来或在案例中加以说明。

数据库的自动实例将不加以说明,这里只举例说明媒体错误或人为错误造成的恢复可能。

以上包括以下案例都是在 WINDOWS+Oracle816 上测试验证的,在不同的操作系统与不同的数据库版本中略有差别。

 

第三章. 了解与恢复相关的信息

 

1 理解报警日志文件

报警日志文件一般记载了数据库的启动 / 关闭信息,归档信息,备份信息,恢复信息,常见错误信息,部分数据库修改记录等。一般令名规则为 <SID>Alrt.log Alrt<SID>.log ,如我的测试数据库的报警日志文件的名称为 testalrt.log

 

报警日志文件的路径是根据初始化参数 background_dump_dest 来决定的,如在我的机器上,该参数值为 D:\Oracle\admin\test\bdump ,那么,你就可以在该路径下找到该文件。

2 后台进程跟踪文件

后台进程跟踪文件的路径与报警日志文件的路径一致,在某些情况下,你可以通过后台跟踪文件的信息了解更多的需要恢复的信息。如在数据库需要恢复的时候,报警日志文件中常有这样的语句:

Errors in file D:\Oracle\admin\test\bdump\testDBW0.TRC:

ORA-01157: cannot identify/lock data file 1 - see DBWR trace file

通过提示的 DBWR 跟踪文件,可以查询到更详细的信息。


3
v$recover_file v$recovery_log

这是两个动态性能视图,可以在 mount 下查看,通过这两个视图,你可以了解详细的需要恢复的数据文件与需要使用到的归档日志。

第四章. 数据库恢复案例


4.1
非归档模式下的备份与恢复

备份方案:采用 OS 冷备份

 

1.  连接数据库并创建测试表

SQL> connect internal/password as sysdba;

Connected.

SQL> create table test(a int);

Table created

SQL> insert into test values(1);

1 row inserted

SQL> commit;

Commit complete

 

2.  备份数据库

SQL> @coldbak.sql 或在 DOS svrmgrl @coldbak.sql

 

3.  再插入记录

SQL> insert into test values(2);

1 row inserted

SQL> commit;

Commit complete

SQL> select * from test;

                         A

-------------------

                         1

                         2

4.  关闭数据库

SQL> shutdown immediate;

Database closed.

Database dismounted.

Oracle instance shut down.

 

5.  毁坏一个或多个数据文件,如删除 user01.dbf

C:\>del D:\Oracle\ORADATA\TEST\USERS01.DBF

模拟媒体毁坏。

 

6.  重新启动数据库,会发现如下错误

SQL> startup

Oracle instance started.

 

Total System Global Area  102020364 bytes

Fixed Size                    70924 bytes

Variable Size              85487616 bytes

Database Buffers           16384000 bytes

Redo Buffers                  77824 bytes

Database mounted.

ORA-01157: cannot identify/lock data file 3 - see DBWR trace file

ORA-01110: data file 3: 'D:\Oracle\ORADATA\TEST\USERS01.DBF'

 

在报警文件中,会有更详细的信息

Errors in file D:\Oracle\admin\test\bdump\testDBW0.TRC:

ORA-01157: cannot identify/lock data file 3 - see DBWR trace file

ORA-01110: data file 3: 'D:\Oracle\ORADATA\TEST\USERS01.DBF'

ORA-27041: unable to open file

OSD-04002: unable to open file

O/S-Error: (OS 2) 系统找不到指定的文件。

 

7.  拷贝备份复原到原来位置 (restore 过程 )

C:\>xcopy d:\database\*.* d:\Oracle\oradata\test/H/R/S

 

8.  打开数据库,检查数据

SQL> alter database open;

Database altered.

SQL> select * from test;

                         A

---------------------------------------

                         1

 

这里可以发现,数据库恢复成功,但在备份之后与崩溃之前的数据丢失了。

说明:

1 、非归档模式下的恢复方案可选性很小,一般情况下只能有一种恢复方式,就是数据库的冷备
份的完全恢复,仅仅需要拷贝原来的备份就可以 (restore) ,不需要 recover

2 、这种情况下的恢复,可以完全恢复到备份的点上,但是可能是丢失数据的,在备份之后与崩溃之前的数据将全部丢失;

3 、不管毁坏了多少数据文件或是联机日志或是控制文件,都可以通过这个办法恢复,因为这个恢复过程是 Restore 所有的冷备份文件,而这个备份点上的所有文件是一致的,与最新的数据库没有关系,就好比把数据库又放到了一个以前的 " " 上;

4 、对于非归档模式下,最好的办法就是采用 OS 的冷备份,建议不要用 RMAN 来作冷备份,效果不好,因为 RMAN 不备份联机日志, restore 不能根本解决问题;

5 、如果没有备份联机日志,如 RMAN 的备份,就需要利用不完全恢复 (until cancel) 的方法来重新创建联机日志文件。

4.2 归档模式下丢失或损坏一个数据文件

4.2.1 OS 备份方案

在归档方式下损坏或丢失一个数据文件,如果存在相应的备份与该备份以来的归档日志,恢复还是比较简单的,可以作到尽量少的 Down 机时间,并能作到数据库的完全恢复。

1 连接数据库,创建测试表并插入记录

SQL> connect internal/password as sysdba;

Connected.

SQL> create table test(a int) tablespace users;

Table created

SQL> insert into test values(1);

1 row inserted

SQL> commit;

Commit complete

 

2 备份数据库

SQL> @hotbak.sql 或在 DOS svrmgrl @hotbak.sql

 

3 继续在测试表中插入记录

SQL> insert into test values(2);

1 row inserted

SQL> commit;

Commit complete

SQL> select * from test;

                         A

    --------------------------------------

                         1

                         2

SQL> alter system switch logfile;

System altered.

SQL> alter system switch logfile;

System altered.

 

4 关闭数据库,模拟丢失数据文件

SQL> shutdown immediate;

Database closed.

Database dismounted.

Oracle instance shut down

C:\>del D:\Oracle\ORADATA\TEST\USERS01.DBF

模拟媒体毁坏。

 

5 启动数据库错误,脱机该数据文件:

SQL> startup

Oracle instance started.

 

Total System Global Area  102020364 bytes

Fixed Size                    70924 bytes

Variable Size              85487616 bytes

Database Buffers           16384000 bytes

Redo Buffers                  77824 bytes

Database mounted.

ORA-01157: cannot identify/lock data file 3 - see DBWR trace file

ORA-01110: data file 3: 'D:\Oracle\ORADATA\TEST\USERS01.DBF'

还可以查看报警文件(见上一个恢复案例)或动态视图 v$recover_file

SQL> select * from v$recover_file;

 

     FILE# ONLINE  ERROR                    CHANGE#    TIME

---------- ------- ------------------ ---------- -----------

         3   ONLINE                        1013500    2003-05-07

 

脱机数据文件

SQL> alter database datafile 3 offline drop;

Database altered.

 

6 打开数据库,拷贝备份回来 (restore) ,恢复 (recover) 该数据文件,并联机 :

SQL> alter database open;

Database altered.


拷贝备份从备份处

copy d:\databak\ users01.dbf d:\Oracle\oradata\test;


恢复该数据文件

SQL> recover datafile 3;

ORA-00279: change 1053698 generated at 05/07/200317:51:26 needed for

thread 1

ORA-00289: suggestion :
D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00304.ARC

ORA-00280: change 1053698 for thread 1 is in sequence #304

 

Specify log: {<RET>=suggested | filename | AUTO | CANCEL}

AUTO

ORA-00279: change 1053701 generated at 05/07/200317:51:39 needed for

thread 1

ORA-00289: suggestion : D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00305.ARC

ORA-00280: change 1053701 for thread 1 is in sequence #305

ORA-00278: log file 'D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00304.ARC' no longer needed for this recovery Log applied.

Media recovery complete.

恢复成功,联机该数据文件

SQL> alter database datafile 3 online;

Database altered.

 

7 检查数据库的数据(完全恢复)

SQL> select * from test;

                         A

--------------------------------

                         1

                         2

说明:

1 、采用热备份,需要运行在归档模式下,可以实现数据库的完全恢复,也就是说,从备份后到数据库崩溃时的数据都不会丢失 ;

2 、可以采用全备份数据库的方式备份,对于特殊情况,也可以只备份特定的数据文件,如只备份用户表空间(一般情况下对于某些写特别频繁的数据文件,可以单独加大备份频率);

3 、如果在恢复过程中,发现损坏的是多个数据文件,即可以采用一个一个数据文件的恢复方法(第 5 步中需要对数据文件一一脱机,第 6 步中需要对数据文件分别恢复),也可以采用整个数据库的恢复方法;

4 、如果是系统表空间的损坏,不能采用此方法。

 

4.2.2 RMAN 备份方案

RMAN 也可以进行联机备份,而且备份与恢复方法将比 OS 备份更简单可靠。

1 、连接数据库,创建测试表并插入记录

SQL> connect internal/password as sysdba;

Connected.

 

SQL> create table test(a int) tablespace users;

Table created

SQL> insert into test values(1);

1 row inserted

SQL> commit;

Commit complete

 

2 备份数据库表空间 users

C:\>rman

Recovery Manager: Release 8.1.6.0.0 - Production

RMAN> connect rcvcat rman/rman@back

RMAN-06008: connected to recovery catalog database

RMAN> connect target internal/virpure

RMAN-06005: connected to target database: TEST (DBID=1788174720)

 

RMAN> run{

2> allocate channel c1 type disk;

3> backup tag 'tsuser' format 'd:\backup\tsuser_%u_%s_%p'

4> tablespace users;

5> release channel c1;

6> }

 

RMAN-03022: compiling command: allocate

RMAN-03023: executing command: allocate

RMAN-08030: allocated channel: c1

RMAN-08500: channel c1: sid=16 devtype=DISK

 

RMAN-03022: compiling command: backup

RMAN-03025: performing implicit partial resync of recovery catalog

RMAN-03023: executing command: partial resync

RMAN-08003: starting partial resync of recovery catalog

RMAN-08005: partial resync complete

RMAN-03023: executing command: backup

RMAN-08008: channel c1: starting full datafile backupset

RMAN-08502: set_count=5 set_stamp=494177612 creation_time=16-MAY-03

RMAN-08010: channel c1: specifying datafile(s) in backupset

RMAN-08522: input datafile fno=00003 name=D:\Oracle\ORADATA\TEST\USER01.DBF

RMAN-08013: channel c1: piece 1 created

RMAN-08503: piece handle=D:\BACKUP\TSUSER_05EN93AC_5_1 comment=NONE

RMAN-08525: backup set complete, elapsed time: 00:00:01

RMAN-03023: executing command: partial resync

RMAN-08003: starting partial resync of recovery catalog

RMAN-08005: partial resync complete

RMAN-03022: compiling command: release

RMAN-03023: executing command: release

RMAN-08031: released channel: c1

RMAN>

 

3 继续在测试表中插入记录

SQL> insert into test values(2);

1 row inserted

SQL> commit;

Commit complete

SQL> select * from test;

                         A

---------------------------------------

                         1

                         2

SQL> alter system switch logfile;

System altered.

SQL>r

1* alter system switch logfile;

System altered.

 

4 关闭数据库,模拟丢失数据文件

SQL> shutdown immediate;

Database closed.

Database dismounted.

Oracle instance shut down

 

C:\>del D:\Oracle\ORADATA\TEST\USER01.DBF

 

5 启动数据库,检查错误

SQL> startup

Oracle instance started.

Total System Global Area  102020364 bytes

Fixed Size                    70924 bytes

Variable Size              85487616 bytes

Database Buffers           16384000 bytes

Redo Buffers                  77824 bytes

Database mounted.

ORA-01157: cannot identify/lock data file 3 - see DBWR trace file

ORA-01110: data file 3: 'D:\Oracle\ORADATA\TEST\USER01.DBF'

 

6 先打开数据库

SQL> alter database datafile 3 offline drop;

Database altered.

SQL> alter database open;

Database altered.

 

7 恢复该表空间

恢复脚本可以是恢复单个数据文件

run{

allocate channel c1 type disk;

restore datafile 3;

recover datafile 3;

sql 'alter database datafile 3 online';

release channel c1;

}

也可以是 , 恢复表空间

run{

allocate channel c1 type disk;

restore tablespace users;

recover tablespace users;

sql 'alter database datafile 3 online';

release channel c1;

}

过程如下:

C:\>rman

Recovery Manager: Release 8.1.6.0.0 - Production

RMAN> connect rcvcat rman/rman@back

RMAN-06008: connected to recovery catalog database

RMAN> connect target internal/virpure

RMAN-06005: connected to target database: TEST (DBID=1788174720)

 

RMAN> run{

2> allocate channel c1 type disk;

3> restore datafile 3;

4> recover datafile 3;

5> sql 'alter database datafile 3 online';

6> release channel c1;

7> }

 

// 输出内容冗长,省略 -- 编者

RMAN>

 

8 检查数据是否完整

SQL> alter database open;

Database altered.

 

SQL> select * from test;

                         A

---------------------------------------

                         1

                         2

说明:

1 RMAN 也可以实现单个表空间或数据文件的恢复,恢复过程可以在 mount 下或 open 方式下,如果在 open 方式下恢复,可以减少 down 机时间 ;

2 、如果损坏的是一个数据文件,建议 offline 并在 open 方式下恢复 ;

3 、这里可以看到, RMAN 进行数据文件与表空间恢复的时候,代码都比较简单,而且能保证备份与恢复的可靠性,所以建议采用 RMAN 的备份与恢复 .

 

4.3 丢失多个数据文件,实现整个数据库的恢复 .

 

4.3.1 OS 备份方案

OS 备份归档模式下损坏(丢失)多个数据文件,进行整个数据库的恢复

1 连接数据库,创建测试表并插入记录

SQL> connect internal/password as sysdba;

Connected.

 

SQL> create table test(a int);

Table created

SQL> insert into test values(1);

1 row inserted

SQL> commit;

Commit complete

 

2 备份数据库,备份除临时数据文件后的所数据文件

SQL> @hotbak.sql 或在 DOS svrmgrl @hotbak.sql

 

3 继续在测试表中插入记录

SQL> insert into test values(2);

1 row inserted

SQL> commit;

Commit complete

SQL> select * from test;

                         A

---------------------------------------

                         1

                         2

SQL> alter system switch logfile;

System altered.

SQL> alter system switch logfile;

System altered.

 

4 关闭数据库,模拟丢失数据文件

SQL> shutdown immediate;

Database closed.

Database dismounted.

Oracle instance shut down

 

C:\>del D:\Oracle\ORADATA\TEST\SYSTEM01.DBF

C:\>del D:\Oracle\ORADATA\TEST\INDX01.DBF

C:\>del D:\Oracle\ORADATA\TEST\TOOLS01.DBF

C:\>del D:\Oracle\ORADATA\TEST\RBS01.DBF

模拟媒体毁坏(这里删除多个数据文件)

 

5 启动数据库,检查错误

SQL> STARTUP

Oracle instance started.

Total System Global Area  102020364 bytes

Fixed Size                    70924 bytes

Variable Size              85487616 bytes

Database Buffers           16384000 bytes

Redo Buffers                  77824 bytes

Database mounted.

ORA-01157: cannot identify/lock data file 1 - see DBWR trace file

ORA-01110: data file 1: 'D:\Oracle\ORADATA\TEST\SYSTEM01.DBF'

 

详细信息可以查看报警文件

ORA-1157 signalled during: ALTER DATABASE OPEN...

Thu May 08 09:39:36 2003

Errors in file D:\Oracle\admin\test\bdump\testDBW0.TRC:

ORA-01157: cannot identify/lock data file 1 - see DBWR trace file

ORA-01110: data file 1: 'D:\Oracle\ORADATA\TEST\SYSTEM01.DBF'

ORA-27041: unable to open file

OSD-04002: unable to open file

O/S-Error: (OS 2) 系统找不到指定的文件。

 

Thu May 08 09:39:36 2003

Errors in file D:\Oracle\admin\test\bdump\testDBW0.TRC:

ORA-01157: cannot identify/lock data file 2 - see DBWR trace file

ORA-01110: data file 2: 'D:\Oracle\ORADATA\TEST\RBS01.DBF'

ORA-27041: unable to open file

OSD-04002: unable to open file

O/S-Error: (OS 2) 系统找不到指定的文件。

 

Thu May 08 09:39:36 2003

Errors in file D:\Oracle\admin\test\bdump\testDBW0.TRC:

ORA-01157: cannot identify/lock data file 5 - see DBWR trace file

ORA-01110: data file 5: 'D:\Oracle\ORADATA\TEST\TOOLS01.DBF'

ORA-27041: unable to open file

OSD-04002: unable to open file

O/S-Error: (OS 2) 系统找不到指定的文件。

 

Thu May 08 09:39:36 2003

Errors in file D:\Oracle\admin\test\bdump\testDBW0.TRC:

ORA-01157: cannot identify/lock data file 6 - see DBWR trace file

ORA-01110: data file 6: 'D:\Oracle\ORADATA\TEST\INDX01.DBF'

ORA-27041: unable to open file

OSD-04002: unable to open file

O/S-Error: (OS 2) 系统找不到指定的文件。

 

通过查询 v$recover_file 可以看到

SQL> select * from v$recover_file;

 

     FILE# ONLINE  ERROR                 CHANGE# TIME

---------- ------- ------------------ ---------- -----------

         1 ONLINE  FILE NOT FOUND              0

         2 ONLINE  FILE NOT FOUND              0

         5 ONLINE  FILE NOT FOUND              0

         6 ONLINE  FILE NOT FOUND              0

有四个数据文件需要恢复

 

6 拷贝备份回到原地点 (restore) ,开始恢复数据库 (recover)

restore 过程 :

C:\>copy D:\DATABAK\SYSTEM01.DBF D:\Oracle\ORADATA\TEST\

C:\>copy D:\DATABAK\TEST\INDX01.DBF D:\Oracle\ORADATA\TEST\

C:\>copy D:\DATABAK\TEST\TOOLS01.DBF D:\Oracle\ORADATA\TEST\

C:\>copy D:\DATABAK\TEST\RBS01.DBF.DBF D:\Oracle\ORADATA\TEST\

 

Recover 过程 :

SQL> recover database;

 

ORA-00279: change 1073849 generated at 05/08/200308:58:35 needed for thread 1

ORA-00289: suggestion : D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00311.ARC

ORA-00280: change 1073849 for thread 1 is in sequence #311

 

Specify log: {<RET>=suggested | filename | AUTO | CANCEL}

auto

ORA-00279: change 1073856 generated at 05/08/200309:03:27 needed for thread 1

ORA-00289: suggestion : D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00312.ARC

ORA-00280: change 1073856 for thread 1 is in sequence #312

ORA-00278: log file 'D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00311.ARC' no

longer needed for this recovery

 

ORA-00279: change 1073858 generated at 05/08/200309:11:43 needed for thread 1

ORA-00289: suggestion : D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00313.ARC

ORA-00280: change 1073858 for thread 1 is in sequence #313

ORA-00278: log file 'D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00312.ARC' no

longer needed for this recovery

 

ORA-00279: change 1073870 generated at 05/08/200309:11:46 needed for thread 1

ORA-00289: suggestion : D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00314.ARC

ORA-00280: change 1073870 for thread 1 is in sequence #314

ORA-00278: log file 'D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00313.ARC' no

longer needed for this recovery

 

Log applied.

Media recovery complete.

 

7 打开数据库,检查数据库的数据(完全恢复)

SQL> alter database open;

Database altered.

SQL> select * from test;

                         A

---------------------------------------

                         1

                         2

 

说明:

1 、只要有备份与归档存在,就可以实现数据库的完全恢复(不丢失数据) ;

2 、适合于丢失大量数据文件,或包含系统数据文件在内的数据库的恢复 ;

3 、恢复过程在 mount 下进行,如果恢复成功,再打开数据库, down 机时间可能比较长一些。

 

4.3.2 RMAN 备份方案

RMAN 备份归档模式下损坏(丢失)多个数据文件,进行整个数据库的恢复

1 、连接数据库,创建测试表并插入记录

 

SQL> connect internal/password as sysdba;

Connected.

SQL> create table test(a int);

Table created

SQL> insert into test values(1);

1 row inserted

SQL> commit;

Commit complete

 

2 、备份数据库

DOS C:>\ rman cmdfile=bakup.rcv msglog=backup.log;

 

以下是 backup.log 内容。

Recovery Manager: Release 8.1.6.0.0 - Production

RMAN> #     script:bakup.rcv

2> #     creater:chenjiping

3> #     date:5.8.2003

4> #     desc:backup all database datafile in archive with rman

5>

6> #connect database

7> connect rcvcat rman/rman@back;

8> connect target internal/virpure;

9>

10> #start backup database

11> run{

12> allocate channel c1 type disk;

13> backup full tag 'dbfull' format 'd:\backup\full%u_%s_%p' database

14> include current controlfile;

15> sql 'alter system archive log current';

16> release channel c1;

17> }

18> #end

19>

 

RMAN-06008: connected to recovery catalog database

RMAN-06005: connected to target database: TEST (DBID=1788174720)

RMAN-03022: compiling command: allocate

RMAN-03023: executing command: allocate

RMAN-08030: allocated channel: c1

RMAN-08500: channel c1: sid=15 devtype=DISK

RMAN-03022: compiling command: backup

RMAN-03023: executing command: backup

RMAN-08008: channel c1: starting full datafile backupset

RMAN-08502: set_count=4 set_stamp=494074368 creation_time=15-MAY-03

RMAN-08010: channel c1: specifying datafile(s) in backupset

RMAN-08522: input datafile fno=00002 name=D:\Oracle\ORADATA\TEST\RBS01.DBF

RMAN-08522: input datafile fno=00001 name=D:\Oracle\ORADATA\TEST\SYSTEM01.DBF

RMAN-08011: including current controlfile in backupset

RMAN-08522: input datafile fno=00005 name=D:\Oracle\ORADATA\TEST\TOOLS01.DBF

RMAN-08522: input datafile fno=00004 name=D:\Oracle\ORADATA\TEST\TEMP01.DBF

RMAN-08522: input datafile fno=00006 name=D:\Oracle\ORADATA\TEST\INDX01.DBF

RMAN-08522: input datafile fno=00003 name=D:\Oracle\ORADATA\TEST\USER01.DBF

RMAN-08013: channel c1: piece 1 created

RMAN-08503: piece handle=D:\BACKUP\FULL04EN5UG0_4_1 comment=NONE

RMAN-08525: backup set complete, elapsed time: 00:01:16

RMAN-03023: executing command: partial resync

RMAN-08003: starting partial resync of recovery catalog

RMAN-08005: partial resync complete

RMAN-03022: compiling command: sql

RMAN-06162: sql statement: alter system archive log current

RMAN-03023: executing command: sql

RMAN-03022: compiling command: release

RMAN-03023: executing command: release

RMAN-08031: released channel: c1

Recovery Manager complete.

到这里表示备份成功。

 

3 继续在测试表中插入记录

SQL> insert into test values(2);

1 row inserted

SQL> commit;

Commit complete

SQL> select * from test;

                         A

---------------------------------------

                         1

                         2

SQL>alter system switch logfile;

System altered.

SQL> alter system switch logfile;

System altered.

 

4 关闭数据库,模拟丢失数据文件

SQL> shutdown immediate;

Database closed.

Database dismounted.

Oracle instance shut down

C:\>del D:\Oracle\ORADATA\TEST\SYSTEM01.DBF

C:\>del D:\Oracle\ORADATA\TEST\INDX01.DBF

C:\>del D:\Oracle\ORADATA\TEST\TOOLS01.DBF

C:\>del D:\Oracle\ORADATA\TEST\RBS01.DBF

 

5 、启动数据库,检查错误

SQL> STARTUP

Oracle instance started.

Total System Global Area  102020364 bytes

Fixed Size                    70924 bytes

Variable Size              85487616 bytes

Database Buffers           16384000 bytes

Redo Buffers                  77824 bytes

Database mounted.

ORA-01157: cannot identify/lock data file 1 - see DBWR trace file

ORA-01110: data file 1: 'D:\Oracle\ORADATA\TEST\SYSTEM01.DBF'

 

查询 v$recover_file

SQL> select * from v$recover_file;

 

     FILE# ONLINE  ERROR                 CHANGE# TIME

---------- ------- ------------------ ---------- -----------

         1 ONLINE  FILE NOT FOUND              0

         2 ONLINE  FILE NOT FOUND              0

         5 ONLINE  FILE NOT FOUND              0

         6 ONLINE  FILE NOT FOUND              0

可以知道有四个数据文件需要恢复 .

 

6 、利用 RMAN 进行恢复

C:\>rman

Recovery Manager: Release 8.1.6.0.0 - Production

RMAN> connect rcvcat rman/rman@back

RMAN-06008: connected to recovery catalog database

RMAN> connect target internal/virpure

RMAN-06005: connected to target database: TEST (DBID=1788174720)

RMAN> run{

2> allocate channel c1 type disk;

3> restore database;

4> recover database;

5> sql 'alter database open';

6> release channel c1;

7> }

 

RMAN-03022: compiling command: allocate

RMAN-03023: executing command: allocate

RMAN-08030: allocated channel: c1

RMAN-08500: channel c1: sid=17 devtype=DISK

RMAN-03022: compiling command: restore

RMAN-03025: performing implicit partial resync of recovery catalog

RMAN-03023: executing command: partial resync

RMAN-08003: starting partial resync of recovery catalog

RMAN-08005: partial resync complete

RMAN-03022: compiling command: IRESTORE

RMAN-03023: executing command: IRESTORE

RMAN-08016: channel c1: starting datafile backupset restore

RMAN-08502: set_count=4 set_stamp=494074368 creation_time=15-MAY-03

RMAN-08089: channel c1: specifying datafile(s) to restore from backup set

RMAN-08523: restoring datafile 00001 to D:\Oracle\ORADATA\TEST\SYSTEM01.DBF

RMAN-08523: restoring datafile 00002 to D:\Oracle\ORADATA\TEST\RBS01.DBF

RMAN-08523: restoring datafile 00003 to D:\Oracle\ORADATA\TEST\USER01.DBF

RMAN-08523: restoring datafile 00004 to D:\Oracle\ORADATA\TEST\TEMP01.DBF

RMAN-08523: restoring datafile 00005 to D:\Oracle\ORADATA\TEST\TOOLS01.DBF

RMAN-08523: restoring datafile 00006 to D:\Oracle\ORADATA\TEST\INDX01.DBF

RMAN-08023: channel c1: restored backup piece 1

RMAN-08511: piece handle=D:\BACKUP\FULL04EN5UG0_4_1 tag=DBFULL params=NULL

RMAN-08024: channel c1: restore complete

RMAN-03023: executing command: partial resync

RMAN-08003: starting partial resync of recovery catalog

RMAN-08005: partial resync complete

RMAN-03022: compiling command: recover

RMAN-03022: compiling command: recover(1)

RMAN-03022: compiling command: recover(2)

RMAN-03022: compiling command: recover(3)

RMAN-03023: executing command: recover(3)

RMAN-08054: starting media recovery

RMAN-03022: compiling command: recover(4)

RMAN-06050: archivelog thread 1 sequence 327 is already on disk as file D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00327.ARC

RMAN-06050: archivelog thread 1 sequence 328 is already on disk as file D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00328.ARC

RMAN-06050: archivelog thread 1 sequence 329 is already on disk as file D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00329.ARC

RMAN-06050: archivelog thread 1 sequence 330 is already on disk as file D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00330.ARC

RMAN-03023: executing command: recover(4)

RMAN-08515: archivelog filename=D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00327.ARC thread=1 sequence=327

RMAN-08515: archivelog filename=D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00328.ARC thread=1 sequence=328

RMAN-08055: media recovery complete

RMAN-03022: compiling command: sql

RMAN-06162: sql statement: alter database open

RMAN-03023: executing command: sql

RMAN-03022: compiling command: release

RMAN-03023: executing command: release

RMAN-08031: released channel: c1

RMAN>

 

7 检查数据库的数据(完全恢复)

SQL> select * from test;

                         A

---------------------------------------

                         1

                         2

 

说明:

1 、只要有备份与归档存在, RMAN 也可以实现数据库的完全恢复(不丢失数据) ;

2 、同 OS 备份数据库恢复,适合于丢失大量数据文件,或包含系统数据文件在内的数据库的恢复 ;

3 、目标数据库在 mount 下进行,如果恢复成功,再打开数据库 ;

4 RMAN 的备份与恢复命令相对比较简单并可靠,建议有条件的话,都采用 RMAN 进行数据库的备份。

 

4.4 不完全恢复案例

 

4.4.1 OS 备份下的基于时间的恢复

 

不完全恢复可以分为基于时间的恢复,基于改变的恢复与基于撤消的恢复,这里已基于时间的恢复为例子来说明不完全恢复过程。

 

基于时间的恢复可以不完全恢复到现在时间之前的某一个时间,对于某些误操作,如删除了一个数据表,可以在备用恢复环境上恢复到表的删除时间之前,然后把该表导出到正式环境,避免一个人为的错误。

 

1 连接数据库,创建测试表并插入记录 :

SQL> connect internal/password as sysdba;

Connected.

SQL> create table test(a int);

Table created

SQL> insert into test values(1);

1 row inserted

SQL> commit;

Commit complete

 

2 备份数据库,这里最好备份所有的数据文件,包括临时数据文件 :

SQL> @hotbak.sql 或在 DOS svrmgrl @hotbak.sql

或冷备份也可以

 

3 删除测试表,假定删除前的时间为 T1 ,在删除之前,便于测试,继续插入数据并应用到归  

档。

SQL> insert into test values(2);

1 row inserted

SQL> commit;

Commit complete

SQL> select * from test;

                         A

---------------------------------------

                         1

                         2

SQL> alter system switch logfile;

Statement processed.

SQL> alter system switch logfile;

Statement processed.

 

SQL> select to_char(sysdate,'yyyy-mm-dd hh24:mi:ss') from dual;

TO_CHAR(SYSDATE,'YY

-------------------

2003-05-21 14:43:01

SQL> drop table test;

Table dropped.

 

4 准备恢复到时间点 T1 ,找回删除的表,先关闭数据库 :

SQL> shutdown immediate;

Database closed.

Database dismounted.

Oracle instance shut down.

 

5 拷贝刚才备份的所有数据文件回来

C:\>copy D:\DATABAK\*.DBF D:\Oracle\ORADATA\TEST\

 

6 启动到 mount

SQL> startup mount;

Oracle instance started.

Total System Global Area  102020364 bytes

Fixed Size                    70924 bytes

Variable Size              85487616 bytes

Database Buffers           16384000 bytes

Redo Buffers                  77824 bytes

Database mounted.

 

7 开始不完全恢复数据库到 T1 时间

SQL> recover database until time '2003-05-21:14:43:01';

ORA-00279: change 30944 generated at 05/21/200314:40:06 needed for thread 1

ORA-00289: suggestion : D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00191.ARC

ORA-00280: change 30944 for thread 1 is in sequence #191

 

Specify log: {<RET>=suggested | filename | AUTO | CANCEL}

auto

Log applied.

Media recovery complete.

8 打开数据库,检查数据

SQL> alter database open resetlogs;

 

Database altered.

SQL> select * from test;

                         A

---------------------------------------

                         1

                         2

 

说明:

1 、不完全恢复最好备份所有的数据,冷备份亦可,因为恢复过程是从备份点往后恢复的,如果因为其中一个数据文件的时间戳 (SCN) 大于要恢复的时间点,那么恢复都是不可能成功的 ;

2 、不完全恢复有三种方式,过程都一样,仅仅是 recover 命令有所不一样,这里用基于时间的恢复作为示例 ;

3 、不完全恢复之后,都必须用 resetlogs 的方式打开数据库,建议马上再做一次全备份,因为 resetlogs 之后再用以前的备份恢复是很难了 ;

4 、以上是在删除之前获得时间,但是实际应用中,很难知道删除之前的实际时间,但可以采用大致时间即可,或可以采用分析日志文件 (logmnr) ,取得精确的需要恢复的时间 ;

5 、一般都是在测试机后备用机器上采用这种不完全恢复,恢复之后导出 / 导入被误删的表回生产系统 .

 

4.4.2 RMAN 备份下的基于改变的恢复

以上用 OS 备份说明了一个基于时间的恢复,现在用 RMAN 说明一个基于改变的恢复

 

1 连接数据库,创建测试表并插入记录

 

SQL> connect internal/password as sysdba;

Connected.

SQL> create table test(a int);

Table created

SQL> insert into test values(1);

1 row inserted

SQL> commit;

Commit complete

 

2 备份数据库

C:\>rman

Recovery Manager: Release 8.1.6.0.0 - Production

RMAN> connect rcvcat rman/rman@back

RMAN-06008: connected to recovery catalog database

RMAN> connect target internal/virpure

RMAN-06005: connected to target database: TEST (DBID=874705288)

 

RMAN> run{

2> allocate channel c1 type disk;

3> backup full tag 'dbfull' format 'd:\backup\full%u_%s_%p' database

4> include current controlfile;

5> sql 'alter system archive log current';

6> release channel c1;

7> }

 

    // 屏幕输出内容冗长,省略 -- 编辑

RMAN>

 

3 删除测试表,在删除之前,便于测试,继续插入数据并应用到归档,并获取删除前的 scn 号。

SQL> insert into test values(2);

1 row inserted

SQL> commit;

Commit complete

SQL> select * from test;

                         A

---------------------------------------

                         1

                         2

SQL> alter system switch logfile;

Statement processed.

SQL> alter system switch logfile;

Statement processed.

 

SQL> select max(ktuxescnw * power(2, 32) + ktuxescnb) scn from x$ktuxe;

       SCN

----------

  31014

SQL> drop table test;

Table dropped.

 

4 准备恢复到 SCN 31014 ,先关闭数据库,然后启动到 mount

SQL> shutdown immediate;

Database closed.

Database dismounted.

Oracle instance shut down.

SQL> startup mount;

 

5 开始恢复到改变点 SCN 31014

RMAN> run{

2>      allocate channel c1 type disk;

3>      restore database;

4>      recover database until scn 31014;

5>      sql 'ALTER DATABASE OPEN RESETLOGS';

6>      release channel c1;

7> }

 

RMAN-03022: compiling command: allocate

RMAN-03023: executing command: allocate

RMAN-08030: allocated channel: c1

RMAN-08500: channel c1: sid=10 devtype=DISK

RMAN-03022: compiling command: restore

RMAN-03022: compiling command: IRESTORE

RMAN-03023: executing command: IRESTORE

RMAN-08016: channel c1: starting datafile backupset restore

RMAN-08502: set_count=1 set_stamp=494613682 creation_time=21-MAY-03

RMAN-08089: channel c1: specifying datafile(s) to restore from backup set

RMAN-08523: restoring datafile 00001 to D:\Oracle\ORADATA\TEST\SYSTEM01.DBF

RMAN-08523: restoring datafile 00002 to D:\Oracle\ORADATA\TEST\RBS01.DBF

RMAN-08523: restoring datafile 00003 to D:\Oracle\ORADATA\TEST\USERS01.DBF

RMAN-08523: restoring datafile 00004 to D:\Oracle\ORADATA\TEST\TEMP01.DBF

RMAN-08523: restoring datafile 00005 to D:\Oracle\ORADATA\TEST\TOOLS01.DBF

RMAN-08523: restoring datafile 00006 to D:\Oracle\ORADATA\TEST\INDX01.DBF

RMAN-08023: channel c1: restored backup piece 1

RMAN-08511: piece handle=D:\BACKUP\FULL01ENMD5I_1_1 tag=DBFULL params=NULL

RMAN-08024: channel c1: restore complete

RMAN-03023: executing command: partial resync

RMAN-08003: starting partial resync of recovery catalog

RMAN-08005: partial resync complete

RMAN-03022: compiling command: recover

RMAN-03022: compiling command: recover(1)

RMAN-03022: compiling command: recover(2)

RMAN-03022: compiling command: recover(3)

RMAN-03023: executing command: recover(3)

RMAN-08054: starting media recovery

RMAN-03022: compiling command: recover(4)

RMAN-06050: archivelog thread 1 sequence 191 is already on disk as file D:\ORACL

E\ORADATA\TEST\ARCHIVE\TESTT001S00191.ARC

RMAN-06050: archivelog thread 1 sequence 192 is already on disk as file D:\ORACL

E\ORADATA\TEST\ARCHIVE\TESTT001S00192.ARC

RMAN-03023: executing command: recover(4)

RMAN-08515: archivelog filename=D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00191.AR

C thread=1 sequence=191

RMAN-08515:archivelog filename=D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00192.ARC

Thread=1 sequence=192

RMAN-08055: media recovery complete

RMAN-03022: compiling command: sql

RMAN-06162: sql statement: ALTER DATABASE OPEN RESETLOGS

RMAN-03023: executing command: sql

RMAN-03022: compiling command: release

RMAN-03023: executing command: release

RMAN-08031: released channel: c1

 

6 检查数据

Database altered.

SQL> select * from test;

                         A

---------------------------------------

                         1

                         2

可以看到,表依然存在。

 

说明:

1 RMAN 也可以实现不完全恢复,方法比 OS 备份恢复的方法更简单可靠;

2 RMAN 可以基于时间,基于改变与基于日志序列的不完全恢复,基于日志序列的恢复可以指定恢复到哪个日志序列,如

run { 

        allocate channel ch1 type disk; 

        allocate channel ch2 type 'sbt_tape';

        set until logseq 1234 thread 1;

        restore controlfile to '$Oracle_HOME/dbs/cf1.f' ; 

        replicate controlfile from '$Oracle_HOME/dbs/cf1.f';

         alter database mount; 

        restore database; 

        recover database; 

        sql "ALTER DATABASE OPEN RESETLOGS";

}

3 与所有的不完全恢复一样,必须在 mount 下, restore 所有备份数据文件,需要 resetlogs

4 基于改变的恢复比基于时间的恢复更可靠,但是可能也更复杂,需要知道需要恢复到哪一个改变号 (SCN) ,在正常生产中,获取 SCN 的办法其实也有很多,如查询数据库字典表 (V$archived_log or v$log_history) ,或分析归档与联机日志 (logmnr) 等。

第五章 其它恢复案例

5.1 损坏联机日志的恢复方法

5.1.1 损坏非当前联机日志

大家都清楚,联机日志分为当前联机日志和非当前联机日志,非当前联机日志的损坏是比较简单的,一般通过 clear 命令就可以解决问题。


1
、启动数据库,遇到 ORA-00312 or ORA-00313 错误,如

ORA-00313: open failed for members of log group 1 of thread 1

ORA-00312: online log 1 thread 1: 'D:\Oracle\ORADATA\TEST\REDO01.LOG'

从这里我们知道日志组 1 的数据文件损坏了

从报警文件可以看到更详细的信息

2 查看 V$log 视图

SQL> select group#,sequence#,archived,status from v$log;

 

    GROUP#      SEQUENCE# ARCHIVED STATUS

---------- ---------- -------- ----------------

         1          1     YES      INACTIVE

         2          2     YES      INACTIVE

         3          3     NO       CURRENT

可以知道,该组是非当前状态,而且已经归档。

3 CLEAR 命令重建该日志文件

SQL>alter database clear logfile group 1;

如果是该日志组还没有归档,则需要用

SQL>alter database clear unarchived logfile group 1;

4 打开数据库,重新备份数据库

SQL>alter database open;

 

说明:

1 、如果损坏的是非当前的联机日志文件,一般只需要 clear 就可以重建该日志文件,但是如果该数据库处于归档状态但该日志还没有归档,就需要强行 clear

2 、建议 clear ,特别是强行 clear 后作一次数据库的全备份;

3 、此方法适用于归档与非归档数据库。

 

5.1.2 损坏当前联机日志

 

归档模式下当前日志的损坏有两种情况,

一、是数据库是正常关闭,日志文件中没有未决的事务需要实例恢复,当前日志组的损 坏就可以直接用 alter database clear unarchived logfile group n 来重建。

二、是日志组中有活动的事务,数据库需要媒体恢复,日志组需要用来同步,有两种补救办法 :

A.  最好的办法就是通过不完全恢复,可以保证数据库的一致性,但是这种办法要求在归档方式下,并且有可用的备份

B.  通过强制性恢复,但是可能导致数据库不一致。


下面分别用来说明这两种恢复方法:

 

5.1.2.1 通过备份来恢复

1 打开数据库,会遇到一个类似的错误

ORA-00313: open failed for members of log group 1 of thread 1

ORA-00312: online log 1 thread 1: 'D:\Oracle\ORADATA\TEST\REDO01.LOG'

ORA-27041: unable to open file

OSD-04002: unable to open file

O/S-Error: (OS 2) 系统找不到指定的文件

 

2 查看 V$log ,发现是当前日志

SQL> select group#,sequence#,archived,status from v$log;

 

    GROUP#      SEQUENCE# ARCHIVED STATUS

--------- ---------- -------- ----------------

         1          1     NO       CURRENT

         2          2     YES      INACTIVE

         3          3     YES      INACTIVE

 

3 发现 clear 不成功

SQL> alter database clear unarchived logfile group 1;

alter database clear unarchived logfile group 1

*

ERROR at line 1:

ORA-01624: log 1 needed for crash recovery of thread 1

ORA-00312: online log 1 thread 1: 'D:\Oracle\ORADATA\TEST\REDO01.LOG'

 

4 拷贝有效的数据库的全备份,并不完全恢复数据库:

可以采用获取最近的 SCN 的办法用 until scn 恢复或用 until cnacel 恢复

recover database until cancel

先选择 auto ,尽量恢复可以利用的归档日志,然后重新

recover database until cancel

这次输入 cancel ,完成不完全恢复,也就是说恢复两次。

如:

SQL> recover database until cancel;

Auto

……

SQL> recover database until cancel;

Cancel;

5 利用 alter database open resetlogs 打开数据库 .

 

说明:

  1 、这种办法恢复的数据库是一致的不完全恢复,会丢失当前联机日志中的事务数据 ;

  2 、这种方法适合于归档数据库并且有可用的数据库全备份 ;

  3 、恢复成功之后,记得再做一次数据库的全备份 ;

  4 、建议联机日志文件一定要实现镜相在不同的磁盘上,避免这种情况的发生,因为任何数据的丢失对于生产来说都是不容许的。

 

5.1.2.2 如果没有备份,进行强制性恢复

1 打开数据库,会遇到一个类似的错误

ORA-00313: open failed for members of log group 1 of thread 1

ORA-00312: online log 1 thread 1: 'D:\Oracle\ORADATA\TEST\REDO01.LOG'

ORA-27041: unable to open file

OSD-04002: unable to open file

O/S-Error: (OS 2) 系统找不到指定的文件

 

2 查看 V$log ,发现是当前日志

SQL> select group#,sequence#,archived,status from v$log;

 

    GROUP#  SEQUENCE# ARCHIVED STATUS

---------- ---------- -------- ----------------

         1          1 NO       CURRENT

         2          2 YES      INACTIVE

         3          3 YES      INACTIVE

 

3 发现 clear 不成功

SQL> alter database clear unarchived logfile group 1;

alter database clear unarchived logfile group 1

*

ERROR at line 1:

ORA-01624: log 1 needed for crash recovery of thread 1

ORA-00312: online log 1 thread 1: 'D:\Oracle\ORADATA\TEST\REDO01.LOG'

 

4 把数据库 down

    SQL>shutdown immediate

 

5 init<sid>.ora 中加入如下参数

     _allow_resetlogs_corruption=TRUE

 

6 重新启动数据库 , 利用 until cancel 恢复

     SQL>recover database until cancel;

     Cancel

如果出错,不再理会,发出

SQL>alter database open resetlogs;

 

7 数据库被打开后,马上执行一个 full export

 

8 shutdown 数据库 , 去掉 _all_resetlogs_corrupt 参数

 

9 重建库

 

10 import 并完成恢复

 

11 、建议执行一下 ANALYZE TABLE ...VALIDATE STRUCTURE CASCADE;

说明:

1 、该恢复方法是没有办法之后的恢复方法,一般情况下建议不要采用,因为该方法可能导致数据库的不一致;

2 、该方法也丢失数据,但是丢失的数据没有上一种方法的数据多,主要是未写入数据文件的已提交或未提交数据;

3 、建议成功后严格执行以上的 7 11 步,完成数据库的检查与分析;

4 、全部完成后做一次数据库的全备份;

5 、建议联机日志文件一定要实现镜相在不同的磁盘上,避免这种情况的发生,因为任何数据的丢失对于生产来说都是不容许的。

5.2 损坏控制文件的恢复方法

 

5.2.1 损坏单个控制文件

损坏单个控制文件是比较容易恢复的,因为一般的数据库系统,控制文件都不是一个,而且所有的控制文件都互为镜相,只要拷贝一个好的控制文件替换坏的控制文件就可以了。

 

1 控制文件损坏,最典型的就是启动数据库出错,不能 mount 数据库

SQL>startup

ORA-00205: error in identifying controlfile, check alert log for more info

查看报警日志文件,有如下信息

alter database  mount

Mon May 26 11:59:52 2003

ORA-00202: controlfile: 'D:\Oracle\oradata\chen\control01.ctl'

ORA-27041: unable to open file

OSD-04002: unable to open file

O/S-Error: (OS 2) 系统找不到指定的文件。

 

2 停止数据库:

SQL>shutdown immediate

 

3 拷贝一个好的控制文件替换坏的控制文件或修改 init.ora 中的控制文件参数,取消这个坏的控制文件。

 

4 重新启动数据:

SQL>startup

 

说明:

1 、损失单个控制文件是比较简单的,因为数据库中所有的控制文件都是镜相的,只需要简单的

拷贝一个好的就可以了;

2 、建议镜相控制文件在不同的磁盘上;

3 、建议多做控制文件的备份,长期保留一份由 alter database backup control file to trace 产生的控制文件的文本备份。


5.2.2
损坏全部控制文件

 

损坏多个控制文件,或者人为的删除了所有的控制文件,通过控制文件的复制已经不能解决问题,这个时候需要重新建立控制文件。

 

同时注意, alter database backup control file to trace 可以产生一个控制文件的文本备份。


以下是详细重新创建控制文件的步骤:

1 关闭数据库

SQL>shutdown immediate;

2 删除所有控制文件,模拟控制文件的丢失

 

3 启动数据库,出现错误,并不能启动到 mount

SQL>startup

ORA-00205: error in identifying controlfile, check alert log for more info

查看报警日志文件,有如下信息

alter database  mount

Mon May 26 11:53:15 2003

ORA-00202: controlfile: 'D:\Oracle\oradata\chen\control01.ctl'

ORA-27041: unable to open file

OSD-04002: unable to open file

O/S-Error: (OS 2) 系统找不到指定的文件。

 

4 关闭数据库

SQL>shutdown immediate;

 

5 internal sys 下运行如下创建控制文件的脚本,注意完整列出联机日志或数据文件的路径,或修改由 alter database backup control file to trace 备份控制文件时产生的脚本,去掉多余的注释即可。

STARTUP NOMOUNT

CREATE CONTROLFILE REUSE DATABASE "TEST" NORESETLOGS NOARCHIVELOG

         MAXLOGFILES 32

         MAXLOGMEMBERS 2

         MAXDATAFILES 254

         MAXINSTANCES 1

         MAXLOGHISTORY 226

LOGFILE

    GROUP 1 'D:\Oracle\ORADATA\TEST\REDO01.LOG'  SIZE 1M,

    GROUP 2 'D:\Oracle\ORADATA\TEST\REDO02.LOG'  SIZE 1M,

    GROUP 3 'D:\Oracle\ORADATA\TEST\REDO03.LOG'  SIZE 1M

DATAFILE

    'D:\Oracle\ORADATA\TEST\SYSTEM01.DBF',

    'D:\Oracle\ORADATA\TEST\RBS01.DBF',

    'D:\Oracle\ORADATA\TEST\USERS01.DBF',

    'D:\Oracle\ORADATA\TEST\TEMP01.DBF',

    'D:\Oracle\ORADATA\TEST\TOOLS01.DBF',

    'D:\Oracle\ORADATA\TEST\INDX01.DBF'

CHARACTER SET ZHS16GBK;

 

-- Recovery is required if any of the datafiles are restored backups,

-- or if the last shutdown was not normal or immediate.

RECOVER DATABASE

--if the last shutdown was not normal or immediate

--noarchive

-- RECOVER DATABASE UNTIL CANCELUSING BACKUP CONTROLFILE

--archive

-- RECOVER DATABASE USING BACKUP CONTROLFILE UNTIL CANCEL

-- Database can now be opened normally.

ALTER DATABASE OPEN;

--if recover database until cancel

--ALTER DATABASE OPEN RESETLOGS;

6 如果没有错误,数据库将启动到 open 状态下。

 

说明:

1 、重建控制文件用于恢复全部数据文件的损坏,需要注意其书写的正确性,保证包含了所有的数据文件与联机日志;

2 、经常有这样一种情况,因为一个磁盘损坏,我们不能再恢复 (store) 数据文件到这个磁盘,因此在 store 到另外一个盘的时候,我们就必须重新创建控制文件,用于识别这个新的数据文件,这里也可以用这种方法用于恢复。

 

5.3 损坏回滚数据文件的恢复方法

回滚段表空间中的一个数据文件丢失或者损坏导致数据库无法识别它,在启动数据库的时候会出现 ORA-1157, ORA-1110 的错误,或者操作系统级别的错误,例如 ORA-7360 。在关闭数据库的时候 (normal 或者 immediate) 会出现 ORA-1116, ORA-1110 的错误,或者操作系统级别的错误,例如 ORA-7368

 

感谢 Coolyl 的辛勤工作,关于回滚段的大部分内容都是摘自他在 itpub 的文章。

 

5.3.1 损坏数据文件,但数据库处于 Open 状态

如果你发现有回滚段的数据文件丢失或者损坏了,而此时的数据库是处于打开的状态下并且在运行,就千万不要关闭数据库了,因为在大多数的情况下打开的时候比关闭的时候好解决问题一些。

 

一般也是存在有两种情况:

A 、是 offline 丢失或损坏的数据文件,然后从一个备份中恢复,执行介质恢复以保持一致性。但是这种情况要求数据库是归档方式下才可以采用的。

B 、是 offline 那个存在丢失或损坏的数据文件所在的整个回滚段表空间,然后删除整个回滚段表空间并重建,但是你必须要杀掉那些在回滚段中已经激活的用户进程才可以 offline 的。

通常第一种情况就比较简单实现,但是更多的用户事务将会出错并且回滚。

 

A 的具体步骤:

1 offline 丢失或损坏的数据文件

ALTER DATABASE DATAFILE '<full_path_file_name>' OFFLINE;

2 从一个有效的备份中恢复。

3 执行以下查询:

SELECT V1.GROUP#, MEMBER, SEQUENCE#

FROM V$LOG V1, V$LOGFILE V2

WHERE V1.GROUP# = V2.GROUP# ;

这个将列出你的所有 redolog 文件以及它们所代表的 sequence numbers

4 恢复数据文件。

RECOVER DATAFILE '<full_path_file_name>'

5 确信你应用了所有的 redolog 文件,直至出现提示信息 "Media recovery complete"

6 online 那个数据文件。

ALTER DATABASE DATAFILE '<full_path_file_name>' ONLINE;

 

B 的具体步骤:

1 offline 存在丢失或损坏的数据文件的回滚段表空间中的所有回滚段。

ALTER ROLLBACK SEGMENT <rollback_segment> OFFLINE;

2 检测当然回滚段的状态。

SELECT SEGMENT_NAME, STATUS FROM DBA_ROLLBACK_SEGS

WHERE TABLESPACE_NAME = '<TABLESPACE_NAME>';

3 删除所有 offline 的回滚段

DROP ROLLBACK SEGMENT <rollback_segment>;

4 处理那些 online 状态的回滚段。

重新执行第二步的查询

如果你已经执行过 offline 操作的回滚段状态仍然是 online ,则说明这个回滚段内有活动的事务。你要接着查询

SELECT SEGMENT_NAME, XACTS ACTIVE_TX, V.STATUS

FROM V$ROLLSTAT V, DBA_ROLLBACK_SEGS

WHERE TABLESPACE_NAME = '<TABLESPACE_NAME>' AND SEGMENT_ID = USN;

如果没有返回结果,则证明存在丢失或损坏的数据文件的回滚段表空间中的所有回滚段都已经被 offline 了,然后重新执行第二步,第三步。如果查询有结果返回,则状态应该是 "PENDING OFFLINE". 接着查看 ACTIVE_TX 列,如果值为 0 ,则表明此回滚段中已经没有未处理的事务了,很快就会被 offline 的,然后等它 offline 后重新执行 2 3 步后跳至第六步。如果值大于 0 ,则继续到第五步。

5 强制那些包含活动事务的回滚段 offline

活动的事务应该被提交或者回滚,执行下面的查询看看哪些用户占用了回滚段:

SELECT S.SID, S.SERIAL#, S.USERNAME, R.NAME "ROLLBACK"

FROM V$SESSION S, V$TRANSACTION T, V$ROLLNAME R

WHERE R.NAME IN ('<PENDING_ROLLBACK_1>', ... ,

'<PENDING_ROLLBACK_N>')

AND S.TADDR = T.ADDR AND T.XIDUSN = R.USN;

最好能直接联系到那些 user 让他们自己去回滚或者提交事务,如果不能做到的话,那就只能强制性的杀掉进程了。

ALTER SYSTEM KILL SESSION '<SID>, <SERIAL#>';

杀掉进程后再过一段时间后回滚段会自动清除那些事务,然后就可以回到第二步继续查询了。

6 删除回滚段。

DROP TABLESPACE <tablespace_name> INCLUDING CONTENTS;

7 重建回滚段并 online 它们。

 

说明:

1 、数据库如果是 open 状态,就可以直接在 open 状态下解决问题,没有必要停下数据库,增加 down 机时间;

2 、不管上上面那种恢复方法都是正常性的恢复,不会引起数据的不一致或错误。

 

5.3.2 数据库关闭,但是数据文件中没有活动事务

 

这种情况下最简单的方法就是 offline drop 掉这个坏了的或者丢失的数据文件,然后以 restricted 模式打开数据库然后删除并且重建包含损坏文件的回滚段表空间。

 

具体步骤如下:

1 确定数据库是正常的关闭的。方法是可以去查看 alert 文件,到最后看是否有如下信息:

"alter database dismount

Completed: alter database dismount"

如果有的话,就证明数据库是正常关闭的,否则就不能用这个方法去恢复。

2 修改 init 参数文件,移去 ROLLBACK_SEGMENTS 中包含的损坏数据文件的回滚段表空间的回滚段,如果你不能确定哪些回滚段是坏的,简单的方法是你可以注释掉整个 ROLLBACK_SEGMENTS

3 restricted 模式去 mount 数据库。

STARTUP RESTRICT MOUNT

4 offline drop 掉那个坏的数据文件

ALTER DATABASE DATAFILE '<full_path_file_name>' OFFLINE DROP;

5 打开数据库

ALTER DATABASE OPEN

如果你看到如下信息 "Statement processed" ,则跳到第 7 步,如果你看到 ORA-604, ORA-376, and ORA-1110 的错误信息,继续第 6 步。

6、    正常的关闭数据库,然后在 init 文件中注释掉 ROLLBACK_SEGMENTS ,并加入隐含参数

_corrupted_rollback_segments = ( <rollback1>,...., <rollbackN> )

然后以 restricted 模式打开数据库

STARTUP RESTRICT

7 删除掉那个包含损坏文件的回滚段表空间。

DROP TABLESPACE <tablespace_name> INCLUDING CONTENTS;

8 重建回滚段表空间,记得创建后要把回滚段都 online

9 重新使数据库对所有用户可用。

ALTER SYSTEM DISABLE RESTRICTED SESSION;

10 、然后正常关闭数据库,修改 init 文件,如果开始只是注释掉了 ROLLBACK_SEGMENTS 的,就去掉注释即可,如果加了隐含参数的,注释掉它,并在 ROLLBACK_SEGMENTS 加入所有的回滚段。

11 、正常启动数据库:

Startup

说明

1 、这种方法的前提条件是数据库是正常关闭(不是 abort )可用;

2 、这种方法是正常方法,不会引起数据错误。

 

5.3.3 数据库关闭,数据文件中有活动事务,没有可用备份。

一般造成这种原因的情况是采用了 shutdown abort 或其它原因异常关机(如断电)导致的。

 

1 、开启一个事务

SQL> set transaction use rollback segment rbs0;

Transaction set.

SQL> insert into test (a) values (1);

1 row created.

 

2 、异常关闭

SQL> shutdown abort;

Oracle instance shut down.

 

3 、删除 rbs 的一个数据文件

C:>del D:\Oracle\oradata\chen\rbs01.

 

4 、修改 INIT<sid>.ora :

rollback_segments=(system)

添加 _corrupted_rollback_segments=(rbs0,rbs1,rbs2 …… )

 

5 SQL>Startup mount

 

6 SQL>alter database datafile 'd:\Oracle\oradata\t8i\rbs01.dbf' offline drop;

数据库已更改。

 

7 SQL>recover database

完成介质恢复。

 

8 SQL>alter database open ;

数据库已更改。

 

9 SQL>select * from v$rollname;

 

         USN    NAME

----   -------

         0       SYSTEM

 

10 SQL>select segment_name,tablespace_name,status
FROM dba_rollback_segs;

SEGMENT_NAME TABLESPACE_NAME      STATUS

----------- ------ ------------------------------------

SYSTEM        SYSTEM               ONLINE

RBS0          RBS                  NEEDS RECOVERY

RBS1          RBS                   NEEDS RECOVERY

RBS2          RBS                  NEEDS RECOVERY

 

11 SQL>drop rollback segment rbs0;

重算段已丢弃。

    SQL>drop rollback segment rbs1;

重算段已丢弃。

    SQL>drop rollback segment rbs2;

重算段已丢弃。

 

12 SQL>select segment_name,tablespace_name,status
FROM dba_rollback_segs;

SEGMENT_NAME TABLESPACE_NAME   STATUS

-------------------------------------

SYSTEM        SYSTEM            ONLINE

 

13 SQL>drop tablespace rbs including contents;

表空间已丢弃。

 

14 、重建新的回滚表空间及回滚段,并联机。

 

15 SQL>shutdown abort

 

16 、再修改 INIT<sid>.ora

rollback_segments=(rbs0,rbs1,rbs2)

_corrupted_rollback_segments=(rbs0,rbs1,rbs2) 去掉。

 

17 SQL>startup

 

说明:

1 、这种办法是万不得以的时候使用的方法,如果有备份,都建议从备份上进行恢复;

2 、这种方法恢复的数据库,可能会引起数据库的数据错误;

3 、恢复成功以后,建议 exp/imp 数据,并重新分析检查数据库。


5.3.4
数据库关闭,数据文件中有活动事务,从备份恢复

1 、从一个有效的备份中恢复损坏的数据文件。

2 mount 数据库。

3 、执行以下查询:

SELECT FILE#, NAME, STATUS FROM V$DATAFILE;

如果发现要恢复的文件是 offline 状态的话,要先 online 它:

ALTER DATABASE DATAFILE '<full_path_file_name>' ONLINE;

4 、执行以下查询

SELECT V1.GROUP#, MEMBER, SEQUENCE#, FIRST_CHANGE#

FROM V$LOG V1, V$LOGFILE V2

WHERE V1.GROUP# = V2.GROUP# ;

这个将列出 redlog 文件所代表的 sequence first change numbers

 

5 、如果数据库是非归档情况下,执行以下查询:

SELECT FILE#, CHANGE# FROM V$RECOVER_FILE;

如果 CHANGE# 大于最小的 redolog 文件的 FIRST_CHANGE# ,则数据文件可以被恢复,记得在应用日志的时候要把所有 redolog 文件全部应用一遍。

如果 CHANGE# 小于最小的 redolog 文件的 FIRST_CHANGE# ,则数据文件就不可以被恢复了,这时候你要从一个有效的全备份中去恢复数据库了,如果没有全备份的话,那你就只能把数据库强制打开到一个不一致的状态去 exp 出数据,然后重新建库导入数据,因为这种方式的恢复 Oracle 是不推荐用户自己做的,所以这里我就不详细说明了。

 

6 、恢复数据文件:

RECOVER DATAFILE '<full_path_file_name>'

7 、确信你应用了所有的 redolog 文件,直至出现提示信息 "Media recovery complete"

8 、打开数据库。

说明:

1 、这种方法要求在归档有备份的方式下进行,而且是建议方式;

2 、这种方法不会导致数据库的错误。

5.4 损坏临时数据文件的恢复方法

 

临时数据文件的恢复是比较简单的,因为临时文件中不涉及到其它的有用的数据,所以可以删除后重建。

1 、关闭数据库:

SQL>shutdown immediate

2 、删除临时数据文件,模拟媒体失败;

 

3 、启动数据库,检测到文件错误;

 

4 、脱机该数据文件:

SQL>alter database datafile ' 文件名全名 ' offline drop;

 

5 、打开数据库

SQL>alter database open

 

6 、删除该临时表空间

SQL>drop tablespace temp( 或其它临时表空间名称 );

 

7 、重新创建该表空间,并重新分配给用户。

说明:

1 、临时数据文件是非重要文件,不保存永久数据,可以随时删除重建,不影响数据库的数据安全;

2 、如果重新建立以后,别忘了重新分配给用户。

第六章. 常见恢复误区

1 可以不需要备份,只有归档就能进行数据库的向前的恢复

:这个在 Oracle 9i 以前起码是不可能的,在别的数据库我也没有听说过,不完全恢复的主要思路是利用不完全点之前的备份,加上归档日志,恢复到不完全恢复点, 9i 中出现了一个 flashback 的特性,这个特性的使用,也是有很多局限的。

2 进行不完全恢复只需要拷贝一个需要恢复的备份数据文件

:不完全恢复需要拷贝所有的数据文件,最好包括临时数据文件在内,否则需要另外的处理,如果有一个数据文件的 SCN 大于不完全恢复点,那么这个恢复都将是失败的。


3
使用 RMAN 目录与目标数据库在同一数据库能很好进行数据库的恢复

:使用恢复目录与目标数据库在同一个数据库中,将存在很大的恢复局限,如该数据库的系统数据文件的损害,数据库根本不能 open ,那么 RMAN 也就无法连接恢复目录,也就不存在恢复了。

第七章. 小结


这里我们反复演示了多种情况下的恢复方案,通过这些演示,我们应该掌握了如下内容:

1 、利用 OS RMAN 进行各种常规备份与恢复。

2 、熟悉没有备份或简单的非常规备份与恢复的方法。

 

转载  http://epub.itpub.net/5/1.htm

posted on 2007-03-16 13:45 Peter Pan 阅读(389) 评论(0)  编辑  收藏 所属分类: DB

只有注册用户登录后才能发表评论。


网站导航: