AIX 5.3 Install Oracle 10g RAC 错误集锦--磁盘I/O 故障

时间:2023-01-26 08:19:16

AIX 5.3  Install Oracle 10g RAC 错误集锦--磁盘I/O 故障


系统环境:

操作系统: AIX 5300-09

集群软件: CRS 10.2.0.1

数据库:   Oracle 10.2.0.1


                     系统架构图


AIX 5.3  Install Oracle 10g RAC 错误集锦--磁盘I/O 故障

                                       本机采用vg 并发(VG concurrent)作为共享的存储

故障现象:

AIX 5.3  Install Oracle 10g RAC 错误集锦--磁盘I/O 故障

当在第一个node(aix211)执行root.sh时,被hang住......

查看日志:

[root@aix211 soft]#cd /u01/crs_1/log

[root@aix211 aix211]#ls

admin            client           cssd             racg

alertaix211.log  crsd             evmd

[root@aix211 aix211]#cd client/

[root@aix211 client]#ls

ocrconfig_458796.log  ocrconfig_471234.log

[root@aix211 client]#ls -lt

total 24

-rw-r-----    1 root     system          681 May  8 14:57 ocrconfig_458796.log

-rw-r-----    1 root     system         5684 May  8 14:54 ocrconfig_471234.log

[root@aix211 client]#tail -f ocrconfig_458796.log

Oracle Database 10g CRS Release 10.2.0.1.0 Production Copyright 1996, 2005 Oracle.  All rights reserved.

2014-05-08 14:56:08.858: [ OCRCONF][1]ocrconfig starts...

2014-05-08 14:56:08.860: [ OCRCONF][1]Upgrading OCR data

2014-05-08 14:56:27.280: [  OCROSD][1]utread:3: problem reading buffer 100e09f0 buflen 512 retval -1 phy_offset 102400 retry 0

2014-05-08 14:56:27.280: [  OCROSD][1]utread:4: problem reading the buffer errno 5 errstring I/O error

2014-05-08 14:57:03.279: [  OCROSD][1]utread:3: problem reading buffer 100f1b70 buflen 1024 retval -1 phy_offset 102400 retry 0

2014-05-08 14:57:03.279: [  OCROSD][1]utread:4: problem reading the buffer errno 5 errstring I/O error

2014-05-08 14:57:39.279: [  OCROSD][1]utread:3: problem reading buffer 100f1b70 buflen 1536 retval -1 phy_offset 102400 retry 0

2014-05-08 14:57:39.279: [  OCROSD][1]utread:4: problem reading the buffer errno 5 errstring I/O error

出现磁盘的I/O故障!


解决方法:

1、查看PV和VG

[root@aix211 client]#lspv

hdisk0          00040f8aaa29d28e                    rootvg          active

hdisk1          000e1a6ce663b4af                    racvg           concurrent

[root@aix211 client]#lsvg racvg

--查看VG时也 hang 住......看来是共享卷组的磁盘出现了故障,因为是个实验环境,阵列不很稳定,重启系统......


2、重启系统后,重新执行root.sh

3、手工执行安装后校验

[oracle@aix211 ~]$cd /u01/soft/Disk1(CRS 安装盘)

[oracle@aix211 Disk1]$ls

cluvfy        install       response      rootpre       runInstaller  stage         upgrade

[oracle@aix211 Disk1]$cd cluvfy/

[oracle@aix211 cluvfy]$ls

bin           cv            cvupack.zip   jlib          jrepack.zip   lib           lib32         runcluvfy.sh

[oracle@aix211 cluvfy]$./runcluvfy.sh -help

USAGE:

cluvfy [ -help ]

cluvfy stage { -list | -help }

cluvfy stage {-pre|-post} <stage-name> <stage-specific options>  [-verbose]

cluvfy comp  { -list | -help }

cluvfy comp  <component-name> <component-specific options>  [-verbose]


[oracle@aix211 cluvfy]$./runcluvfy.sh stage -post crsinst -n aix211,aix212 -verbose

Performing post-checks for cluster services setup

Checking node reachability...

Check: Node reachability from node "aix211"

 Destination Node                      Reachable?              

 ------------------------------------  ------------------------

 aix211                                yes                    

 aix212                                yes                    

Result: Node reachability check passed from node "aix211".

Checking user equivalence...

Check: User equivalence for user "oracle"

 Node Name                             Comment                

 ------------------------------------  ------------------------

 aix212                                passed                  

 aix211                                passed                  

Result: User equivalence check passed for user "oracle".


Checking Cluster manager integrity...

Checking CSS daemon...

 Node Name                             Status                  

 ------------------------------------  ------------------------

 aix212                                running                

 aix211                                running                

Result: Daemon status check passed for "CSS daemon".

Cluster manager integrity check passed.

Checking cluster integrity...

 Node Name                          

 ------------------------------------

 aix211                              

 aix212                              

Cluster integrity check passed

Checking OCR integrity...

Checking the absence of a non-clustered configuration...

All nodes free of non-clustered, local-only configurations.

Uniqueness check for OCR device passed.

Checking the version of OCR...

OCR of correct Version "2" exists.

Checking data integrity of OCR...

Data integrity check for OCR passed.

OCR integrity check passed.

Checking CRS integrity...

Checking daemon liveness...

Check: Liveness for "CRS daemon"

 Node Name                             Running                

 ------------------------------------  ------------------------

 aix212                                yes                    

 aix211                                yes                    

Result: Liveness check passed for "CRS daemon".

Checking daemon liveness...

Check: Liveness for "CSS daemon"

 Node Name                             Running                

 ------------------------------------  ------------------------

 aix212                                yes                    

 aix211                                yes                    

Result: Liveness check passed for "CSS daemon".

Checking daemon liveness...

Check: Liveness for "EVM daemon"

 Node Name                             Running                

 ------------------------------------  ------------------------

 aix212                                yes                    

 aix211                                yes                    

Result: Liveness check passed for "EVM daemon".

Liveness of all the daemons

 Node Name     CRS daemon                CSS daemon                EVM daemon

 ------------  ------------------------  ------------------------  ----------

 aix212        yes                       yes                       yes      

 aix211        yes                       yes                       yes      

Checking CRS health...

Check: Health of CRS

 Node Name                             CRS OK?                

 ------------------------------------  ------------------------

 aix212                                yes                    

 aix211                                yes                    

Result: CRS health check passed.

CRS integrity check passed.

Checking node application existence...

Checking existence of VIP node application

 Node Name     Required                  Status                    Comment  

 ------------  ------------------------  ------------------------  ----------

 aix212        yes                       exists                    passed    

 aix211        yes                       exists                    passed    

Result: Check passed.

Checking existence of ONS node application

 Node Name     Required                  Status                    Comment  

 ------------  ------------------------  ------------------------  ----------

 aix212        no                        exists                    passed    

 aix211        no                        exists                    passed    

Result: Check passed.

Checking existence of GSD node application

 Node Name     Required                  Status                    Comment  

 ------------  ------------------------  ------------------------  ----------

 aix212        no                        exists                    passed    

 aix211        no                        exists                    passed    

Result: Check passed.

Post-check for cluster services setup was successful.

[oracle@aix211 cluvfy]$

@至此,CRS安装成功,问题解决!


本文出自 “天涯客的blog” 博客,请务必保留此出处http://tiany.blog.51cto.com/513694/1408511