2swan

[AIX] mirror disk 교체 (dump 유무) 본문

AIX/System Troubleshooting

[AIX] mirror disk 교체 (dump 유무)

2swan 2024. 7. 1. 14:42

▶ mirror disk 교체

1. 모델 확인

uname -uM

 

 

 

2. 디스크 오류 확인

errpt

errpt -aj [오류코드]

 

 

 

3. 디스크 포맷 형식 확인 (pdisk인지 JBOD인지)

lsdev -Cc disk

- Availabel : 현재 사용 가능한 상태

- defined : ODM에 정보가 등록되어 있으나 하드웨어적으로 이상이 있거나 서버와 연결이 되어 있지 않은 상태

- RAID로 되어 있으면 pdisk 포맷 형식, SAS Disk로 되어 있으면 JBOD 포맷 형식

 

diag 확인 방법

diag

> Task Selection

>> RAID Array Manager

>>> IBM SAS Disk Array Manager

>>>> List SAS Disk Array Configration

>>>>> sissas0 Available ~

 

일반적인 디스크(JBOD)형식 : SAS Disk Drive

※ JBOD(Just Bunch Of Disk) :

Raid용으로 구성되어 있지 않은 컴퓨터 하드디스크를 낮춰부르는 용어이며여러 개의 디스크를 논리적인 하나의 디스크로 만들어 사용할 수는 있으나 Raid에서 기대할 수 있는 내고장성이나 성능 향상과 같은 이점은 제공하지 않는다.

 

 

 

4. rootvg stale 확인

# lsvg -l rootvg : 디스크 폴트 상태면 syncd가 stale인 LV 존재

 

 

 

5. 디스크가 폴트난 위치 확인

lscfg -vl [disk명]

 

Hardware Location Code에서 P3-D2이 물리적인 디스크 위치

파트 주문시 FRU Number인 10N7232

예를 들어 구글링으로 IBM 9117-MMA system parts 검색 후 디스크 쪽 URL 살펴보면 10N7232 파트 넘버가 있는 걸 알 수 있음,

IBM 9117-MMA location으로 검색하면 디스크 위치가 어디인지 알 수 있다.

 

 

 

6. 디스크 폴드난 곳에 lg_dumplv 파일 있는지 확인

lspv -l hdisk0 | wc -l

lspv -l hdisk1 | wc -l

카운트 숫자가 하나 더 많은 곳이 lg_dumplv가 위치한 곳

 

 

 

7. lg_dump 파일이 fault 디스크에 있다면 해결 할 방법 (택 1)

 

7-1. fault 디스크에서 lg_dumplv를 삭제하고, 새 디스크로 교체한 뒤 다시 생성

sysdumpdev -l : dump device 정보

 

smitty dump

> Change the Primary Dump Device

>> /dev/sysdumpnull로 변경(변경하지 않으면 지우지 못함)

 

smitty rmlv : lg_dumplv 선택 후 제거

 

※ 디스크 교체한 뒤

smitty mklv

Logical volume NAME : lg_dumplv

       Number of LOGICAL PARTITIONS : 원래 설정했던 PP 사이즈

       PHYSICAL VOLUME names : lg_dumplv가 있던 hdisk명

       Logical volume TYPE : sysdump

 

경로 다시 변경

smitty dump

> Change the Primary Dump Device

>> /dev/lg_dumplv로 변경

 

 

 

7-2. lg_dumplv를 정상 mirror에 복사하고 fault난 디스크에 있던 lg_dumplv는 제거하는 방법

smitty mklvcopy

smitty rmlvcopy

 

 

7-3. lg_dumplv를 fault난 디스크에서 정상 디스크로 옮기는 방법

(같은 볼륨에 소속되어 있으면 pv끼리 lv가 이동가능하나 dump 파일의 크기가 클 수 있기에 migratepv로 이동하다 시스템이 멈출 우려  있기에  권장하지 않는다)

# smiity migratepv 또는

# migratepv -l lg_dumplv hdisk0 hdisk1 : hdisk0 → hdisk1로 옮긴다. hdisk0의 장애의 경우 안되면 불가능

 

 

 

8. unmirror 작업 

안전하게 unmirror 하려면 교체할 디스크를 bootlist에서 제거

# bootlist -m normal hdisk1(남겨둘  디스크)

 

savebase 명령어로 load된 odm 정보를 boot image 영역에 저장

# bosboot -ad /dev/ipldevice

 

장애난 미러 디스크 해제 후 hdisk1에 boot 이미지를 심고 bootlist를 hdisk1번이 우선순위가 되도록 변경

unmirrorvg rootvg hdisk0

# bosboot -ad /dev/hdisk1

# bootlist -m normal hdisk1 hdisk0

or

smitty unmirrorvg

> VOLUME GROUP name

> PHYSICAL VOLUME names : 교체할 디스크

> Number of COPIES of each logical partition : 1

 

 

 

9. vg에서 fault 디스크 제거

reducevg rootvg diskname 명령어를 통해서도 가능

bootdevice를 새로 만들어 옮긴경우 fail 될 수 있다.

reducevg 0d rootvg diskname으로 강제 제거 시도 했을때 dumplv가 아니고 다른게 나오면 지우면 안되고 확인해봐야한다

reducevg가 완료된 이후 lsvg -p rootvg로 상태확인 해야한다

1) # reducevg rootvg hdisk0 : rootvg에서 fault 디스크 제거

2) # lspv : 제거 되었는지 확인 (None) 

 

※ 만약 이 작업에서 hdisk에 LV가 있어서 제거할 수 없다는 내용과 함께  failed가 나타나고 원인이 dump device가 hdisk1 에 있다는 거라면 dump device를 mirgratepv 명령으로 hdisk0으로 옮겨주거나 새로운 dump device를 hdisk0에 만들어준다)

# migratepv hdisk1 hdisk0

or

# smitty migratepv

> SOURCE physical volume name : hdisk1

> DESTINATION physical volumes : hdisk0

> Move only data belonging to this LOGICAL VOLUME? : LV를 지정하지 않으면, hdisk1에 있는 모든 LV가 hdisk0으로 이동한다.

 

또는

 

2) # smitty reducevg

> Remove a Physical Volume from a Volume Group

> VOLUME GROUP name : rootvg

> PHYSICAL VOLUME names : 교체할 디스크 명

 

 

 

10. ODM에서 디스크 정보 제거(디스크가 pdisk로 생성된 hdisk이면 레이드 먼저 깨줘야 한다)

rmdev -dl hdisk1

# lspv : (항목이 없어 졌는지 확인)

 

 

 

11. 물리적으로 디스크 교체

diag

> Task Selection

>> Hot Plug Task

>>> SCSI and SCSI RAID Hot Plug Manager

>>>> List Hot Swap Enclosuer Devices (odm에서 정보를 제거 했기 때문에 populated로 나타난다)

 

확인 했으면 뒤로가기 후

Replace/Remove a Device Attached to an SCSI Hot Swap Enclosure Device

populated 부분 Enter → 디스크를 교체 하고 난 뒤 Enter를 누르라고 한다(fault 디스크를 정상 디스크로 교체 후 잠시 기다리고 있다가 초록 불로 점멸하는 것 멈추면 엔터. 해당 화면에서 디스크 선택후 엔터를 하면 rmdev 명령어가 실행되며, 물리적 위치에 주황색 LED가 표시된다.)

 

*만약 디스크 슬롯이 비워져 있는 상태에서 넣을경우

# diag

> Task Selection

>> Hot Plug Task

>>> SCSI and SCSI RAID Hot Plug Manager

>>>> Attach a Device to an SCSI Hot Swap Enclosure Device

슬롯 선택 후 Enter → 서버에 해당 자리에 LED가 들어온다. 디스크를 꽂아준 후 Enter

 

 

 

12. 새로운 디스크 인식

lspv 해보자

뒤로 간 후 Configure Added/Replaced Devices 엔터

or

cfgmgr -v

 

* 특정 장치만 인식하고자 한다면

cfgmgr -l [장치명]

 

 

 

13. 교체된 디스크 형식 확인

lsdev -Cc disk

 

 

 

14. rootvg에 교체한 디스크 추가

extendvg rootvg hdisk0 : (hdisk0이 PVID가 없으면 -f 옵션을 주지 않아도 되지만 PVID가 존재할 경우 데이터가 있을 가능성이 있으므로 데이터 확인 후 -f옵션으로 추가)

# syncvg -v rootvg

 

 

 

15. rootvg 미러

smitty mirrorvg

> Mirror sync mode : Background(선택 안하면 싱크 되는 동안 어떠한 것도 하지 못함)

> PHYSICAL VOLUME names : hdisk0, hdisk1 둘다 선택해야 미러가 된다

> Number of COPIES of each logical : 2

or

mirrorvg -S rootvg hdisk0 hdisk1

 

# while true

> do

> lsvg rootvg | grep -i stale

> sleep 2

> done

 

 

 

16. rootvg 경우 bootlist를 똑같이 만들어 줘야 한다

bootlist 확인

bootlist -m normal -o

 

boot image 생성 (두개의 디스크에 부팅 이미지 심어주자)

bosboot -ad /dev/hdisk0 (새로 교체한 디스크 이름)

# bosboot -ad /dev/hdisk1

 

booting 순서 hdisk0번 hdisk1 순서로 지정

bootlist -m normal hdisk0 hdisk1

 

boot image 갱신 , boot lv가 존재하는 모든 디스크에 boot image추가

bosboot -ad /dev/ipldevice

 

*참고

hdisk0인가 제거할 때는 같이 제거되는 경우 있음

ln /dev/hdisk0 /dev/ipldevice

 

부팅 디스크 확인

bootlist -m normal -o

ipl_varyon -i ('BOOT DEVICE' YES 확인 )

 

 

 

참고:

Disk가 pdisk 형식일 경우 JBOD로 형식 포맷하기

diag

> Task Selection

>  RAID Array Manager

>  IBM SAS Disk Array Manager (대부분 여기서 보이지만 장치 형식이 다를 수 있음)

>  Change / Show SAS pdisk Status

>  Delete an Array Candidate pdisk and Format to JBOD block size

Disk가 JBOD 형식일 경우 pdisk로 형식 포맷하기

#  diag

>  Task Selection

>  RAID Array Manager

>  IBM SAS Disk Array Manager (대부분 여기서 보이지만 장치 형식이 다를 수 있음)

>  Change / Show SAS pdisk Status

>  Create an Array Candidate pdisk and Format to RAID block size

 

 


mirror된 rootvg 교체 절차(2)

 

1. 기존에 mirror가 되어 있었다면 bootlist가 양쪽 disk에 설정 되어 있으니 제거할 디스크를 bootlist에서 없애준다.

# bootlist -m normal -o

# bootlist -m normal 남겨둘 디스크

 

2. 메모리에 load되어 있는 odm정보를 boot image 영역에 저장

# savebase -v

 

3. bootimage를 새로 한번 더 심는다

# bosboot -ad /dev/ipldevice

 

4. unmirror 수행

# unmirrorvg 해당vg 제거할 디스크

# reducevg 해당vg 제거할 디스크

( lg_dumplv가 지워질것이라는 문구가 나오면 'y', 다른 lv 명이 나온다면 해당 lv 확인)

 

 

 

 

 

'AIX > System Troubleshooting' 카테고리의 다른 글

RAID 구성된 pdisk 교체  (0) 2024.11.07
Fan 에러 해결 방법  (1) 2024.10.16
VRM 에러 해결 방법 (OP Pannel error code : 11002630)  (0) 2024.09.03
OP Panel에서 AA00E1B0 코드  (0) 2024.07.29