2swan
[AIX] mirror disk 교체 (dump 유무) 본문
▶ mirror disk 교체
1. 모델 확인
# uname -uM
2. 디스크 오류 확인
# errpt
# errpt -aj [오류코드]
3. 디스크 포맷 형식 확인 (pdisk인지 JBOD인지)
# lsdev -Cc disk
- Availabel : 현재 사용 가능한 상태
- defined : ODM에 정보가 등록되어 있으나 하드웨어적으로 이상이 있거나 서버와 연결이 되어 있지 않은 상태
- RAID로 되어 있으면 pdisk 포맷 형식, SAS Disk로 되어 있으면 JBOD 포맷 형식
diag 확인 방법
# diag
> Task Selection
>> RAID Array Manager
>>> IBM SAS Disk Array Manager
>>>> List SAS Disk Array Configration
>>>>> sissas0 Available ~
일반적인 디스크(JBOD)형식 : SAS Disk Drive
※ JBOD(Just Bunch Of Disk) :
Raid용으로 구성되어 있지 않은 컴퓨터 하드디스크를 낮춰부르는 용어이며여러 개의 디스크를 논리적인 하나의 디스크로 만들어 사용할 수는 있으나 Raid에서 기대할 수 있는 내고장성이나 성능 향상과 같은 이점은 제공하지 않는다.
4. rootvg stale 확인
# lsvg -l rootvg : 디스크 폴트 상태면 syncd가 stale인 LV 존재
5. 디스크가 폴트난 위치 확인
# lscfg -vl [disk명]
Hardware Location Code에서 P3-D2이 물리적인 디스크 위치
파트 주문시 FRU Number인 10N7232
예를 들어 구글링으로 IBM 9117-MMA system parts 검색 후 디스크 쪽 URL 살펴보면 10N7232 파트 넘버가 있는 걸 알 수 있음,
IBM 9117-MMA location으로 검색하면 디스크 위치가 어디인지 알 수 있다.
6. 디스크 폴드난 곳에 lg_dumplv 파일 있는지 확인
# lspv -l hdisk0 | wc -l
# lspv -l hdisk1 | wc -l
카운트 숫자가 하나 더 많은 곳이 lg_dumplv가 위치한 곳
7. lg_dump 파일이 fault 디스크에 있다면 해결 할 방법 (택 1)
7-1. fault 디스크에서 lg_dumplv를 삭제하고, 새 디스크로 교체한 뒤 다시 생성
# sysdumpdev -l : dump device 정보
# smitty dump
> Change the Primary Dump Device
>> /dev/sysdumpnull로 변경(변경하지 않으면 지우지 못함)
# smitty rmlv : lg_dumplv 선택 후 제거
※ 디스크 교체한 뒤
# smitty mklv
Logical volume NAME : lg_dumplv
Number of LOGICAL PARTITIONS : 원래 설정했던 PP 사이즈
PHYSICAL VOLUME names : lg_dumplv가 있던 hdisk명
Logical volume TYPE : sysdump
경로 다시 변경
# smitty dump
> Change the Primary Dump Device
>> /dev/lg_dumplv로 변경
7-2. lg_dumplv를 정상 mirror에 복사하고 fault난 디스크에 있던 lg_dumplv는 제거하는 방법
# smitty mklvcopy
# smitty rmlvcopy
7-3. lg_dumplv를 fault난 디스크에서 정상 디스크로 옮기는 방법
(같은 볼륨에 소속되어 있으면 pv끼리 lv가 이동가능하나 dump 파일의 크기가 클 수 있기에 migratepv로 이동하다 시스템이 멈출 우려 있기에 권장하지 않는다)
# smiity migratepv 또는
# migratepv -l lg_dumplv hdisk0 hdisk1 : hdisk0 → hdisk1로 옮긴다. hdisk0의 장애의 경우 안되면 불가능
8. unmirror 작업
안전하게 unmirror 하려면 교체할 디스크를 bootlist에서 제거
# bootlist -m normal hdisk1(남겨둘 디스크)
savebase 명령어로 load된 odm 정보를 boot image 영역에 저장
# bosboot -ad /dev/ipldevice
장애난 미러 디스크 해제 후 hdisk1에 boot 이미지를 심고 bootlist를 hdisk1번이 우선순위가 되도록 변경
# unmirrorvg rootvg hdisk0
# bosboot -ad /dev/hdisk1
# bootlist -m normal hdisk1 hdisk0
or
smitty unmirrorvg
> VOLUME GROUP name
> PHYSICAL VOLUME names : 교체할 디스크
> Number of COPIES of each logical partition : 1
9. vg에서 fault 디스크 제거
reducevg rootvg diskname 명령어를 통해서도 가능
bootdevice를 새로 만들어 옮긴경우 fail 될 수 있다.
reducevg 0d rootvg diskname으로 강제 제거 시도 했을때 dumplv가 아니고 다른게 나오면 지우면 안되고 확인해봐야한다
reducevg가 완료된 이후 lsvg -p rootvg로 상태확인 해야한다
1) # reducevg rootvg hdisk0 : rootvg에서 fault 디스크 제거
2) # lspv : 제거 되었는지 확인 (None)
※ 만약 이 작업에서 hdisk에 LV가 있어서 제거할 수 없다는 내용과 함께 failed가 나타나고 원인이 dump device가 hdisk1 에 있다는 거라면 dump device를 mirgratepv 명령으로 hdisk0으로 옮겨주거나 새로운 dump device를 hdisk0에 만들어준다)
# migratepv hdisk1 hdisk0
or
# smitty migratepv
> SOURCE physical volume name : hdisk1
> DESTINATION physical volumes : hdisk0
> Move only data belonging to this LOGICAL VOLUME? : LV를 지정하지 않으면, hdisk1에 있는 모든 LV가 hdisk0으로 이동한다.
또는
2) # smitty reducevg
> Remove a Physical Volume from a Volume Group
> VOLUME GROUP name : rootvg
> PHYSICAL VOLUME names : 교체할 디스크 명
10. ODM에서 디스크 정보 제거(디스크가 pdisk로 생성된 hdisk이면 레이드 먼저 깨줘야 한다)
# rmdev -dl hdisk1
# lspv : (항목이 없어 졌는지 확인)
11. 물리적으로 디스크 교체
# diag
> Task Selection
>> Hot Plug Task
>>> SCSI and SCSI RAID Hot Plug Manager
>>>> List Hot Swap Enclosuer Devices (odm에서 정보를 제거 했기 때문에 populated로 나타난다)
확인 했으면 뒤로가기 후
Replace/Remove a Device Attached to an SCSI Hot Swap Enclosure Device
populated 부분 Enter → 디스크를 교체 하고 난 뒤 Enter를 누르라고 한다(fault 디스크를 정상 디스크로 교체 후 잠시 기다리고 있다가 초록 불로 점멸하는 것 멈추면 엔터. 해당 화면에서 디스크 선택후 엔터를 하면 rmdev 명령어가 실행되며, 물리적 위치에 주황색 LED가 표시된다.)
*만약 디스크 슬롯이 비워져 있는 상태에서 넣을경우
# diag
> Task Selection
>> Hot Plug Task
>>> SCSI and SCSI RAID Hot Plug Manager
>>>> Attach a Device to an SCSI Hot Swap Enclosure Device
슬롯 선택 후 Enter → 서버에 해당 자리에 LED가 들어온다. 디스크를 꽂아준 후 Enter
12. 새로운 디스크 인식
lspv 해보자
뒤로 간 후 Configure Added/Replaced Devices 엔터
or
# cfgmgr -v
* 특정 장치만 인식하고자 한다면
# cfgmgr -l [장치명]
13. 교체된 디스크 형식 확인
# lsdev -Cc disk
14. rootvg에 교체한 디스크 추가
# extendvg rootvg hdisk0 : (hdisk0이 PVID가 없으면 -f 옵션을 주지 않아도 되지만 PVID가 존재할 경우 데이터가 있을 가능성이 있으므로 데이터 확인 후 -f옵션으로 추가)
# syncvg -v rootvg
15. rootvg 미러
# smitty mirrorvg
> Mirror sync mode : Background(선택 안하면 싱크 되는 동안 어떠한 것도 하지 못함)
> PHYSICAL VOLUME names : hdisk0, hdisk1 둘다 선택해야 미러가 된다
> Number of COPIES of each logical : 2
or
# mirrorvg -S rootvg hdisk0 hdisk1
# while true
> do
> lsvg rootvg | grep -i stale
> sleep 2
> done
16. rootvg 경우 bootlist를 똑같이 만들어 줘야 한다
bootlist 확인
# bootlist -m normal -o
boot image 생성 (두개의 디스크에 부팅 이미지 심어주자)
# bosboot -ad /dev/hdisk0 (새로 교체한 디스크 이름)
# bosboot -ad /dev/hdisk1
booting 순서 hdisk0번 hdisk1 순서로 지정
# bootlist -m normal hdisk0 hdisk1
boot image 갱신 , boot lv가 존재하는 모든 디스크에 boot image추가
# bosboot -ad /dev/ipldevice
*참고
hdisk0인가 제거할 때는 같이 제거되는 경우 있음
# ln /dev/hdisk0 /dev/ipldevice
부팅 디스크 확인
# bootlist -m normal -o
# ipl_varyon -i ('BOOT DEVICE' YES 확인 )
참고:
Disk가 pdisk 형식일 경우 JBOD로 형식 포맷하기
# diag
> Task Selection
> RAID Array Manager
> IBM SAS Disk Array Manager (대부분 여기서 보이지만 장치 형식이 다를 수 있음)
> Change / Show SAS pdisk Status
> Delete an Array Candidate pdisk and Format to JBOD block size
Disk가 JBOD 형식일 경우 pdisk로 형식 포맷하기
# diag
> Task Selection
> RAID Array Manager
> IBM SAS Disk Array Manager (대부분 여기서 보이지만 장치 형식이 다를 수 있음)
> Change / Show SAS pdisk Status
> Create an Array Candidate pdisk and Format to RAID block size
mirror된 rootvg 교체 절차(2)
1. 기존에 mirror가 되어 있었다면 bootlist가 양쪽 disk에 설정 되어 있으니 제거할 디스크를 bootlist에서 없애준다.
# bootlist -m normal -o
# bootlist -m normal 남겨둘 디스크
2. 메모리에 load되어 있는 odm정보를 boot image 영역에 저장
# savebase -v
3. bootimage를 새로 한번 더 심는다
# bosboot -ad /dev/ipldevice
4. unmirror 수행
# unmirrorvg 해당vg 제거할 디스크
# reducevg 해당vg 제거할 디스크
( lg_dumplv가 지워질것이라는 문구가 나오면 'y', 다른 lv 명이 나온다면 해당 lv 확인)
'AIX > System Troubleshooting' 카테고리의 다른 글
RAID 구성된 pdisk 교체 (0) | 2024.11.07 |
---|---|
Fan 에러 해결 방법 (1) | 2024.10.16 |
VRM 에러 해결 방법 (OP Pannel error code : 11002630) (0) | 2024.09.03 |
OP Panel에서 AA00E1B0 코드 (0) | 2024.07.29 |