2swan
AIX 서버 점검 OS 본문
● OS 정보 확인
- OS : AIX
- Hostname : localhost
- OS Version : 7.1
- 펌웨어 정보 : 00C2CBD04C00
- 머신 타입 : 9117-MMA
- 시리얼번호 : 02를 제외한 102CBD0
$ oslevel -s
7100-07-02-1340
- 버전 : 7.1 (5300 : 5.3, 6100 : 6.1 의미)
- TL(Technical Level) 혹은 ML(Mechanical Level) : TL을 올리게 되면 소프트웨어와 하드웨어의 신규 서비스가 추가됨을 의미(숫자가 높을 수록 최신)
- SP(Service Pack) : 보안관련 사항이나 버그 Fix 등을 의미, 패치 개념
- 릴리즈 시기 : 1340은 2013년 40주차에 나온 버전을 의미한다. (일종의 버전 날짜 개념)
>> 마이그레이션 혹은 업그레이드, 다운그레이드 시 참고할 자료가 된다
>> ex) 6100-10-05을 7100-05-07로 업그레이드 하려할 때, TL, SP 등 6100-10-05이 더 최신버전으로 업그레이드 시 최신버전으로 가는게 아니라, 퇴행을 의미하여 마이그레이션 및 정상 부팅이 되지 않을 수 있다.
현재 설치된 TL 목록과 누락된 TL 레벨
# instfix -i | grep ML
# oslevel -rl : ex) oslevel -rl 7100-05
현재 설치된 SP목록과 누락된 SP 파일 셋
# instfix -i | grep SP
# oslevel -sl : ex) oslevel -sl 71-05-024516
전체 시스템 사양
# prtconf
네트워크 ip
# ifconfig -a
CPU
# lsattr -El proc0
Frequency 클럭 수가 높을 수록 빠름
smt_enabled : smit 기능 on
smt_threads : 스레드 개수
코어 개수
# lsdev -Cc processor : 물리적인 개수
# bindprocessor -q : 논리적인 개수
smt가 어떤식으로 기능하는지
# smtctl
펌웨어
# ismcode -c
LVM(mirroring)
# lsvg -p rootvg : stale 여부 확인
FileSystem
# df -g : /와 /tmp 사용률 확인
I/O Device
# lsdev -Cc adapter
Available : 현재 커스터마이징 되었고 사용 중 상태
Defined : 현재 커스터마이징 되었지만 사용 중이 아닌상태
bootlist
# bootlist -m normal -o : 순서 변경하고자 하면 -o 대신 hdisk 입력
errpt
# errpt
Timestamp 예 ) 0612102224 : 6월 12일 10시 22분 24년
T, C : Type, Class
Type(에러유형)
P : 영구적인 / T : 임시 / I : 정보 / U : 알 수 없음
PERM(Permanent) : 시스템 자체적으로 에러 복원 불가능한 상태
TEMP(Temporary) : 시스템 자체적으로 복원을 위한 시도 후에 정상상태로 복원된상태를 알림.
(일시적인 메시지이나 확인 필요)
PERF(Performance) device :성능 혹은 구성요소가 허용 레벨보다 저하된 상태
PEND(Pending) : 에러로 인하여 device 혹은 구성요소가 사용불가능한 상태로 될 것이 임박한 상태
UNKN(Unknown) : 알려지지 않은 에러 유형
INFO(Information) : 특정 메시지를 알리기 위한 단순 정보성 메시지
Class(에러 클래스)
H (Hardware) 하드웨어 에러
S (Software) 소프트웨어 에러
O (errlogger Messages)
U (Undetermined) 알려지지 않은 오류
하드웨어 에러 로그 확인
# errpt -d H
에러 코드 자세히 보기
# errpt -aj [에러 코드] | pg
하드웨어적인 에러 로그는 위치와 FRU 를 확인
에러코드 클리어
# errclear 0
dump
# /usr/lib/ras/dumpcheck -p : 덤프 파일 체크. 아무것도 나오지 않아야 정상
# sysdumpdev -l : 메모리가 4GB 이상일 때 생기는 파일이 lg_dumplv이며, dump에는 서버가 죽거나 행에 걸릴 경우 모든 기록은 dump에 저장한다
이 기록을 내려 받기
# snap -r : 기존 snap log 제거
# snap -gc : 현재 에러 관련
# snap -ac : 메모리에서 연산 되었던 모든 것(/tmp에 여유 용량이 있는지 확인 후 사용)
/tmp/ibmsupt 디렉토리에 snap.pax.z 파일이 생기고 IBM Ecurep에 업로드 후 분석을 받으면 된다
dump size
# sysdumpdev -e
dump 설정 변경
# smit dump
재부팅 후 덤프가 잘 받아졌는지 확인
# sysdumpdev -L : dump status 3이면 dump가 받아졌어도 확인 불가능 상태이며 숫자 0이 나와야 잘 된 것
Memory
# lsattr -El mem0
# rmss -r
# lscfg -vp | grep -i dumm : 메모리가 몇 개인지 확인(한칸이 하나)
# lscfg -vp | grep -i size
# lscfg -vp | grep -ip dimm : 메모리 정보 추가적으로 확인
Paging Space
# vmstat 1 10 : 1초마다 10번
# lsps -as
# topas
# nmon
paging space에서 $used는 여지껏 사용한 것 중 가장 높은 사용중일 때의 기록
파일셋확인
# lslpp -l |pg
# lslpp -l | grep -i applie : 다음 버전으로 넘어갈 때 commit 하고 그 전에는 applie로 사용
파일셋 설치하다 오류난 것이 있는지 확인
# lppchk -v : 아무것도 나오지 않으면 정상
Network status
# entstat -d ent0 | pg : 물리적인 어댑터 확인
아래 속성 중 숫자 0이 아니면 문제 있다는 것
DMA Underrun : 0
DMA Overrun : 0
Lost CTS Errors : 0
Alignment Errors : 0
EtherChannel 확인
# lsdev -Cc adpter
라우팅 테이블 확인
# netstat -rn
# lsattr -El inet0
네트워크 특정 작업은 smitty로 작업해야 odm에 저장된다
# smitty route -> add a static route
1. 드라이브 용량 점검 ( 90% 이상 존재하는 디렉터리 있을 경우)
# df -gP
2. 에러 검사 ( Type 항목에 P가 나타날 때)
# errpt -d H
3. 메모리 검사 ( pi, po가 지속적으로 0보다 크게 나타날 때 시스템이 느려질 수 있다 )
- pi : Paging 공간으로부터 Page in 되는 초당 Page 수
- po : Paging 공간으로 Page out 되는 초당 Page 수
# vmstat 1
4. 디스크 상태 검사 ( Available 하지 않은 디스크가 나타날 때 )
# lsdev -Cc disk
5. 디스크 개수 확인 ( active 하지 않은 디스크가 발견될 때 )
# lspv
6. LAN or FC card 확인
# lsdev -Cc adapter
7. 메모리 검사
# lsdev -Cc memory
'AIX' 카테고리의 다른 글
AIX 이전에 사용한 명령어 사용 및 자동완성 (0) | 2024.05.21 |
---|---|
AIX IP 변경 (0) | 2024.05.21 |
AIX 명령어 모음 (0) | 2024.05.20 |
AIX OS 7.1 설치 방법 (0) | 2024.05.20 |
AIX Edition (0) | 2024.05.20 |