2swan

AIX 서버 점검 OS 본문

AIX

AIX 서버 점검 OS

2swan 2024. 5. 20. 17:59

● OS 정보 확인

  • OS : AIX
  • Hostname : localhost
  • OS Version : 7.1
  • 펌웨어 정보 : 00C2CBD04C00
  • 머신 타입 : 9117-MMA
  • 시리얼번호 : 02를 제외한 102CBD0
$ oslevel -s

7100-07-02-1340

- 버전 : 7.1 (5300 : 5.3, 6100 : 6.1 의미)

- TL(Technical Level) 혹은 ML(Mechanical Level) : TL을 올리게 되면 소프트웨어와 하드웨어의 신규 서비스가 추가됨을 의미(숫자가 높을 수록 최신)

- SP(Service Pack) : 보안관련 사항이나 버그 Fix 등을 의미, 패치 개념

- 릴리즈 시기 : 1340은 2013년 40주차에 나온 버전을 의미한다. (일종의 버전 날짜 개념)
>> 마이그레이션 혹은 업그레이드, 다운그레이드 시 참고할 자료가 된다
>> ex) 6100-10-05을 7100-05-07로 업그레이드 하려할 때, TL, SP 등 6100-10-05이 더 최신버전으로 업그레이드 시 최신버전으로 가는게 아니라, 퇴행을 의미하여 마이그레이션 및 정상 부팅이 되지 않을 수 있다.

 

현재 설치된 TL 목록과 누락된 TL 레벨

# instfix -i | grep ML

# oslevel -rl  : ex) oslevel -rl 7100-05

 

현재 설치된 SP목록과 누락된 SP 파일 셋

# instfix -i | grep SP

# oslevel -sl : ex) oslevel -sl 71-05-024516

 

전체 시스템 사양

# prtconf

 

네트워크 ip

# ifconfig -a

 

CPU

# lsattr -El proc0

Frequency 클럭 수가 높을 수록 빠름

smt_enabled : smit 기능 on

smt_threads : 스레드 개수

 

코어 개수

# lsdev -Cc processor : 물리적인 개수

# bindprocessor -q : 논리적인 개수

 

smt가 어떤식으로 기능하는지

# smtctl

 

펌웨어

# ismcode -c

 

LVM(mirroring)

# lsvg -p rootvg : stale 여부 확인

 

FileSystem

# df -g : /와 /tmp 사용률 확인

 

I/O Device

# lsdev -Cc adapter

Available : 현재 커스터마이징 되었고 사용 중 상태

Defined : 현재 커스터마이징 되었지만 사용 중이 아닌상태

 

bootlist

# bootlist -m normal -o : 순서 변경하고자 하면 -o 대신 hdisk 입력

 

errpt

# errpt

 

Timestamp 예 ) 0612102224 : 6월 12일 10시 22분 24년

 

T, C : Type, Class

Type(에러유형)

P : 영구적인 / T : 임시 / I : 정보 / U : 알 수 없음

 

PERM(Permanent) : 시스템 자체적으로 에러 복원 불가능한 상태

TEMP(Temporary) : 시스템 자체적으로 복원을 위한 시도 후에 정상상태로 복원된상태를 알림.

(일시적인 메시지이나 확인 필요)

PERF(Performance) device :성능 혹은 구성요소가 허용 레벨보다 저하된 상태

PEND(Pending) : 에러로 인하여 device 혹은 구성요소가 사용불가능한 상태로 될 것이 임박한 상태

UNKN(Unknown) : 알려지지 않은 에러 유형

INFO(Information) : 특정 메시지를 알리기 위한 단순 정보성 메시지

 

Class(에러 클래스)

H (Hardware) 하드웨어 에러

S (Software) 소프트웨어 에러

O (errlogger Messages)

U (Undetermined) 알려지지 않은 오류

하드웨어 에러 로그 확인

# errpt -d H

에러 코드 자세히 보기

# errpt -aj [에러 코드] | pg

하드웨어적인 에러 로그는 위치와 FRU 를 확인

에러코드 클리어

# errclear 0

 

dump

# /usr/lib/ras/dumpcheck -p : 덤프 파일 체크. 아무것도 나오지 않아야 정상

 

# sysdumpdev -l : 메모리가 4GB 이상일 때 생기는 파일이 lg_dumplv이며, dump에는 서버가 죽거나 행에 걸릴 경우 모든 기록은 dump에 저장한다

 

이 기록을 내려 받기

# snap -r : 기존 snap log 제거

# snap -gc : 현재 에러 관련

# snap -ac : 메모리에서 연산 되었던 모든 것(/tmp에 여유 용량이 있는지 확인 후 사용)

 

/tmp/ibmsupt 디렉토리에 snap.pax.z 파일이 생기고 IBM Ecurep에 업로드 후 분석을 받으면 된다

 

dump size

# sysdumpdev -e

 

dump 설정 변경

# smit dump

 

재부팅 후 덤프가 잘 받아졌는지 확인

# sysdumpdev -L : dump status 3이면 dump가 받아졌어도 확인 불가능 상태이며 숫자 0이 나와야 잘 된 것

 

Memory

# lsattr -El mem0

# rmss -r

# lscfg -vp | grep -i dumm : 메모리가 몇 개인지 확인(한칸이 하나)

# lscfg -vp | grep -i size

# lscfg -vp | grep -ip dimm : 메모리 정보 추가적으로 확인

 

Paging Space

# vmstat 1 10 : 1초마다 10번

# lsps -as

# topas

# nmon

paging space에서 $used는 여지껏 사용한 것 중 가장 높은 사용중일 때의 기록

 

파일셋확인

# lslpp -l |pg
# lslpp -l | grep -i applie : 다음 버전으로 넘어갈 때 commit 하고 그 전에는 applie로 사용

 

파일셋 설치하다 오류난 것이 있는지 확인

# lppchk -v : 아무것도 나오지 않으면 정상

 

Network status

# entstat -d ent0 | pg : 물리적인 어댑터 확인

 

아래 속성 중 숫자 0이 아니면 문제 있다는 것

DMA Underrun : 0

DMA Overrun : 0

Lost CTS Errors : 0

Alignment Errors : 0

 

EtherChannel  확인

# lsdev -Cc adpter

 

라우팅 테이블 확인

# netstat -rn

# lsattr -El inet0

 

네트워크 특정 작업은 smitty로 작업해야 odm에 저장된다

# smitty route -> add a static route

 

 


 

1. 드라이브 용량 점검 ( 90% 이상 존재하는 디렉터리 있을 경우)

# df -gP

 

2. 에러 검사 ( Type 항목에 P가 나타날 때)

# errpt -d H

 

3. 메모리 검사 ( pi, po가 지속적으로 0보다 크게 나타날 때 시스템이 느려질 수 있다 )

- pi : Paging 공간으로부터 Page in 되는 초당 Page 수

- po : Paging 공간으로 Page out 되는 초당 Page 수

# vmstat 1

 

4. 디스크 상태 검사 ( Available 하지 않은 디스크가 나타날 때 )

# lsdev -Cc disk

 

5. 디스크 개수 확인 ( active 하지 않은 디스크가 발견될 때 )

# lspv

 

6. LAN or FC card 확인

# lsdev -Cc adapter

 

7. 메모리 검사

# lsdev -Cc memory

'AIX' 카테고리의 다른 글

AIX 이전에 사용한 명령어 사용 및 자동완성  (0) 2024.05.21
AIX IP 변경  (0) 2024.05.21
AIX 명령어 모음  (0) 2024.05.20
AIX OS 7.1 설치 방법  (0) 2024.05.20
AIX Edition  (0) 2024.05.20