vSphere HA (High Availability)란?
1. vSphere HA란?
vCenter에 HA는 2가지 종류가 있다. 1) vCenter HA 2)vCenter에서 제공하는 Host HA 기능이다.
해당 게시글에서는 2)번 항목인 Host의 HA를 설명하려고 한다.
Host(물리서버)가 문제가 발생 할 경우 해당 Host 내에 있는 VM을 다른 Host로 이동을 하게 한다. 즉 고가용성을 제공하기 위한 기능이다.
2. 조건 및 제약사항
a) vCenter와 연동
b) 동일한 공유 스토리지 사용 여부
c) MTU 변경시에 영향이 생긴다 (vDS, vVS)
d) FDM , Hostd, vCenter Server 필요,
ESXi 내에는 FDM, vpxa, hostd 3개의 서비스가 존재한다.
Hostd의 경우에는 ESXi 설치 시 자동 실행이 되며, vpxa는 Host가 vCenter에 연동이 되면 실행이 된다.
FDM의 경우에는 vCenter에서 HA기능을 활성화 하면 서비스가 구동 된다.
FDM의 경우에는 마스터FDM(Primary), 서브FDM으로 2가지 형태로 나뉜다.
Primary의 경우 30초 간격으로 스토리지를 확인하며, Sub의 경우에는 10분 간격으로 서비스를 체크한다
HA기능에서 VM을 마이그레이션 하게 되는데 이때 해당 VM에 대한 조건을 줄 수 있다.
VM의 상태를 ON/OFF 및 데이터 스토어 상태 확인
*사용 Port : TCP,UDP 8182
*FDM : 호스트와 VM의 정보를 vCenter로전달 → vCenter와 vSphere 호스트 등록시 FQDN 방식의 등록 권장 6.5 버전 이후 FDQN으로 구성을 진행 하더라도 IP 베이스로 통신 FDM log 확인
3. 프로세스 및 서비스 확인
HA 클러스터 생성 → vCenter에서 HA Agent가 ESXi 설치 ( /etc/init.d/vmware-fdm) → HA 구성 후 vCenter에서 관리하지 않음, 또한 vCenter에서 장애 발생 시 클러스터 영향 없음
HA 비활성화
클러스터에서 HA를 비활성화 상태이다. vSphere HA 및 Proactive HA 둘 다 해제 된 모습
HA 활성화
클러스터에서 HA를 활성화 상태이다. vSphere HA 활성화 상태이며, Proactive HA는 비활성화 한 상태이다.
Proactive HA는 세부적으로 VM 및 스토리지에 대한 정책을 관리 할 수 있다.
Primary Host ( 스토리지 상태 체크 로그 확인 ) - 30초 간격
Sub Host ( HA 상태 체크 로그 확인 ) - 10분 간격
4. 서비스 및 구성정보 확인
a) 클러스터 → 모니터 → vSphere HA → 구성 문제 → 역할 확인
b) FDM과 관련 있는 파일 경로
C-1) /var/log/fdm.log 마스터, 서브에 따라 로그가 다름.
C-2 ) /var/log/vmware/fdm/fdm.cfg
C-3 ) /var/log/vmware/fdm/fdm-profiler-1.log
5. Proactive HA
Proactiva HA는 자동화 수준 : 호스트 접근, 유지보수모드, VM 마이그레이션 유무 설정
a) 수동 : 수동으로 진행
b) 자동 : Proactive HA 설정 기준에 따라 진행
업데이트 적용 : 성능 저하 시 호스트 어떻게 할지 결정
a) 모든 실패에 대한 차단 모드 (Default) : VM 영향 없으면 서비스 이용
b) 심각한 상태일때 유지 보수 모드 , 보통 실패에 대한 차단 모드 : VM에 성능이 형향을 받지 않았지만 성능저하가 심하면유비조수모드
c) 모든 실패에대한 유지 보수모드 : VM 서비스 문제 발생 시 호스트 실행 되지 않도록 함
6. 실패 및 응답
A) 호스트 실패 응답 : 호스트 페일 오버 및 VM 우선 순위 정리
B) 호스트 분리에 대한 응답 : VM에 대한 상태 확인 / 호스트 장애 이후 VM에 재기동, 전원 종료 후 재기동
C) PDL이 있는 데이터스토어 (영구적 디바이스 손실)
D) APD가 있는 데이터스토어 ( 모든 경로 다운 )
E) VM 모니터링 : VMTools와 하트비트 시간 내에 수신되지 않으면 해당 VM 재설정
7. 승인 제어
승인 제어는 페일오버 용량을 확보하기 위해 vSphere HA에서 사용하는 정책이다. Host의 장애 수에 따라 비율을 산정을 해서 사용할 리소스를 미리 할당을 한다. VMware Docs에서는 1대기 기준으로 산정이 되어 있다. 실제로 1,2,3대씩 증가 될때마다 예약된 리소스가 각기 다르며, 1/n 형식을 유지하다가 어느 지점에 가면 특정 수치로 고정이 되어있다.
보통 Host가 많이 않은 곳은 0%의 비율로 할당 하기도 하며, vMotion을 사용하는 포트의 nic카드의 성능이 좋지 못 할 경우 설정한다.
학습 후 작성된 글입니다.
설명이 잘 못 된 부분이 있다면,
너그럽게 이해 부탁드립니다.
+댓글로 알려주세요!
+글이 도움이 되셨다면 하단 ❤️ Click!
+소통 환영합니다!
'# VMware > [ vCenter ]' 카테고리의 다른 글
[VMware/vCener] Clearing BACKUP_STORES certificates in the VCSA via shell script (0) | 2023.01.24 |
---|---|
[VMware/vCenter] vCenter란? (1) | 2020.10.25 |