본문 바로가기
Hardware

InfiniBand 명령: HPC 환경을 위한 종합 가이드

by Yoon_estar 2024. 5. 26.
728x90
반응형

InfiniBand는 낮은 대기 시간과 높은 처리량 기능을 위해 고성능 컴퓨팅(HPC)에 널리 사용되는 고속 네트워킹 기술입니다. 강력한 HPC 네트워크를 설정하고 유지 관리하려면 주요 InfiniBand 명령을 이해하는 것이 필수적입니다. 이 가이드에서는 필수 InfiniBand 명령과 사용법을 다룹니다.

주요 infiniband 명령

ibstat

ibstat 명령은 시스템의 InfiniBand 장치에 대한 자세한 정보를 제공합니다. 포트, 펌웨어 버전 및 GUID에 대한 정보를 포함하여 HCA(호스트 채널 어댑터)의 상태를 표시합니다.

ibstat [options] [DeviceName]

 

공통 옵션

  • d: 현재 디버그 설정을 표시합니다.
  • h: ibstat 명령에 대한 도움말을 표시합니다.
  • i: 네트워크 인터페이스 정보를 표시합니다.
  • n: InfiniBand 노드 정보만 표시합니다.
  • p: InfiniBand 포트 정보만 표시합니다.
  • v: 모든 InfiniBand 장치 정보를 표시합니다.

Example

  • 이 명령은 모든 InfiniBand 장치에 대한 노드 및 포트 정보를 표시합니다.
ibstat -n -p

 

ibping

ibping 명령은 IP 네트워크의 'ping' 명령과 유사하게 InfiniBand 노드 간의 연결을 테스트하는 데 사용됩니다. 한 호스트는 'ibping'을 서버로 실행하고 다른 호스트는 클라이언트로 실행하는 클라이언트-서버 모드에서 작동합니다.

ibping [options] [BaseLID]

공통 옵션

 

  • S: 서버 모드에서 **ibping**을 시작합니다.
  • P <포트>: ibping 명령에 사용할 포트를 지정합니다.
  • d: 디버그 메시지를 활성화합니다.

Example

Base LID 19를 사용하여 포트 1에서 실행되는 서버에 대한 연결을 테스트합니다.

  • 서버
ibping -S -P 1 -d
  • 클라이언트
ibping -P 1 19

 

ibnetdiscover

ibnetdiscover 명령은 InfiniBand 네트워크 토폴로지를 검색하고 HCA, 스위치 및 노드를 포함하여 검색된 모든 장치를 보고합니다.

Example

이 명령은 InfiniBand 패브릭의 자세한 맵을 제공하여 모든 장치 간의 연결을 보여줍니다.

ibnetdiscover

ibchecknet

ibchecknet 명령은 InfiniBand 네트워크 진단을 수행하여 오류 및 연결 문제를 확인합니다.

이 명령은 문제가 있는 포트나 노드를 식별하여 관리자가 네트워크 문제를 해결하는 데 도움을 줍니다.

ibchecknet

 

TIP

  1. 정기 모니터링: ibstat 및 **ibnetdiscover**와 같은 명령을 정기적으로 사용하여 InfiniBand 네트워크의 상태를 모니터링합니다.
  2. 진단: 'ibping' 및 'ibchecknet'을 사용하여 연결 문제를 즉시 진단하고 해결합니다.
  3. 문서화 및 지원: 자세한 지침과 지원은 Mellanox(현재 NVIDIA의 일부)와 같은 공급업체의 공식 문서와 Red Hat 및 IBM과 같은 리소스를 참조하세요.
반응형