SharedIT | 묻고 답하기(AMP)

RTX A6000 48G 4개 장착시 1개가 46G로 보입니다.

안녕하세요. 고수님들 

RTX A6000 48G 사용중인데 각각의 슬롯에 꽂히 GPU들은 정상적으로 48G로 보이는데

한개만 46G만 인식하고 있습니다. 

어떤 현상 때문에 그런것인지요?

고수님들 부탁 드립니다. 


Tags : 태그가 없습니다.

9개의 답변이 있습니다.

차니
  0 추천 | 약 2달 전

병렬 연결이면 동기화 위한 버퍼로 잡힌게 아닐련지?(순전히 추측입니다) 자세한 건 제조사에 문의하는시는 빠를 듯 합니다.

wansoo
  0 추천 | 약 2달 전

다른건 모두 Volatile Uncorr. ECC가 off되어 있는데, 표시한 GPU만 0으로 되어 있는게...

설정의 차이가 있기 때문에 다르게 보이는게 아닐까 하는 생각이 드네요.


해당 GPU의 설정 차이 때문에 다르게 보이거나, 아니면 물리적인 원인으로 근본 용량 자체가 적거나 어떤 오류가 있기 때문이 아닐까 싶어 보이네요.



명동쓰레빠
  0 추천 | 약 2달 전

메모리 검사를 실행 해보시길 바랍니다,.


Genghis Khan
  0 추천 | 2달 전

특정 GPU문제라면 해당 GPU의 펌웨어 업데이트를 하면 되지 않을까 싶네요

아니면 해당 슬롯에 정상적으로 인식되는 GPU를 insert해보고 동일 증상이라면 제조사에 문의하시는게 좋을것 같아요

Simon.Park
  0 추천 | 2달 전

시스템 관리용으로 사용되는 영역이 잡혀 있는게 아닐까 하고 저도 추측해 보네요.

정확한 내용을 파악하려면 NVIDIA 에 직접 문의 해 보시는게 제일 빠를꺼같아요.

wansoo
  0 추천 | 2달 전

이런 문제는 NVIDIA 기술 지원 팀으로 문의하는 게 좋지 않을까 싶어 보이네요.

전산 직원이...

이런 분야까지 전문적인 지식을 가지고 있기는 어렵지 않을까 싶네요.

구글이나 ChatGPT가 알려주는 내용을 사실로 가정하고 재 가공해 주는...

참고 자료를 대신 검색해서 알려 주는 정도가 아닐까 싶네요.

앵그리파파
  0 추천 | 2달 전

일부 GPU는 특정 용도를 위해 메모리를 예약하거나 할당할 수 있습니다. 이러한 목적으로 인해 전체 메모리 중 일부가 사용되지 않을 수 있습니다.

간혹 있는 일이지만 GPU 카드 또는 해당 슬롯에 하드웨어적인 결함도 체크해 보세요. 간단하게 확인할 수 있는 방법은 다른 슬롯에는 48G로 인식되는데, 특정 슬롯만 46G로 보이는 경우가 해당됩니다.

마지막으로 GPU 펌웨어 또는 바이오스가 최신버전인지 확인해보세요.

deerokgo
  0 추천 | 2달 전

공유 메모리 때문에 그럴 수도 있습니다.

드라이버 업데이트 또는

실제 메모리 체크하는 프로그램으로 확인 해보시기 바랍니다.

inside07
  0 추천 | 2달 전

그래픽 카드 종류는 다르지만 둘 중 하나일 가능성이 높습니다. 

  • 1.설치 가능한 드라이버 조회 및 설치에서 권고버전 확인
    (저희는 서버에 장착된 그래픽카드 인식 못해서 버전 이슈 케이스 있었습니다. 권고버전 설치 후 정상 인식 했습니다.)

  • 2.드라이버 정상 설치 후에도 인식 못하는 경우, gpu와 pcie 네트워크 어댑터가 제대로 통신을 못하는 상황이어서 커널 매개 변수 추가로 조치 후 정상 인식 했습니다.


위 내용을 직접 확인하기어려운 경우 구매 업체에 확인 요청 해보시는 것도 좋을 듯 합니다.