“파괴적인 성능의 도약” 고대역 메모리(HBM)의 이해

IT 업체는 보통 기존 제품군의 점진적인 성능 개선을 통해 경쟁하지만, 가끔은 진절앜 댌괞적 긤. 지금 엔터 시장 으로 막 진입 하기 시작 한 이러한 파괴 적 기술 하나 하나 가 바로 고대역 메모리 (hbm; memória de largura de banda alta) 다.
ⓒ Banco de Imagens Getty

HBM은 현존 메모리 칩 기술에 비해 훨씬 더 빠르면서 전기 소비량은 더 적고 공간도 덜 차지한다. 리소스 사용량이 많은 고성능 컴퓨팅 (HPC)과 인공지능 (AI) 애플리케이션에서 특히 주목받고 있다. 그러나 높은 가격 열 관리 문제, 그리고 때 에 따라 을 수정 해야 한다는 점 으로 인 해 일상 적 인 비즈니스 애플리케이션 처리 의 의 주류 도입은 아직 이야기 이야기 다.

HBM 작동 방식

HBM은 미국 칩 제조 업체 AMD와 한국의 메모리 칩 공급업체 SK 하이닉스가 함께 개발했다. 두 기업 은 2008 년 부터 개발 을 시작 해 2013 년 에 반도체 업계 기구인 Jedec 컨소시엄 에 을 을 전달 했다. 2016년에 HBM2 표준이 승인된 데 이어 지난 1월 HBM3이 공식 발표됐다. HBM 메모리 칩의 주 제조업체는 한국의 삼성과 SK 하이닉스, 그리고 마이크론 테크놀로지다.

Hbm 은 중앙 처리 장치 (cpu) 와 그래픽 처리 장치 (gpu) 의 에 에 비 해 뒤처지 는 표준 랜덤 액세스 (dram) 의 성능 과 전력 를 를 해결 위해 개발 됐다. 초기 대응책 dram 용량 늘리고 늘리고 에 ram 슬롯 이라고 도 하는 듀얼 인 라인 모듈 모듈 (Dimm) 슬롯을 늘리는 것 이었다.

그러나 문제는 메모리 자체가 아니라 버스에 있었다. 표준 DRAM 버스의 비트 폭은 4~32다. Amd 의 이자 이자 hbm 메모리 개발자 중 한 조 조 에 따르면 hbm 버스 의 비트 폭 은 이 보다 최대 128 배 넓은 넓은 넓은 넓은 넓은 넓은 넓은 넓은 넓은 넓은 넓은 넓은 넓은 넓은 넓은 넓은 넓은 넓은 넓은 넓은 넓은 넓은 넓은 넓은 넓은 넓은 에 에 이른다. 자동차에 비유하면 1 차선 도로와 16차선 도로 중 어느 도로에서 더 많은 차가 다닐 도로 중 어느 도로에서 더 많은 차가 다닐 도로 있을지 새을지 새을지 새가 다닐 도로 있을지 새을지 .

Hbm 기술 은 을 높이기 위해 버스 의 폭 을 넓히는 것 외 에, 메모리 칩 의 크기 를 줄여 새로운 설계 형식 으로 한다 한다. HBM 칩은 원래 그래픽 더블 데이터 레이트(GDDR) 메모리를 대체하기 위해 개발됐다. HBM 칩의 크기는 GDDR 메모리에 비해 매우 작아서 1GB GDDR 메모리 칩의 점유 면적은 672 정곱비리미터인미터인미 점유 면적은 672 정곱비미터인미터인미터인볰 비미터인미터인미터은 35평방밀리미터에 불과하다.

Hbm 은 트랜지스터 를 으로 으로 펼치지 않고 최대 12 개 레이어 높이로 하고 하고 ‘실리콘 관통 전극 (tsv)’ 이라는 기술로 한다 한다. Tsv 는 마치 내 의 엘리베이터 처럼 hbm 칩 레이어 사이 를 움직이는 방법 으로 데이터 비트 비트 의 이동 에 한 시간 을 크게 줄인다. 기판에서 CPU와 GPU 바로 옆에 HBM을 배치하면 CPU/GPU 메모리 간의 데이터 이동에 필요한 전력도 낮아진다력도 낮아진다. CPU é HBM이 직접 통신하므로 DIMM 스틱이 불필요하다. 매크리는 “매우 좁고 매우 빠른 방식 대신 매우 넓고 매우 느린 방식을 택한 것이다”라고 말했다”라고 말했다”.

HBM을 사용하는 제품

엔비디아 의 컴퓨팅 제품 관리 부문 선임 디렉터 인 파레시 카리아 는 dram 은 hpc 용 으로 는 맞지 맞지 않는다 말 했다 했다. DDR 메모리의 성능은 HBM 메모리에 근접할 수 있지만 이를 위해서는 많은 DIMM이 필요하고 열너지 횄윤.

HPC에 HBM을 처음 사용한 업체는 후지쯔다. HPC 작업용으로 설계된 ARM 기반 A64FX 프로세서와 함께 HBM을 사용한다. A64fx 를 탑재 한 후가 (fugaku) ​​슈퍼 컴퓨터 는 2020 년 한 한 시점 부터 슈퍼 컴퓨터 500 순위 에서 1 위 기록 기록 했으며 현재 까지 1 위 를 유지 하고 있다.

엔비디아는 출시 예정인 호퍼(Hopper) GPU 에 HBM3을 사용하며, 그레이스(Grace) CPU 에는 DDR의 변형인 LPDDR5X 긤술을 사욀형인 LPDDR5X 긤술을 사술을. AMD는 인스팅트(Instinct) MI250X 가속기(GPU 기술 기반)에 HBM2E를 사용하며 인텔은 제온 서버 프로세서의 일부 사파이어 래피드(Sapphire Rapids) 세대와 기업용 폰테 베키오(Ponte Vecchio) GPU 가속기에 HBM을 사용할 계획이다.

앞으로 주류 애플리케이션에도 HBM이 쓰일까

전통적으로 기술은 최첨단에서 시작해 주류로 차차 확산한다. 예 를 들어 냉각 은 처음 에는 cpu 에서 성능 을 끌어 내려는 게이머 사이 에서 주로 사용 된 비주류 기술 이었지만, 지금 은 모든 서버 업체 가 프로세서, 특히 ai 프로세서 위한 액체 냉각 방식 을 제공 한다.

HBM도 주류로 진입할 수 있을까? 매크리는 같은 용량에서 HBM과 DDR의 가격 차이를 2:1 정도로 예상했다. 즉, 1GB HBM의 비용은 1GB DDR5의 2배 이상이다. 만일 메모리에 그 정도의 프리미엄을 지불한다면 투자에 상응하는 효과를 원하게 된다. 매크리는 “TCO 공식에서 성능은 분모에 위치하고 모든 비용은 분자에 위치한다. 성능이 2 배가 되면 TCO도 2 배로 좋아진다. 따라서 TCO 를 개선 위한 최선의 최선의 방법 은 이다 ”라고 말 했다 (매크리는 간단 한 설명 을 위해 비용 은 일정 하다 고 했다 했다).

퓨 처럼 리서치 (pesquisa futurum) 의 애널리스트 애널리스트 다니엘 뉴먼 은 두 가지 이유 에서 hbm 이 주류 로 편입 되지 것 으로 예상 했다 했다. 첫 번째 비용이다. 뉴먼은 “비싸면 주류 시장에서 폭넓게 사용되지 않을 것이고 출하 물량도 줄어들게 된다”라고 말했들게 된다”라고 말했들게 된다”라고.

두 번째 문제는 발열이다. 이미 냉각이 필요한 CPU에 5개 이상의 메모리 칩이 더해져 같은 쿨러를 공유하게 된다. 뉴먼 은 이 이 은 매우 작은 패키지 에서 많은 전력 을 사용 하게 이로 인 인 해 열 문제 가 발생 한다는 을 의미 한다. HBM을 사용하는 모든 프로세서에는 극히 효율적인 열 관리 기능이 필요하다”라고 말했다. 결국 ai 와 hpc 에서 와 같은 가속기 를 사용 하는 경우 가속기 를 구매 해 운영 해 얻는 성과 만큼 비용도 더 것 이다 이다.

HBM을 사용하려면 애플리케이션을 수정해야 할까

2 제목 2 메모리 에서 떠오르는 그다음 질문 은 hpc 와 ai 앱 이 hbm 메모리 모든 모든 능력 을 자동 으로 활용 하는지 재설계 가 필요 한지다 한지다. 전문가들은 애플리케이션을 처음에 어떻게 만들었는지에 따라 답이 달라진다고 말한다.

카리아는 “많은 경우 애플리케이션 개발자는 시스템 기능상의 제약을 우회한다. 따라서 경우 따라 새로운 기능 을 반영 해 애플리케이션 을 재설계 하거나 업데이트 해야 할 수 있다 ”라고 말 했다. 매크리는 “애플리케이션 의 성능 메모리 대역폭 에 에 제한 되는 경우 애플리케이션 을 수정 하지 않아도 성능 이 향상 된다” 라고 말 했다. 단, 메모리 지연 에 제한 제한 경우 에는 Hbm 과 비교 메모리 간 의 본질 적 인 인 지연 차이 이외의 속도 은 없다. 이와 같은 애플리케이션은 수정해서 지연 현상을 유발하는 종속성을 제거해야 한다.

매크리 에, 많은 애플리케이션 을 동시 에 하는 부하가 시스템 에 가해지는 경우 에는 애플리케이션 성능 이 지연 에 의해 제한 성능 이 향상 될 가능성 이 높다. HBM의 부하 지연이 더 낮기 때문이다. 카리아 역시 앱이 어떻게 만들어졌는지에 따라 답이 달라진다고 봤다. 그 는 기존 앱 이 메모리 또는 지연과 다양 한 제약 을 우회 만들어진 만들어진 경우 개발자 는 새로운 기능 을 반영 애플리케이션 을 재설계 하거나 업데이트 해야 해야.

HBM을 사용하려면 CPU에서 GPU로 전환해야 할까

또 다른 문제는 프로세서 아키텍처다. 오브 젝티브 애널리 시스 (análise objetiva) 의 애널리스트 애널리스트 핸디 에 따르면, hbm 은 단일 명령 다중 데이터 (sIMD) 프로세서 에서 되는데 되는데, simd 는 일반 적 인 서버 프로세서 와 완전히 다르게 프로그램 된다는 는 일반 적 했다 서버 서버 프로세서 와 완전히 다르게 프로그램 된다는 점 을 강조 했다. X86과 ARM은 SIMD가 아니지만 GPU e SIMD다. 핸디 는 일반 일반 프로세서 실행 되는 되는 프로그램 은 SIMD 아키텍처 활용 하도록 재구성 하고 재컴 파일 해야 한다 한다. HBM이 뭔가를 바꿔서 그런 것이 아니라 프로세서 유형의 문제다”라고 말했다.

HBM 기술은 계속 발전한다

현재 판매되는 HBM 버전은 HBM2E지만 JEDEC는 지난 1월 HBM3의 최종 사양을 공개했다. HBM3은 같은 전압에서 HBM2E에 비해 작동 온도가 낮다. 또한 Hbm3 은 Hbm2 에 비 해 핀당 데이터 전송률 이 배로, 최대 6.4GB/S 에 이르고 독립 채널 수도 수도 8 개 에서 16 개로 두 배로 늘어난다. 그 외의 다른 여러 성능 향상이 적용된다.

Sk 하이닉스, 삼성, 마이크론 등 모든 주요 메모리 가 가 hbm3 제품 을 개발 있으며, 엔비디아 의 호퍼 gpu 를 시작 으로 서서히 제품 이 출시 출시 시작 할 것 를. 현재 시점에서 HBM 사용은 최고 성능 제품에 국한된다. 카리아는 “이 CPU(그레이스)의 설계에서 지향하는 워크로드가 있다. 예 들어 엑셀 이나 마이크로 소프트 오피스 가 아니라 데이터 센터 애플리케이션 분야 빛 빛 을 발하도록 설계 됐다 ”라고 말 했다.
[email protected]


Source: ITWorld Korea by www.itworld.co.kr.

*The article has been translated based on the content of ITWorld Korea by www.itworld.co.kr. If there is any problem regarding the content, copyright, please leave a report below the article. We will try to process as quickly as possible to protect the rights of the author. Thank you very much!

*We just want readers to access information more quickly and easily with other multilingual content, instead of information only available in a certain language.

*We always respect the copyright of the content of the author and always include the original link of the source article.If the author disagrees, just leave the report below the article, the article will be edited or deleted at the request of the author. Thanks very much! Best regards!