학회소식

THE KOREAN MICROELECTRONICS
AND PACKAGING SOCIETY

[전자신문] AI 기술 가속하는 머신러닝 최적화된 IPU

  • 작성일자

    2021-08-26 00:00
  • 조회수

    436

AI 기술 가속하는 머신러닝 최적화된 IPU

[AI∙빅데이터 솔루션] 머신러닝에 최적화된 AI 프로세서, 그래프코어 IPU

지난 몇 년간, 인공지능(AI)은 4차 산업혁명의 핵심 기술로 전세계적으로 서 국내외 불문, 업계 내 가장 ‘핫한’ 주제로 거론되고 있다. 정부에서도 향후 2030년까지 2000여개의 AI 스마트 공장을 구축목표와 AI를 통한 지능화 경제효과를 최대 455조 창출할 것으로 국가차원의 ‘AI 국가 전략’을 최근 발표하면서 인공지능 산업 육성에 적극 나서고 있다.

그런데 AI 관련 기업들이 넘어서야 할 장벽은 컴퓨팅이다. 인간의 학습능력과 추론능력, 지각능력, 자연언어의 이행능력 등을 실현해내는 AI 기술은 많은 데이터를 빠르게 처리해 기존의 컴퓨팅보다 전력 소모가 크다. 초기 AI 학습과 추론에는 기성 컴퓨터의 중앙처리장치(CPU)나 그래픽처리장치(GPU)가 쓰였지만, 그 효율성은 이미 한계에 도달했다. 전례 없는 워크로드를 효과적으로 지원하기 위해 AI에 특화된 프로세서가 그 대안으로서 등장했다.

AI 워크로드 한계를 넘는 지능형 처리장치 IPU

영국의 AI 반도체 스타트업 그래프코어가 개발한 지능형 처리장치 IPU(Intelligence Processing Unit)에 기업들이 주목하고 있다. IPU는 CPU나 GPU의 한계를 구조적으로 해결한 칩이다. IPU는 코어와 램을 하나의 프로세서에 탑재하는 ‘온칩’ 설계로, 코어와 램 사이의 거리가 있는 GPU와 달리 데이터 전달 속도가 빨라져 연산 지연에 대한 문제점을 해소한다. 램의 개수도 대폭 늘렸으며, IPU 코어는 1대1로 매칭된 램에서 대량의 데이터를 빠르게 받아 연산을 처리할 수 있다.

그래프코어 IPU는 빠르게 급증하고 있는 AI 연산의 요구사항에 구조적으로 특화됐다. 많은 양의 연산을 동반하는 AI 모델에 필수적인 높은 병렬처리 능력, 희소 연산 추세의 오늘날 AI 모델을 위한 효율적인 희소 연산 처리 능력, 저정밀도의 부동소수점 연산, 고대역폭 메모리가 내장됐다. 그리고 파이토치(PyTorch), 텐서플로우(Tensorflow) 등 범용 프레임워크를 지원하는 소프트웨어 등 모든 것을 갖추고 AI 연산에서 높은 성능을 내고 있다.

최근 발표된 MLPerf 벤치마킹 결과에서 그래프코어의 IPU-POD64는 9분이 조금 넘는 BERT 훈련 소요 시간과 14.5분의 ResNet-50 훈련 소요 시간을 내며 슈퍼 컴퓨터 수준의 AI 성능을 나타냈다. MLPerf 결과에 따르면 그래프코어 시스템은 경쟁사의 최신 시스템보다 ResNet-50에서 1.6배, BERT에서는 1.3배 더 향상된 성능을 구현하는 것으로 나타났다.

......

[원문보기] https://www.etnews.com/20210817000240