더 작고 효율적인 생성형 AI 구현… 서울공대 전기정보공학부 이종호 교수팀, 이미지 생성 핵심 기능 통합한 인공지능 반도체 기술 제시
서울대학교 공과대학은 전기정보공학부 이종호 교수(전 과학기술정보통신부 장관)가 이끄는 연구팀이 강유전체 메모리에 기반해 생성형 AI의 핵심 기능을 하나의 소자 플랫폼에 통합한 인공지능 반도체 기술을 세계 최초로 제시했다고 밝혔다.
이번 기술은 생성형 AI 구현에 필요한 두 핵심 기능, 즉 무작위 샘플링과 안정적 연산을 하나의 메모리 어레이(배열) 안에서 함께 구현한 세계 최초 사례라는 점에서 의미가 크다.
연구팀은 강유전체(ferroelectric)* 메모리가 전압의 크기에 따라 서로 다른 전기적 상태를 나타내는 특성을 활용해 무작위 텔레그래프 잡음(RTN)을 이용한 확률적 샘플링*과 전원이 꺼져도 여러 전기 상태를 유지하는 메모리 특성을 이용한 결정론적 연산*을 단일 플랫폼에서 구현하는 성과를 거뒀다.
* 강유전체: 외부 전기를 제거한 뒤에도 내부에 전기적 상태를 유지할 수 있는 특수한 물질로, 차세대 저전력 메모리 반도체에 활용된다
* 확률적 샘플링: 여러 가능한 결과 가운데 일정한 확률에 따라 값을 선택하는 연산 방식. 생성형 AI가 매번 조금씩 다른 문장이나 이미지를 만들어내는 과정에 활용된다
* 결정론적 연산: 일반적인 컴퓨터 연산처럼 같은 입력이 들어오면 항상 같은 결과를 출력하는 계산 방식
이번 연구 성과는 최고 권위의 국제 학술지 ‘네이처 커뮤니케이션즈(Nature Communications)’에 실렸다.
연구 배경
최근 생성형 AI는 이미지 생성, 영상 합성, 자율 시스템, 개인 맞춤형 콘텐츠 생성 등 다양한 분야로 빠르게 확산되고 있다. 하지만 생성형 AI를 실제 반도체 칩 위에서 직접 구현하는 일은 여전히 쉽지 않다. 기존 인공지능 반도체는 주로 분류나 추론처럼 안정적인 결정론적 연산에 최적화돼 있는 반면, 생성형 모델은 여기에 더해 잠재 공간에서 무작위 샘플을 뽑아내는 확률적 기능까지 함께 요구하기 때문이다.
이 때문에 기존 연구들은 확률 샘플링과 디코딩을 서로 다른 소자나 외부 소프트웨어 모듈에 나눠 맡기는 경우가 많았고, 그 결과 면적 증가, 배선 복잡도, 전력 소모, 지연 시간 증가 등의 한계를 안고 있었다. 특히 두 기능을 하나의 메모리 기반 하드웨어 내에서 함께 구현하면서도 기존 CMOS 공정과의 호환성과 집적 가능성까지 확보하는 일은 쉽지 않은 과제로 남아 있었다.
연구 성과
이러한 제약을 뛰어넘기 위해 연구팀은 하프늄 산화물(HfO₂) 기반 강유전체 메모리의 전압 의존적 특성에 주목했다. 전압이 높은 영역에서는 무작위 텔레그래프 잡음(RTN)이 강하게 나타나 확률적 샘플링 소스로 동작하고, 전압이 낮은 영역에서는 RTN이 억제돼 비휘발성 다중 전도 상태*를 활용한 안정적인 벡터-행렬 곱(VMM) 연산이 가능해진다. 연구팀은 이를 통해 하나의 메모리 어레이 안에서 생성형 AI에 필요한 무작위성과 안정성을 함께 구현하는 전략을 세계 최초로 제시하는 데 성공했다.
* 비휘발성 다중 전도 상태: 전원이 꺼져도 서로 다른 여러 전기 상태를 유지할 수 있는 특성. 이를 통해 하나의 메모리 소자에 여러 정보를 저장하고 안정적으로 연산할 수 있다.
이 혁신적 기술은 생성형 AI 하드웨어에서 따로 분리돼 있던 샘플링과 디코딩 기능을 하나의 강유전체 메모리 기반 플랫폼 안에 통합할 수 있다는 점에서 그 의미가 크다. 특히 별도의 외부 확률 발생 모듈 없이도 동일한 소자가 서로 다른 동작 영역에서 각기 다른 역할을 수행할 수 있어, 향후 생성형 AI 반도체의 집적도와 전력 효율을 함께 높일 수 있는 가능성을 보여준다는 평가다.
연구팀은 실제 6인치 웨이퍼 위에 제작한 노어(NOR)형 강유전체 메모리 어레이를 이용해 이 개념을 검증했다. 전압과 샘플링 시간을 조절해 잠재 벡터 분포를 최적화한 뒤, 이를 변분 오토인코더(Variational Autoencoder·VAE)*에 적용해 얼굴 이미지 데이터셋(CelebA)에 대한 생성 실험을 수행했다. 그 결과, 다양한 얼굴 속성을 반영한 이미지 생성 가능성을 확인했으며, 회로 수준의 검증을 통해 10만 회 정도의 반복 동작 이후에도 생성 성능이 안정적으로 유지됨을 확인했다.
* 변분 오토인코더: 데이터의 특징을 학습한 뒤, 이를 바탕으로 새로운 이미지나 데이터를 생성하는 인공지능 모델. 생성형 AI의 대표적인 기술 중 하나로, 얼굴·음성·이미지 생성 등에 활용된다.
기대 효과
이번 연구는 생성형 AI 하드웨어에서 오랫동안 분리돼 있던 두 기능을, CMOS 반도체 공정과 호환되는 강유전체 메모리 기반의 단일 소자 플랫폼에서 통합할 수 있음을 입증했다는 점에서 생성형 AI 하드웨어 발전의 중요한 전환점이라는 평가를 받고 있다. 따라서 이 AI 반도체 기술은 향후 온칩(On-chip) 생성형 AI 가속기, 뉴로모픽 시스템, 저전력 엣지 AI 반도체 등에서 면적과 전력 효율 문제를 동시에 개선할 것으로 기대를 모은다.
특히 강유전체 메모리는 기존 반도체 공정과의 호환성이 높기 때문에, 향후 대규모 생성형 AI 하드웨어 시스템으로의 확장 가능성도 열려있다. 앞으로 연구팀은 샘플링 속도, 병렬성, 어레이 규모, 주변회로 최적화 등을 통해 실시간 생성형 AI 하드웨어로의 발전 가능성을 넓혀갈 계획이다.
연구진 의견
연구를 이끈 이종호 교수는 “생성형 AI 하드웨어 분야에서는 무작위 샘플링과 결정론적 연산을 동시에 만족시키는 것이 핵심 과제인데, 이번 연구는 강유전체 메모리의 전압 의존적 특성을 활용해 이 두 기능을 하나의 소자 플랫폼에서 구현할 수 있음을 보였다는 점에서 큰 의의를 지닌다”고 밝혔다.
연구진 진로
논문의 주저자인 구륜한 연구원과 고종현 연구원은 현재 서울대학교 전기정보공학부 이종호 교수 연구팀에서 메모리 반도체, 하드웨어 인공지능, 저전력 뉴로모픽 시스템 관련 연구를 수행하고 있다.
참고자료
- 논문명/저널: CMOS compatible ferroelectric tunnel junctions integrate stochastic sampling and deterministic computing for image generation, Nature Communications
- DOI: https://doi.org/10.1038/s41467-026-72969-6
언론연락처: 서울대학교 전기정보공학부 이종호 교수 연구팀 구륜한 연구원 고종현 연구원
이 뉴스는 기업·기관·단체가 뉴스와이어를 통해 배포한 보도자료입니다.