
스테이블AI는 2억 파라미터 규모의 ‘스테이블 디퓨전 3 미디엄’ 모델을 출시했다고 13일 발표했다. 스테이블 디퓨전 3 미디엄은 스테이블 디퓨전의 새로운 버전이다. 기존 80억 파라미터 규모의 대용량 모델보다 작은 규모로 구현됐다.
스테이블 AI의 크리스찬 라포르테 공동 최고경영자(CEO)는 “스테이블 디퓨전 3 미디엄은 기존 대용량 모델의 성능을 유지하면서도 5GB의 낮은 GPU 메모리만으로 구동이 가능하다”고 강조했다. 이를 통해 일반 소비자 PC와 노트북에서도 고성능 이미지 생성 기술을 활용할 수 있게 됐다. 미라클아이는 다음과 같은 스펙을 가진 PC급 이상에서는 가능할 것으로 추정한다.
CPU: Intel Core i5 이상 또는 AMD Ryzen 5 이상
RAM: 최소 16GB
GPU: NVIDIA GTX 1660 Super (6GB VRAM) 또는 AMD Radeon RX 5600 XT (6GB VRAM) 이상
저장장치: 500GB SSD
운영체제: Windows 10 64-bit 또는 최신 버전의 Linux 배포판
노트북
CPU: Intel Core i5 이상 또는 AMD Ryzen 5 이상
RAM: 최소 16GB
GPU: NVIDIA GTX 1660 Ti (6GB VRAM) 또는 NVIDIA RTX 2060 (6GB VRAM) 이상
저장장치: 500GB SSD
운영체제: Windows 10 64-bit 또는 최신 버전의 Linux 배포판
해당 사양에 맞는 PC는 Dell G5 Gaming Desktop, HP Omen Obelisk, ASUS TUF Gaming A15, Acer Predator Helios 300 정도다. 라포르테 CEO는 “스테이블 디퓨전 3 미디엄은 사실감, 프롬프트 이해도, 타이포그래피, 리소스 효율성 등 스테이블 디퓨전 3 대용량 모델과 동등한 수준의 성능을 보인다”고 설명했다. 스테이블 디퓨전 3 미디엄은 API를 통해 현재 이용 가능하며, 비상업적 용도로 허깅 페이스(Hugging Face에서도 모델 가중치를 다운로드할 수 있다.