의료 데이터 처리 정확성·효율성 향상 기대

서울대병원은 이 모델을 통해 글로벌 의료 분야에서 경쟁력 있는 기술을 선도하고, 환자들에게 더 나은 의료 서비스를 제공할 수 있는 기반을 마련할 계획이다.
기존의 의료 LLM은 주로 서구권의 의료 지식에 최적화돼 있고, 한국어로 된 의료 텍스트나 한국의 의료법 및 진료지침 등을 이해하지 못하는 한계가 있었다. 서울대병원은 이러한 글로벌 동향에 맞춰 한국어와 영어를 혼용하는 국내 의료진의 요구를 충족하고, 전문의 수준의 의학 지식과 약어·줄임말 등 언어적 특성을 이해하는 LLM 개발의 필요성을 절감했다.
서울대병원은 이 같은 문제를 해결하기 위해 2024년 3월 한국형 의료 지식을 바탕으로 한 한국형 의료 LLM 개발에 착수했다. 병원 내 입원 초진, 외래기록, 수술·처방·간호기록 등 3800만건의 임상 텍스트를 활용해 '한국어 의료 텍스트 말뭉치'를 구축하고, 이를 개인정보 가명화 및 비식별화 후 병원 내에서 안전하게 활용할 수 있도록 공개했다. 이 모델은 한국 의료 시스템에 맞는 정보 처리 능력을 키우는 데 중요한 역할을 했다.
올해 들어 서울대병원은 이 모델을 더욱 발전시켜 한국의 의료 관련 법률, 국문 논문 초록, 학회 진료 지침 등을 통합하고, 의학용어 약어 사전과 용어 표준화 작업을 진행했다. 이를 통해 실제 진료 프로세스를 모방한 각 진료과 특화 지시훈련 데이터셋을 구축·공개했으며, 지식 그래프 기반 검색증강생성(RAG) 및 다학제 멀티 에이전트 프레임워크를 개발했다. 이러한 과정을 통해 병원 내에서 실용적으로 활용할 수 있는 한국형 의료 LLM을 1년 만에 완성했다. 서울대병원은 이 모델의 성능과 안전성을 검증한 후 병원 내 연구 및 업무 보조에 활용할 예정이다.
이 모델은 한국의사국가고시 최근 3개년 데이터를 대상으로 실험을 진행한 결과 86.2%의 정확도를 기록하며 오픈소스 모델 중 최초로 실제 의사 평균 정확도(79.7%)를 뛰어넘는 우수한 성과를 거뒀다. 이는 한국형 의료 LLM이 의료 분야에서 실용적이고 실현이 가능한 기술임을 입증한 사례로 평가된다.
또 약 5만개 단어의 방대한 텍스트를 한 번에 처리할 수 있는 우수한 번역 성능을 갖춰 향후 다양한 의료 분야에서도 성능을 확장하고, 의료 데이터 처리의 정확성과 효율성을 더욱 향상시킬 것으로 기대된다.
서울대병원은 향후 LLM의 성능을 고도화해 실제 진료 현장에서 활용할 수 있도록 발전시킬 예정이다. 의료 영상과 생체 신호 데이터를 결합한 멀티모달 모델로 확장해 외래 기록 자동 생성, 마취 전 상태평가 요약 자동 생성 등에서 의료진의 업무 효율성을 크게 향상시키고, 번아웃을 줄이며 환자 안전을 증진시킬 계획이다. 멀티모달 모델은 심전도, 의료 영상, 검사 결과 판독 등 다양한 분야에서도 활용 가능성을 열어두고 있다.
LLM 개발을 주도한 이형철 서울대병원 교수(헬스케어AI 연구원 부원장)는 "한국형 의료 LLM은 서울대병원의 우수한 의료진의 의료 지식을 바탕으로 개발돼 진료 효율성을 높이고 환자 만족도를 증대시킬 중요한 기술적 진전을 이뤘다"며 "LLM 기술은 의사들의 업무를 돕는 중요한 도구가 돼 의료 서비스의 질을 한층 향상시킬 수 있을 것"이라고 말했다.
김영태 서울대병원 병원장은 "이번 한국형 의료 LLM 개발을 통해 의료진의 업무 효율을 극대화하고, 환자들에게 더 빠르고 정확한 의료 서비스를 제공함으로써 의료 혁신의 새로운 장을 열었다"며 "앞으로도 지속적으로 최신 기술을 도입해 환자들에게 최상의 의료 서비스를 제공할 것"이라고 밝혔다.
[박준형 기자]