오픈AI “새로운 데이터 직접 만들어”

월스트리트저널(WSJ)이 22일(현지 시간) 챗GPT 개발사 오픈AI의 차세대 주력 인공지능(AI) 모델 개발이 목표보다 늦어지고 있다고 보도했다.
WSJ는 이날 코드명 ‘오리온(Orion)’으로 알려진 차세대 AI 모델 GPT-5의 개발 일정이 기약 없이 지연되었으며 오픈AI가 이에 막대한 비용을 쓰고 있다고 밝혔다.
앞서 오픈AI 최대 투자사인 마이크로소프트(MS)는 올해 중반 새로운 모델이 나올 것이라고 기대했었다. 그러나 지난 20일 샘 올트먼 오픈AI 최고경영자(CEO)는 고급 추론 AI 모델 ‘o3’를 공개하면서도 GPT-5라고 부를 만한 모델의 출시 일정은 언급하지 않았다. 오픈AI는 18개월이 넘는 기간 동안 방대한 양의 데이터를 처리하는 대규모 훈련을 최소 2차례 진행했으나, 기대했던 결과를 얻지 못한 것으로 전해졌다.
아울러 WSJ는 “훈련에 필요한 데이터가 충분하지 않은 것도 문제로 꼽힌다”고 덧붙였다. 오픈AI는 이와 관련 “문제를 해결하기 위해 새로운 데이터를 직접 만들기도 한다”고 밝혔다. 또한 소프트웨어 엔지니어나 수학자들을 고용해 새로운 코드를 만들거나 수학 문제를 풀도록 한 후, AI가 이를 학습하도록 하는 방식을 시도하는 것으로 전해졌다. WSJ는 “다만 이런 방식은 기존보다 시간이 오래 걸린다”라며 “이외에도 경쟁 업체가 높은 금액을 제시하며 최고 연구원을 빼가려는 시도를 반복해 비용 부담을 키우기도 했다”고 진단했다.
이 같은 문제는 오픈AI에만 한정된 것은 아니다. 최근 AI 모델 성능 향상이 정체기를 맞았다는 논쟁이 업계 전반에서 불거지고 있다. 이와 관련 일리야 수츠케버 오픈AI 공동 창립자는 지난 13일 한 강연에서 “컴퓨터 연산 능력은 향상하고 있지만 데이터는 늘지 않고 있다”고 우려했다.