그리스 신화 미(美)의 여신 아프로디테에 비견되던 프리네(Phryne)가 신성모독 혐의로 법정에 서게 됐다. 이는 당대 재력가 에우티아스가 자신의 구애를 거절한 그녀에게 앙심을 품고 고발했기 때문이다. 사형 선고 위기에 처한 그녀를 변호하기 위해 연인 히페레이데스(Hyperides)는 엄숙한 법정에서 파격적인 변론 전략을 구사한다. 그는 그녀의 몸을 휘감고 있던 천을 벗기는 장면을 연출한다.

배심원들은 놀라움을 금치 못하면서 “저렇게 아름다운 여인은 신께서 내린 은총이기 때문에 인간의 법으로 판결할 수 없다”며 무죄를 선고한다. 이 사건은 “아름다움은 무죄다. 아름다운 것은 선하다”라는 고대 그리스 시대의 편견을 보여주는 사례인 동시에, 감성과 직관에 좌우되는 인간의 한계를 잘 드러내는 가장 고전적인 예라 할 수 있다.
‘인간의 합리성’의 가정에 도전하여 2002년 노벨경제학상을 수상한 대니얼 카너먼(Daniel Kahneman)은 그의 저서 『생각에 관한 생각(Thinking, Fast and Slow)』에서 가장 냉철하게 판단하고 이성적일 것 같은 판사들조차 무려 71.8%의 오답률을 기록했다고 설명한다. 그는 판사들이 이러한 오류에 빠지는 이유를 경험적·직관적 사고 시스템에 의존하기 때문이라고 분석한다. 대니엘 카너먼은 또한 동일한 사건을 놓고 ‘콩에서 팥까지’ 너무나 분산된 판단을 내리는 현상을 분석한 책 『노이즈(Noise): 생각의 잡음』에서 경험적, 직관적 사고 패턴에 의존한 판결을 비판한다. 가령, 축구 경기에서 자기가 좋아하는 팀이 진 다음에 판사는 더 가혹하게 판결하고, 자기 생일날에는 관대한 처분을 하며, 딸 바보인 판사는 딸 같은 여성에게 호의적인 판결을 하는 경향이 있다는 것이다. 카너먼은 미국 연방판사 208명을 대상으로 16개의 가상 사건을 맡겨보니 만장일치로 징역형이 내려진 사건은 3건에 불과했고, 동일한 사건에 대해 8.5년에서 무기징역까지 선고되었다고 한다. 충격적이지 않을 수 없다.

이는 저마다의 기준이 달라 분산(variability: 통계용어로 변동성)이 발생했기 때문이다. 동일한 사건을 두고 판사마다 다른 결론을 내려 A=무죄, B=5년 형, C=20년 형에 처한다면 정말 심각한 문제가 아닐 수 없다. 판결에서 법원과 판사마다 너무나 차이 나고 일관성 없는 판단을 내린다면 이는 판결이 아니라 잡음, 곧 ‘노이즈’가 된다. 자기 자신이 이런 불공정하고 억울한 판결을 받았다면 과연 받아들일 수 있을까?
근래 사법에 대한 불신이 높아지면서 AI 판사에 대한 요구가 증가하고 있다. 취리히 연방공대(ETH)의 알렉산더 스트레미처(Alexander Stremitzer) 교수팀은 2023년 2월, ‘AI 판사를 신뢰할 수 있는가?’라는 질문을 던지며 6,000명의 미국 성인에게 설문을 해본 결과, AI가 사람보다 공평하게 판결할 것이라는 응답을 받았다. 이와 같은 현상은 우리나라에서도 마찬가지이다. 2020년 12월, 한국리서치가 성인 남녀 1,000명을 대상으로 조사한 결과에 따르면, 국민 10명 중 6명은 판결에 대해 신뢰하지 않으며, 10명 중 8명은 판사에 따라 판결이 달라진다고 응답했다. ‘만약 본인이 재판을 받게 된다면 인간 판사와 AI 판사 중 누구에게 재판을 받고 싶은지’를 묻자, 전체 응답자의 48%가 AI 판사를 택했으며, 인간 판사를 선호한 응답자는 39%에 그쳤다.
2023년 하버드 케네디 스쿨에서 발간한 ‘AI 판사 및 판결’에 관한 연구에서도 재판에 AI 시스템을 도입하는 장점을 다음과 같이 정리했다. (AI JUDGES AND JUDGEMENT: SETTING THE SCENE, Harvard Kennedy School, November 2023: https://www.hks.harvard.edu/centers/mrcbg/publications/awp/awp220)
첫째, AI 판사는 휴식이 필요하지 않기 때문에 24시간 쉬지 않고 일할 수 있어 인간 판사의 행정적 부담을 크게 줄일 수 있다. 2022년 기준으로 6만 건이 넘는 미결 사건을 남긴 잉글랜드와 웨일스의 형사법원(Crown Courts)의 사례를 들면서, AI는 법원의 효율성을 크게 높이고, 사건 적체를 줄이며, 표준화된 결과를 더 빠르고 저렴한 비용으로 제공할 수 있다고 분석한다.
둘째, AI 판사는 표준화된 알고리즘에 의존하므로 판결의 공정성을 높일 수 있다고 강조한다. 사람의 생사여탈권을 쥐고 있는 판사가 자신의 주관적 경험, 이념, 그날의 기분에 따라 동일한 사건에 대해 법원이나 판사마다 다르게 판결할 경우, 사법에 대한 불신은 좀처럼 해소되지 않을 것이다. 반면, AI는 학습된 데이터에 기반해 일관되고 동일한 결과를 제공한다. 즉, 판독하는 판사가 다르더라도 결과의 변동성이 적어 일관성을 높이고 편향성의 오류를 줄일 수 있다.

오늘날 사법에서 AI 시스템을 도입한 나라는 에스토니아, 미국, 영국, 캐나다, 호주, 중국, 싱가포르 등으로, 점점 늘어나고 있다. 에스토니아와 미국에서는 로봇 판사를 시범 운영하고 있으며, 캐나다 역시 AI를 점점 더 많이 사용하고 있다. 『하버드 법과 기술』 제36권 1호(2022년 가을)에 따르면, 법정에서 ‘AI 알고리즘’으로 작동되는 재판 시스템을 구축하고 AI 판사를 만나는 날에야 판결 오류를 줄일 수 있다고 강조한다.
법조계 일각에서는 AI 판사의 도입에 대해 거부감을 보이면서, ‘판결 오류의 문제를 과장하지 말라’고 주장할 수도 있다. 그러나 판사가 자신이 보고 싶은 것만 보고 나머지는 무시하는 선택적 자각(selective awareness)이나 확증편향(confirmation bias)에 빠진다면, 이는 매우 위험한 상황을 초래할 수 있다. 이럴 경우, 판사가 자신의 이념적·정치적 성향에 따라 동일한 사건을 두고 정반대의 결론을 내리거나 불공정한 판단을 내린다는 비난은 그치지 않을 것이다. 그러면 사법에 대한 불신은 더욱 깊어질 것이다.
반면 AI는 경험적·직관적 편향 보다는 논리적·과학적 방식으로 여러 데이터를 통합하기 때문에 출신학교나 자신이 속한 연구회 등과 같은 이해관계와 무관하다. 뇌물을 받지 않으며, 24시간 동안 쉬지 않고 일해도 지치지 않는다. 무엇보다도, AI는 노이즈로부터 자유롭기 때문에 동일한 사건에서 분산된 판결을 최소화할 수 있다. 잘 설계된 알고리즘은 정파적 영향을 받지 않는다. 신뢰와 공정을 획기적으로 높이기 위하여 사법부는 탄탄한 AI 시스템을 구축하여 판결의 일관성과 공정성을 최대한 높이고, 노이즈를 제거하는데 신속한 노력을 기울여야 할 것이다.

[여현덕 카이스트 G-School 원장/기술경영대학원 교수]