질환정보
의료원 블로그에서 더 자세히 소개된 건강 정보를 읽어보세요.
내용보기
[전지적 명의시점] 알파고와 인공지능 시대의 도래
작성자 : 홍보협력팀
조회 : 1036
작성일 : 2022-08-03 14:55:44
2016년, 많은 이들의 예상을 뒤엎고 인공지능 알파고가 바둑의 신 이세돌 9단을 제압하던 장면은 우리 사회에 큰 충격을 주었다. 당시만 하더라도 국내에서 인공지능(artificial intelligence, AI)에 대한 국민적 관심이 그리 높지 않았던 터라 알파고와 이세돌 9단의 대결을 일회성 이벤트로 생각하는 사람들이 많았었다. 하지만, 이후 인공지능은 4차 산업혁명의 흐름과 맞물리며 국가 미래에 중요한 화두로 등장하였다. 현재 우리는 인공지능이 열어갈 새로운 시대에 대한 기대감과 동시에 인간을 넘어서는 기술에 대한 불안감을 함께 느끼는 아이러니 속에서 스마트폰 이후 또 한번의 강력한 기술적 변혁의 시대를 관통하고 있다.
인공지능이라는 용어는 1956년 다트머스대학에서 '지능을 가진 기계'를 주제로 열린 학술대회에서 처음으로 사용되었다. 1958년 프랭크 로젠블랏이 신경 세포의 신호 전달 특징으로부터 인공신경망(artificial neural network)의 초기 모델인 퍼셉트론(perceptron)을 고안하여 많은 기대를 받았으나 이후 구체적인 성과가 나오지 않으면서 침체기에 빠지게 되었다. 이후 1980년대에 들어 머신러닝(machine learning, 우리말로는 '기계학습')이라고 부르는 알고리즘을 활용하여 주어진 자료를 바탕으로 기계가 스스로 학습을 하고 규칙을 찾아내어 새로운 입력 값에 대한 결과를 예측할 수 있게 되었다. 하지만, 기술적 진보에도 불구하고 인간이 생각하는 진정한 인공지능을 구현함에 컴퓨팅 기술이 뒷받침되지 못하며 또 한번의 침체기를 맞게 된다.
인공지능에 대한 연구는 2000년대 초반까지만 해도 크게 주목 받지 못하였으나 컴퓨터 성능의 개선과 인터넷 확산을 배경으로 다시 활기를 띄게 된다. 2012년 개최된 이미지 인식 경진대회인 ILSVRC(ImageNet Large Scale Visual Recognition Challenge)에서 토론토대학 제프리 힌튼 교수팀의 딥러닝(deep learning)을 이용한 알렉스넷(AlexNet)이 압도적인 성능으로 우승하며 오랜 기간 잊혀졌던 인공지능이 딥러닝이라는 이름으로 화려하게 부활하게 된다. 딥러닝은 인공지능을 대표하는 알고리즘으로 자리를 잡았으며, 이후 자율주행차, 의료영상판독 등 많은 영역에서 활용되고 있다.
인공지능이 의사를 능가할까? (의료 인공지능 왓슨의 도입과 실패)
IBM의 의료용 인공지능 '왓슨포온콜로지(이하 왓슨)'은 처음 우리나라에 소개될 때와 달리 2011년 미국의 유서 깊은 퀴즈쇼인 '제퍼디!'에서 막강한 인간 챔피언들에 압도적인 승리를 거두며 화려하게 데뷔하였다. 하지만, 실제로는 그 전부터 의학 교과서와 논문 등으로부터 질병 데이터를 학습한 점을 볼 때 개발 초기부터 의료 분야의 접목 가능성을 모색하였을 것으로 추측되며, '제퍼디!' 이후 본격적으로 의료 분야에 진출하며 암 환자 진료에 도전하였다. 방대한 의학 자료와 실제 치료 사례가 포함된 데이터 학습을 기반으로 폐암에서 시작하여 다른 암종으로 범위를 넓혀 나갔으며 그렇게 개발된 것이 우리가 알고 있는 '왓슨'이다. 왓슨의 기능은 환자의 진료 기록과 기존 의료 데이터를 바탕으로 적용 가능한 치료법을 관련 근거에 기초하여 추천 단계별로 권고해 주는 것이다. 다시 말해 진단이 아닌 적절한 치료법을 권고하여 의사의 진료를 보조하는 것이다. 왓슨의 가장 큰 장점은 인간의 능력으로 따라가기에는 이미 불가능한 수준으로 빠르게 쏟아져 나오는 암 관련 연구 결과들을 분석하고 이를 치료법 선택에 반영할 수 있다는 점에 있다. 우리나라에는 2016년 가천대길병원을 시작으로 부산대병원, 건양대병원, 대구가톨릭대병원, 계명대동산병원, 조선대병원, 화순전남대병원 등에서 차례로 도입하였다.
하지만, 왓슨을 도입한 이들 병원들과 달리 국내 암환자를 가장 많이 진료하는 서울 소재 빅5 병원이 왓슨을 도입하지 않는 것은 이미 암 분야에 명의로 알려져 있는 의사들을 대부분 보유하고 있고 감당하기 어려울 정도로 밀려드는 환자수를 고려할 때 수입적으로 도움이 되지 않는 왓슨의 도입이 이들에게 큰 이점이 없었기 때문이라고 추측할 수 있다. 더구나 왓슨에 대한 초기 기대와 달리 왓슨이 인종, 지역, 의료제도 등과 같은 변수에 취약한 점을 고려할 때 왓슨의 실력에 대한 충분한 검증과 추가적인 보완에 대한 필요성이 높아지고, 특히 한국인의 데이터를 기반으로 한 한국형 왓슨에 대한 공감이 커지면서 왓슨의 추가 도입과 다수의 재계약이 불발되었다. 이와 함께 그 동안 투자 대비 수익 모델의 창출이 어려웠던 한계점은 결국 최근 왓슨을 개발한 IBM을 필두로 대부분의 전세계 유수 의료용 인공지능 개발 업체들이 관련 투자를 축소하는 계기로 작용하였다. 이는 실질적인 문제 해결보다 암 정복과 같이 당장의 성과를 기대할 수 없는 거대한 목표를 추구하며 기술보다 마케팅을 앞세운 전략의 실패가 주요 원인으로 평가 받는다.
인공지능(머신러닝)의 원리 및 의료에서의 적용
1956년 이후 사용된 인공지능이라는 용어는 매우 포괄적이고추상적이며, 이를 실현하기 위하여 가장 많이 사용되는 방법은인공지능의 하위 분류에 속하는 머신러닝(machine learning,기계학습)이다. 일반 컴퓨터 프로그램이 전자계산기에서와 같이숫자와 알고리즘화 되어 있는 연산자를 입력하여 결과를 출력하는 것이라면, 머신러닝은 주어진 자료를 바탕으로 기계가수학적 방법을 통하여 스스로 학습하고 최적의 모델을 찾아 새로운 데이터를 대상으로 어떤 결정을 내리거나 예측하도록 하는 것이다. 데이터로부터 모델을 만들고 의미를 찾기 위해서는 먼저 데이터를 추출하고 가공하는 과정(data mining and preprocessing)이 필요하다. 마치 좋은 원석에서 아름다운보석이나 조각품이 나오는 것처럼 머신러닝에서 사용될 적절한알고리즘을 만드는 것 (이를 코딩이라고 부른다) 이상으로 좋은 데이터를 확보하는 것은 매우 중요하며, 편향되거나 잘못된 데이터를 기반으로 학습된 모델은 예상과 다른 전혀 엉뚱한 예측을 할 수 있다. 예를 들어 암환자의 치료판정 모델을 만드는 과정에서 임상적으로 치료판정이 모호한 데이터가 대량으로 포함된 경우 이로부터 생성된 모델에서의 예측 결과를 신뢰하기 어려울 것이다. 좋은 데이터가 되기 위해서는 어느 한쪽에 치우치지 않은 대표성을 가진 충분한 양으로 확보가 되어야 하며, 연구 분석에 필요한 특성(feature)이 잘 포함되어 있어야 한다.
다양한 머신러닝들 중 최근 우리가 주목하는 딥러닝(deep learning)은 인공신경망의 입력층과 출력층 사이에 여러 층의 은닉층(hidden )을 추가한 것이며, 이런 심층 신경망(deep neural network)을 학습시켜 기존에 불가능 했던 복잡한 문제의 해결이 가능하게 되었다. 딥러닝이 기존 머신러닝과 다른 점은 머신러닝에서는 주목하여야 할 특징량을 인간이 미리 지정해 주어야 하지만 딥러닝은 학습을 반복하면서 스스로 특징량을자동으로 추출한다.
예를 들면, 개와 고양이를 구분할 때 딥러닝은 학습을 반복하며 귀의 모양을 구분에 중요한 특징량으로인식하여 문제를 해결한다는 것이다. 최근 의료 영상 분석 분야에서 많이 사용하는 딥러닝은 합성곱 신경망(convolutional neural network, CNN)이며, 흉부와 유방 방사선 영상으로 시작하여 CT, MRI, 내시경과 피부, 안저, 병리 사진 등 다양한 의료 영상데이터들을 대상으로 분류 모델이 개발되고 실제 의료 현장에서사용되고 있다. 그 외에 짧은 시간 내에 일부 MRI 영상을 촬영후 나머지 MRI 영상을 합성하거나 MRI 영상에서 CT 영상을 만들어 내는 등 영상 생성 및 변환 분야(Image generation and translation)에서도 많은 발전이 이루어지고 있다.
(A) 수치화된 의료데이터들을 분석하여 치료 여부를 판정하는 딥러닝의 구조 예. 입력층과 4개의 은닉층, 그리고 출력층으로 구성되어 있다.
(B) 본원에서 가동 중인 PET-MR을 이용한 이미지 생성연구 사례. 생성적 적대 신경망(Generative Adversarial Network, GAN)을 이용하여 MR영상으로 만든 합성 PET-MR 영상 (위)과 실제 촬영한 PET-MR 영상 (아래)의 비교. 생성적 적대 신경망은 최근 10년간 개발된 딥러닝들 중 최고의 기술로 평가받고 있다. (출처, 필자가 현재 수행 중인 연구 자료)
인공지능의 한계와 미래의 방향
딥러닝은 사람이 가르쳐 주지 않아도 스스로 복잡한 문제를 풀어낼 수 있고 학습을 통하여 더욱 성능이 개선될 수 있다. 하지만, 대부분의 딥러닝 알고리즘들은 매우 복잡하고 깊은 은닉층을 가지고 있으며 어떻게 결론을 도출하는지에 대한 파악이 불가능한 블랙박스 형태로 되어 있다. 이것은 알파고와 이세돌9단의 대결에서 기존 바둑 세계에서 볼 수 없던 알파고의 별난 수들이 처음에는 악수로 여겨졌으나 결론적으로는 승리 과정의 묘수들로 평가받았으며 아직까지도 그런 묘수들의 이유를 완벽하게 이해하는 것이 불가능한 것과 같다. 최근 이런 인공지능의 제한점을 극복하기 위하여 설명 가능한 인공지능(explainable AI)에 대한 관심이 더욱 높아지고 있으며, 실제 영상 분석 분야에서는 딥러닝이 어느 부분에 주목했는지 특징지도(saliency map)로 표기하는 방법을 사용하여 그 판단 근거를 유추하고 있다. 하지만, 바둑과 같은 취미 생활과 달리 사람의 건강과 생명을 다루는 의료 영역에서는 특정 기술에 있어서 그 효과와 위해성 여부에 대한 복잡한 검증 과정이 요구되는 점을 고려할 때 인공지능의 설명력은 매우 중요한 요소이다.
PET/MR 영상 데이터들을 분석하여 척추감염의 치료 여부를 판정하는 합성곱 신경망(convolutional neural network, CNN). 치료 완료 및 미완료에 대한 판단 결과를 설명하기 위하여 해당 영상들에서 주목한 지점들을 각각 표기하고 있다. 치료 완료에서는 병변(척추뼈 내)의 주위를 지적하지만 치료 미완료에서는 척추뼈 내 병변을 지속적으로 지적하고 있다. (출처, 필자가 현재 수행 중인 연구 자료)
정확도가 99% 이상인 의료용 인공지능이 어떤 질환의 진단과 치료에 있어서 기존 의학 데이터와 의사의 판단에 정면으로 배치되는 결정을 내리는 경우가 발생할 수 있다. 이런 경우를 인공지능의 단순한 실수로 간주할 것인가 아니면 인간의 수준에서 파악이 불가능한 정도의 미세한 차이를 인공지능이 인지한 것으로 봐야 할 것인가? 그리고 의사보다 의료 인공지능을 더 믿겠다는 환자들이 있다면 어떻게 할 것인가? 이런 의문들은 인공지능과의 공존을 시작한 이 시점에 중요한 화두로 등장하였으며 아직까지 그에 대한 분명한 답을 얻기에는 많은 고민이 필요하다.
현재까지는 인공지능이 독립적인 판단을 내리고그 결과를 책임지기에 설명력이 낮은 이유로 인하여 의사의 진료와 환자 치료에 보조적인 수단으로 역할을 하고 있으며 최종적인 결정과 그에 대한 책임의 주체는 인간이다. 점차 인공지능의 높아지는 영향력을 감안할 때 향후 인공지능의 활용 방법, 목적, 그리고 사용 결과에 다른 책임 소재에 대한 사회적 합의가 요구된다.
기술의 발전은 항상 인간의 상상을 실현시키는 방향으로 이루어졌으며 또 그것에 갇혀 있지 않았다. 18세기 증기기관의 발전으로 기술적 실직에 대한 저항으로 일어난 러다이트(Luddite) 운동도 결국 시대의 흐름을 이기지 못한 것처럼 현재의 거센 물결을 쉽게 거스를 수는 없을 것이다.
하지만, 알파고가 이세돌9단의 신의 한 수에 큰 혼란에 빠지며 1패를 당한 점과 같이 인공지능은 데이터에서 경험하지 못한 특수한 상황에 대한대처가 불안정하고 그에 따른 부작용에 대한 우려가 있어아직까지 의료에서 인공지능의 활용은 일부 영역에 제한적이다. 이런 점들을 고려할 때 현재의 흐름을 ‘인간과 인공지능의 경쟁(Human vs. AI)’이나 ‘인공지능에 인간의 종속(AI with human)’이 아닌 인공지능을 이해하고 인간의 부족한 점을 인공지능의 장점으로 보완하는 ‘인간과 함께 하는 인공지능 (Human with AI)'으로 이어 나가는 노력이 필요하다.
[참고자료]
의료인공지능 (클라우드나인, 최윤섭)
의료 AI 입문 (양병원 출판부, 야마시타 아스유키)
비전공자도 이해할 수 있는 AI 지식 (반니, 박상길)
케라스 창시자에게 배우는 딥러닝 (길벗, 프랑소와 숄레)
조선경제 ‘돈 못버는 골칫덩이됐다… AI 선구자 ‘왓슨’의 몰락
주간경향 'AI 활용 어디까지 왔나'