1장
현주소
명심하라, 지금 일어나는 혁신은 인공지능이 이룰 성취의 첫걸음에 불과하다. AI는 우리가 미처 알아차리기도 전에 오늘날 문제가 되는 모든 한계를 돌파해버릴 것이다.
― 빌 게이츠 | 마이크로소프트 설립자
2017년 말 조용한 혁명이 일어났다. 구글 딥마인드DeepMind의 인공지능 프로그램 알파제로AlphaZero가 역대 최강의 체스 프로그램 스톡피시Stockfish를 꺾은 것이다. 전적 100전 28승 72무 0패. 그야말로 알파제로의 압승이었다. 이듬해 알파제로는 스톡피시를 상대로 1000전 155승 839무 6패를 기록하며 완전한 우위를 증명했다.
체스 프로그램 간의 승부는 보통 소수의 마니아 사이에서 화제가 될 뿐이다. 하지만 알파제로는 달랐다. 이전의 프로그램들은 인간이 생각하고 실행하고 입력한 수에, 다시 말해 인간의 경험·지식·전략에 의존했다. 독창적인 수를 구상하는 건 아니었다. 다만 인간보다 우월한 연산 능력으로 같은 시간에 훨씬 많은 수를 검토해냈다. 반면 알파제로는 인간의 플레이에서 나온 수나 전략을 바탕으로 한 프로그램이 아니다. 알파제로의 플레이 스타일은 순전히 AI 훈련의 산물이다. 개발자들은 알파제로에게 그저 체스 규칙을 알려준 후 승률을 극대화하는 전략을 찾으라고 지시했을 뿐이다. 알파제로는 단 4시간 동안 자기 자신과 대국하는 방식으로 훈련한 후 세계 최강의 체스 프로그램 자리에 등극했다. 이 글을 쓰는 현재를 기준으로 알파제로를 이긴 인간은 존재하지 않는다.
알파제로의 전술은 실로 이례적이고 독창적이었다. 인간 플레이어는 어떻게든 지키려고 하는 말예컨대 퀸을 알파제로는 과감히 희생시켰다. 인간이 알려주지 않은 수를 뒀고 그중에는 인간이 아예 생각조차 못 한 수도 많았다. 알파제로가 놀라운 전술을 구사할 수 있었던 이유는 자기 자신과 벌인 수차례의 대국을 복기하며 그런 전술이 승산을 극대화하리라고 예측했기 때문이다. 알파제로에게는 인간이 생각하는 의미의 ‘전략’이 없었다그럼에도 알파제로의 독특한 플레이 스타일 덕분에 체스에 관한 인간의 연구가 더 활발해지기는 했다.
대신 알파제로에게는 나름의 논리가 있었다. 그 논리는 인간의 정신으로 전부 소화하거나 구사할 수 없을 만큼 방대한 경우의 수를 검토하며 ‘패턴’을 인식하는 능력에서 나온다. 알파제로는 그렇게 학습한 패턴에 의거해 매 순간 현재 판세에서 승률이 가장 높다고 판단되는 수를 선택했다. 체스 세계 챔피언을 지낸 그랜드마스터 가리 카스파로프는 알파제로의 대국을 관전·분석한 후 “알파제로가 체스라는 종목을 뿌리째 뒤흔들었다”고 평했다. 세계 최고의 체스 플레이어들은 그들이 평생 연구한 게임의 한계에 도전하는 AI를 보며 말 그대로 한 수 배울 수밖에 없었다.
2020년 초 매사추세츠공과대학교MIT 연구진은 기존의 항생제가 통하지 않았던 내성균들을 사멸시키는 새로운 항생제를 발견했다. 표준적인 방법으로 신약을 개발하려면 상당한 비용과 노력이 요구된다. 연구진이 분자 수천 개를 분석군에 넣고 시행착오와 합리적 추측으로 신약에 쓸 만한 소수의 후보군을 추려내야 한다. 합리적 추측이 아닌 막연한 희망에 기대서 기존 약품의 분자구조를 변형하는 방법도 있다.
하지만 MIT의 방식은 달랐다. MIT는 AI를 동원했다. 우선 기존에 항균성이 있다고 알려진 분자 약 2000개로 구성된 ‘훈련 세트’를 만들었다. 훈련 세트에는 각 분자의 원자량, 결합 유형, 박테리아 증식 억제력 같은 데이터가 부호화되었다. AI는 이 훈련 세트로 항균성이 있으리라 예측되는 분자의 속성을 ‘학습’했다. 놀랍게도 이때 AI는 부호화되지 않은 속성들, 즉 인간이 개념화·범주화하지 못한 속성들까지 인식했다.
연구진은 훈련을 마친 AI에게 지시했다. 총 6000개에 달하는 분자, FDA 승인 약품, 천연물의 데이터를 분석해서 (1) 항생 효과가 있고, (2) 기존의 항생제와 같지 않으며, (3) 무독성으로 예측되는 분자를 찾으라고 말이다. 6000개 중에서 모든 조건을 충족하는 분자는 단 하나였다. 연구진은 영화 〈2001 스페이스 오디세이〉에 등장하는 AI 할HAL의 이름을 따서 이 분자를 ‘할리신halicin’이라고 명명했다.
프로젝트의 책임자들은 종래의 연구개발법으로 할리신을 찾으려고 했다면 “비용 때문에 엄두도 못 냈을 것”이라고, 즉 실현 가능성이 없었을 것이라고 밝혔다. 하지만 이미 항균 능력이 입증된 분자들의 구조적 패턴을 인식하도록 소프트웨어 프로그램을 훈련하자 더 적은 비용을 들여 더 효율적으로 새로운 분자를 발견할 수 있었다. 이 프로그램은 기존 분자들에게 왜 항균 능력이 있는지 굳이 알 필요가 없었다. 실제로 개중에는 작용 원리를 ‘아무도’ 모르는 분자도 존재했다. 그럼에도 AI는 수많은 물질을 조사해서 아직 그 원리는 몰라도 어쨌든 소기의 효과를 내는 물질을, 즉 지금껏 어떤 항생제도 듣지 않던 내성균들을 사멸시키는 물질을 찾아냈다.
할리신의 발견은 쾌거였다. 제약은 체스와 비교도 안 되게 복잡한 분야다. 체스는 말의 종류가 6개뿐이고, 각각의 말을 움직이는 방법이 정해져 있으며, 승리 조건도 상대방의 킹을 잡는 것뿐이다. 반면에 신약을 개발할 때 고려할 수 있는 분자는 수백·수천·수만 개에 이르고, 각 분자가 바이러스나 박테리아의 다양한 생물학적 작용에 반응하는 방식도 제각각일 뿐만 아니라 대체로 뚜렷하게 밝혀지지 않았다. 비유하자면 게임을 하는데 말의 종류가 수천 개이고, 승리 조건이 수백 가지이며, 그 규칙 중 일부는 확실히 알려지지 않은 상황이다. 하지만 AI는 수천 건의 성공 사례를 분석해 그때까지 인간이 진가를 몰랐던 새로운 항생제를 발견했다.
그런데 이 연구에서 가장 인상적인 부분은 AI가 탐지하는 ‘관계’였다. 원자량과 화학결합 같은 화학 개념은 인간이 분자의 특성을 표현하기 위해 만든 것이다. 하지만 AI는 인간이 탐지하지 못했던 관계, 어쩌면 인간이 기술하는 것 자체가 불가능할 관계까지 포착했다. MIT 연구진이 훈련한 AI는 이전에 인간이 분자들의 특성을 관찰해서 내린 결론을 단순히 요약하는 수준이 아니었다. MIT의 AI는 인간이 인지하지도 규정하지도 못한 분자들의 새로운 속성을, 좀 더 구체적으로 말하자면 그 구조적 특성과 항생 능력 사이에 존재하지만 인간이 알지 못했던 관계를 탐지했다. AI는 인간이 따라가지 못할 정도로 빠르게 데이터를 처리했을 뿐만 아니라, 인간이 그간 탐지하지 못했고 어쩌면 영영 탐지할 수 없을 현실의 측면을 발견했다.
몇 달 후 인공지능 연구소 오픈AI에서, 글감을 제시하면 인간이 쓴 것 같은 문장을 생성하는 GPT-3이라는 AI를 공개했다그 이름은 ‘생성형 사전훈련 트랜스포머Generative Pre-trained Transformer’의 약자이며 3은 ‘3세대’를 뜻한다. GPT-3은 미완성 문장을 제시하면 완성된 문장을 만들고, 주제문을 제시하면 문단을 만들고, 질문을 제시하면 답을 만들고, 주제와 배경 정보를 제시하면 완성된 글을 만들고, 대사를 제시하면 대화를 만든다. 주제가 무엇이든 온라인에 관련 정보만 있다면 GPT-3은 글을 생성한다. 온라인상의 정보로 훈련하기 때문이다.
(본문 중 일부)
★ 저작권법에 의해 한국 내에서 보호를 받는 저작물이므로 무단전재와 복제를 금합니다.