2023년 미국의 온라인 매체 <인포메이션>은 아마존의 세계 최초 무인 자동화 매장 ‘아마존 고’의 ‘저스트 워크 아웃’(Just walk out)에 대한 기사 하나를 게재했다. 저스트 워크 아웃은 아마존이 야심 차게 선보인 인공지능 기반 무인 자동결제 시스템이다. 고객이 매장에 입장할 때 앱을 스캔하면 계산대에서 줄을 설 필요 없이 간편하게 물건을 집어서 나올 수 있다. 계산은 매장에 설치된 카메라와 센서가 구매한 물건을 추적해서 따로 요금을 청구하는 ‘신기한’ 방식이다. 아마존에 따르면 이 시스템은 ‘생체정보 수집’이라는 기존 빅데이터 기반 기술의 비윤리성을 해결하고 ‘컴퓨터 비전’을 머신러닝에 적용한 획기적인 인공지능 자동화 기술이다.
그런데 <인포메이션>은 자동화 시스템이라고 알려진 이 기술 뒤에 사실상 보이지 않는 1천여 명의 인도 노동자가 있다고 ‘폭로’했다. 인공지능이 자동으로 구매자의 행동을 인식하는 것이 아니라 카메라 배후에서 인간이 그 장면을 감시해서 판단하는 시스템이라는 것이다. 이 보도는 엄청난 파장을 낳았고, 인공지능에 대한 부정적 시선을 증폭시키면서 아마존의 이미지에 타격을 입혔다. 급기야 아마존은 매장에서 저스트 워크 아웃을 대거 철수하고 ‘아마존 대시 카트’(Amazon Dash Cart)를 대신 도입했다. 물건을 담으면 알아서 물건을 인식해 금액을 알려주고 자동 결제하는 카트다. 아마존의 이런 조처는 새로운 기술로 문제가 된 과거 시스템을 대체한 것처럼 보이지만, 딱히 그렇다고 보기도 어렵다. 새롭게 도입했다는 아마존 대시 카트에도 컴퓨터 비전에 기초한 기존의 인공지능 기술을 그대로 적용하기 때문이다.
어떻게 보면 <인포메이션>의 보도를 둘러싼 논란은 생성형 인공지능(연결주의 인공지능)의 원리에 해당하는 컴퓨터 비전과 머신러닝, 나아가 딥러닝에 대한 오해에서 빚어진 일종의 해프닝일 수 있다. 아마존이 사악한 ‘빅 브러더’라서 자신들의 인공지능 기술에 어떤 비밀도 없다고 극구 부인하는 것이 아니다. 아마존 입장에서 생각하면 오히려 이 기술은 생체정보 수집과 관련한 예민한 인권 문제를 피해 갈 수 있는 빅테크 산업의 근본적인 해결책이다. 물론 이런 생각은 다분히 아마존의 편의에서 그렇다는 것이다. 내가 보기에 이 경우는 인공지능에 대한 부정확한 정보로 발생하는 큰 문제를 어떻게 작은 문제로 덮을 수 있는지 보여줄 수 있는 전형적인 사례인 것 같다.
이 보도가 있고 넉 달 뒤 아마존은 자신들의 홍보 블로그 어바웃아마존에 ‘아마존 직원’ 명의로 글 하나를 올렸다. 이 포스팅에서 아마존은 비교적 자세하게 저스트 워크 아웃 시스템이 어떻게 인공지능을 ‘트레이닝’하는지 설명하고 있다. 이 기술은 사적인 생체정보를 수집할 필요 없이 매장에서 일어나는 고객의 행동을 컴퓨터 비전을 통해 패턴화한다. 이렇게 패턴화한 이미지를 종합해서 ‘포토리얼리스틱 세트’를 만든다. 이 과정이 바로 인공지능의 ‘학습’ 또는 ‘훈련’이고 이 작업을 머신러닝이라 부른다.
여기에서 중요한 두 용어는 컴퓨터 비전과 머신러닝이다. 컴퓨터 비전은 시각 이미지에서 의미 있는 정보를 추출해서 이를 빅데이터화하는 방식이다. 영상 처리와 패턴 인식이 기본적인 작업인데, 픽셀을 2차원 벡터로 표현해서 이미지를 조작하고 분석한다. 이 조작과 분석이 바로 머신러닝 과정이다. ‘상징적 인공지능’(기호주의 인공지능)이 봉착했던 난관을 극복한 방식이 바로 컴퓨터 비전을 활용한 머신러닝이다. 상징적 인공지능이 사이버네틱스와 정보이론에 근거해 인간 사고의 규칙과 논리를 알고리즘화하고 이 ‘추상기계’에 맞춰서 실행을 제어하는 것이었다면, 연결주의 인공지능은 인간 두뇌의 작동 방식에 착안해서 데이터의 알고리즘을 구축하고 이 세트의 조합을 최적화해가는 방식이다. 연결주의 인공지능은 과거 사이버네틱스와 정보이론에 기반을 둔 ‘좋은 구식 인공지능’(GOFAI)과는 다른 차원으로 ‘도약’했다고 볼 수 있다.
앞으로 계속 반복해서 논의하겠지만 이해를 위해 우선 짧게 정리하자면, 예전의 상징적 인공지능이 인간의 마음을 기계화하려고 했다면 컴퓨터 비전을 활용한 연결주의 인공지능의 경우는 기계가 인간의 마음이 되는 단계다. 이 말은 과학소설에서 즐겨 그려지거나 또는 몇몇 호사가가 상상하는 것과 달리 기계가 인간보다 더 높은 수준의 초지능을 획득한다거나 독자적인 자유의지를 갖게 될 것이라는 의미가 아니다. 당연히 인공지능은 인간처럼 우울증을 앓거나 실연에 빠질 리가 없다. 그렇게 보이도록 프로그램화할 수는 있겠지만, 말 그대로 그 상태는 최적화에 적합한 모델일 수가 없다. 이 사실은 기계보다 인간이 우월하다거나 기계는 결코 인간의 독창성을 흉내 낼 수 없다는 따위의 이야기가 아니다. 이 말의 본뜻은 인공지능의 추상 원리인 알고리즘이 연결주의 인공지능에 오면 달라진다는 것이다. 한마디로 과거 인공지능의 목적이 인간을 통제하는 것이었다면 연결주의 인공지능의 목적은 인간보다 더 인간다워지는 것이 됐다. 이에 대한 자세한 설명은 뒤로 미루고 아마존의 저스트 워크 아웃 쟁점으로 돌아가보자.
<인포메이션> 보도는 컴퓨터 비전을 머신러닝 방식으로 삼는 저스트 워크 아웃의 원리에 대한 오해에서 비롯됐지만, 아예 완전히 무의미한 지적은 아니었다. 애초에 저스트 워크 아웃을 마치 새로운 기술이기나 한 것처럼 홍보한 아마존에 일차적 책임이 있기 때문이다. 아마존 스스로도 밝혔듯이, 이 기술은 결코 새롭거나 획기적인 기술이 아니라 오히려 연결주의 인공지능이라면 일반적으로 적용하는 방식이다. 상징적 인공지능이 노버트 위너와 클로드 섀넌의 사이버네틱스와 정보이론에 근거했다면 연결주의 인공지능은 프랭크 로젠블랫이 창안한 퍼셉트론이라는 신경연결망 이론에 근거하고 있다. 1958년 미국 해군연구소에서 일하던 로젠블랫은 이 이론을 확정하면서 “드디어 과학소설에서나 보던 인간의 자질을 갖춘 기계의 탄생을 목격하고 있다”고 자부했다. 그러나 이런 그의 확신이 실현되기까지 반세기가 더 필요했다. 상징적 인공지능의 대표 주자 중 한 명인 마빈 민스키가 <퍼셉트론>이라는 책에서 이런 로젠블랫의 모델이 코딩의 배타적 OR 연산을 하지 못한다고 일갈하면서 연결주의 인공지능은 사망선고를 받은 듯했다. 배타적 OR 연산이란, 비트 연산에서 두 비트가 서로 다른 경우에만 1이 되고 그렇지 않으면 0이 되는 연산자이다.
그러나 민스키의 선언과 달리, 1980년대에 거의 불가능한 기획으로 여겨졌던 연결주의 인공지능은 오늘날 이 분야에서 대세로 자리 잡았다. 이런 전환은 기존에 이뤄졌던 인공지능에 대한 인문학적 비판, 말하자면 ‘기계는 결코 인간을 넘어설 수 없다’거나 ‘인간을 대신할 수 없다’와 같은 주장을 무력화하는 측면이 있다. <인포메이션>의 보도가 바로 이런 문제를 보여주는 사례에 속한다고 볼 수 있는데, 상징적 인공지능과 연결주의 인공지능을 구분하지 않았기에 이런 폭로 아닌 폭로가 기사화했던 것이다.
그렇다면 민스키 같은 인공지능 초창기 개발자마저 불가능하다고 선언한 연결주의 인공지능은 왜 지금 와서 다시 봄날을 맞고 있을까. 여러 견해가 있을 수 있겠지만, 내가 생각하기에는 무엇보다도 1990년대에 이뤄진 반도체가 대표하는 컴퓨터 하드웨어 기술의 비약적 발전과 그에 따른 인터넷과 빅데이터의 구축이 연결주의 인공지능의 현실화를 가능하게 한 가장 중요한 물적 토대다. 그리고 다소 변죽을 울리긴 했지만 <인포메이션>의 기사를 통해 우리는 이런 연결주의 인공지능을 가능하게 한 또 하나의 중요한 물적 토대를 확인할 수 있다. 바로 글로벌라이제이션을 통해 만들어진 국제적인 노동 분업이다.
인터넷과 그에 따른 국제적 통신 네트워크는 디지털 기술에 기반을 둔 플랫폼 경제를 발전시켰고 광범위한 빅데이터 구축을 가능하게 했다. 이런 외부적 조건의 형성은 인공지능 내적인 기술 발전을 위한 ‘보이지 않는 손’을 값싼 비용으로 고용할 수 있게 했는데, 바로 이 분야에서 앞서 나간 장본인이 아마존이었다. 아마존이 강조하는 저스트 워크 아웃의 자동화를 위한 머신러닝은 초기 단계에서 컴퓨터 비전을 통해 획득한 이미지 데이터를 판단하기 위한 인간의 개입이 필수적이다. 그래야 머신러닝 과정을 통해 획득한 데이터를 인간의 두뇌를 모방한 다층 퍼셉트론(MLP) 신경망으로 최적화하는 딥러닝이 가능하다.
<인포메이션>이 폭로한 아마존이 고용한 1천여 명의 인도 노동자는 컴퓨터 비전이 2차원 벡터로 표시한 이미지를 판별하는 일을 했다. 컴퓨터 비전 자체는 어떤 이미지를 수집할 수 있지만, 그 이미지가 무엇인지 기계는 알지 못한다. 그렇기 때문에 이미지에 의미를 부여하는 작업에 인간의 개입이 필요하다. 예를 들어, 어떤 이미지가 사과이고 어떤 이미지가 바나나인지 구분하고 정의하는 작업은 인간의 몫이다. 당연히 더 많은 데이터를 축적하려면 더 많은 노동력을 고용해야 하고, 당연히 그 고용 임금이 낮을수록 아마존 같은 기업이 선호할 것이다. 그래서 정작 인공지능 자동화의 필요성을 거의 느끼지 못하는 남반구 노동자가 대거 머신러닝을 위한 작업에 참여하는 역설이 발생한다.
이렇게 수작업을 통해 데이터가 축적되면 다음 단계인 딥러닝 과정을 거쳐 자동화에 도달하게 된다. 앞서 말했지만, 이런 작업 방식은 저스트 워크 아웃에만 해당하는 것이 아니다. 아마존에 접속하면 ‘아마존 메커니컬 터크’(MTurk)라는 이상한 공지를 발견할 수 있다. 아마존의 소개를 보면, 아마존 메커니컬 터크는 연중무휴 24시간 개인과 기업의 의뢰에 따라 전세계에 분산된 인력을 고용해서 작업을 수행하는 크라우드소싱 마켓플레이스라고 돼 있다. 난해한 공학 은어로 문장이 구성됐지만, 한마디로 정리하면 머신러닝 같은 아마존 기술개발을 위해 파트타임으로 참여하면 돈을 준다는 내용이다. 최첨단 인공지능이 이런 원시적인 고용구조 위에서 작동한다는 사실은 우리에게 오늘날 창궐하고 있는 ‘인공지능 신화’를 다시 돌아보게 한다. 다음 회차에서 이 역설에 대해 좀더 역사적인 맥락을 짚어보도록 하겠다.
이택광 문화비평가·경희대 글로벌커뮤니케이션학부 영미문화전공 교수
한겨레 인기기사
[속보] 우크라 공군 “러시아, 오늘 새벽 ICBM 발사”
[속보] “우크라군, 러시아 ICBM 발사”
김정은 기다리게 한 ‘7초’…악수하자는데, 북한군 고위급은 경례중
박정훈 대령 “윤 격노는 사실…국방부 장관 전화 한 통에 엉망진창”
두바이서 로맨스 한 죄 무려 ‘징역 20년’…영 10대, 정부에 SOS
‘이재명 집회’ 교통비 지급에…국힘 “불법 자금 동원, 선관위 조사 촉구”
홍철호 사과에도 “무례한 기자” 파문 확산…“왕으로 모시란 발언”
돈 없다더니, 김치통에 5만원 다발로 2억…“고액체납자 끝까지 추적”
이기흥 체육회장, 직무정지에도 출근…문체부 처분 정면 위반
“망할 것들, 권력 쥐었다고 못된 짓만” 연세대 교수 시국선언 [전문]