‘혐오가 문제’라고 모두 말하지만, 각자가 인식하는 혐오는 다르다. 무엇을 어디까지 혐오로 인식할지, 어떻게 접근하고 어떤 해결책을 모색할지를 두고 또 다른 충돌이 발생한다. 이 때문에 혐오의 원인과 맥락에 접근할 길을 찾는 대신, 겉으로 드러난 갈등 자체만을 정치적으로 이용하려는 흐름이 두드러진다.
<한겨레21>은 이같은 혐오 현상을 새로운 접근법으로 분석해보려 했다. 1부에서는 지식콘텐츠 스타트업 ‘언더스코어’와 함께 온라인 커뮤니티와 포털 뉴스 댓글 등의 빅데이터를 분석해 한국의 혐오가 온라인 공간에서 어떤 맥락 안에 축적돼왔는지를 살폈다. 온라인 공간은 오프라인 공간보다 혐오를 둘러싸고 가장 치열한 논쟁이 벌어지는 곳이며, 언론과 정치인의 목소리를 통해 혐오가 확대재생산될 가능성이 큰 곳이기도 하다. 여성혐오 표현에 거울을 비추는 방식(미러링)으로 혐오를 되돌려주려 한, 온라인 커뮤니티 ‘메르스갤러리’의 성장 전후로 일간베스트저장소, 에펨코리아 등 남초 커뮤니티에서 어떤 흐름이 나타났는지, 퀴어문화축제 개최 전후로 포털 뉴스 이용자의 혐오 댓글 작성 행태에 어떤 변화가 있었는지 등을 분석했다. 분석 방법으로는 혐오표현을 학습한 인공지능(AI) 알고리즘(헤이트스코어 알고리즘)을 이용했다. 1부에 이어 제1434호에 연재되는 2부에서는 혐오표현과 혐오범죄 등에 대응하는 외국의 사례를 전할 예정이다. _편집자주
‘#신당역살인사건은_여성혐오사건이다’ ‘#강남역_이후_무엇이_바뀌었나’. 서울지하철 신당역 스토킹 살인사건이 발생한 뒤 트위터, 인스타그램 등에서는 이런 해시태그(#)가 확산됐다.
신당역 사건은 2016년 강남역 여성 살인사건과 달리, 학문적으로는 ‘여성혐오 범죄’라기보다 성차별적 문화 탓에 일어난 ‘젠더 기반 폭력 사건’이라고 규정하는 것이 정확하다고 전문가들은 말한다. 여성혐오 범죄는 단지 여성이라는 이유만으로 피해자가 되고, 가해자의 성차별적 편견이 범죄 동기라는 점을 입증해야 하는데 “입증이 쉽지 않아 불법촬영, 스토킹 등을 여성혐오 범죄로 부를 경우 오히려 젠더 기반 폭력에 대한 논의를 축소할 수도 있기”(홍성수 숙명여대 법학과 교수) 때문이다.
그러나 이러한 학문적 규정만으로 신당역 사건을 모두 설명하기는 어렵다. 앞서 말한 해시태그 달기 운동, 신당역 추모공간에 붙은 ‘이것은 여성혐오 범죄다’라고 쓰인 메모지 등에는 반복되는 여성 대상 폭력 사건과 미비한 처벌에 대한 분노 등이 깔려 있기 때문이다. “이번 사건을 (여성혐오 범죄로) 보지 않는다”고 말한 김현숙 여성가족부 장관의 발언에 대해 ‘이것은 여성혐오’라는 비판과 분노가 이어지는 까닭 역시 마찬가지다. ‘여성에 대한 구조적 성차별이 존재하지 않는다’고 말하는 현 정부에 항의하는 차원이 강하다.
김현숙 장관은 유달리 ‘젠더갈등’이란 말을 자주 쓴다. 예컨대 이런 식이다. 그는 “(여가부는) 사회가 당면하고 있는 젠더갈등을 풀어나갈 수 있는 부처”여야 하며, “문재인 정부 때 젠더갈등이 훨씬 격화됐는데 이는 여가부가 20대 남성이 느끼는 역차별 느낌을 안 받아줬기 때문”이라고 말했다.
그의 발언에는 공통된 전제가 있다. ①한국 사회의 큰 문제는 20대를 중심으로 발생하는 젠더갈등이다. ②젠더갈등은 페미니스트 정부를 자처해 여성 중심 정책을 추진했기 때문에 일어났다. ③젠더갈등을 해소하는 방법은 남성의 이야기를 더 듣는 것이다. 이같은 젠더갈등 프레임은, 구조적 성차별과 여성혐오에 대한 고민이 놓여야 할 자리를 빠르게 대체하고 있다.
한국언론진흥재단의 뉴스 빅데이터 분석 시스템인 ‘빅카인즈’에서 ‘젠더갈등’이라는 단어가 포함된 기사의 추이를 검색했더니, 젠더갈등 프레임은 2018년 하반기부터 나타났다.(44쪽 그림1 참조) 2019년 한 차례, 2021~2022년 일곱 차례 젠더갈등 관련 기사가 급증했다. 국민의힘 하태경 의원과 이준석 전 대표가 2021년부터 본격적으로 이런 담론을 이끌었다. “여당은 젠더갈등을 부추겨 (4·7) 재보선에서 패배했다”(이준석), “여가부는 젠더갈등 조장부”(하태경) 등 ‘젠더갈등’이라는 단어를 이용한 정치 공세가 이어졌다. 최근 김현숙 장관의 말과 꼭 같은 논리다. ‘여가부’라는 단어가 튀어나올 때마다 ‘젠더갈등’을 언급하는 기사 수가 치솟았고, 더불어민주당도 재빠르게 이를 학습했다. 2021년 11월 이재명 당시 민주당 대선 후보는 자신의 페이스북에 ‘광기의 페미니즘을 멈춰달라’는 온라인 커뮤니티 ‘디시인사이드’의 글을 공유했다. 국민의힘과 똑같은 논리로 여성정책을 비판하는 글이었다.
추지현 서울대 사회학과 교수는 젠더갈등 프레임이 “젠더 관계를 문제 삼는 일체의 시도를 집단 간 갈등을 부추기는 행위로 만들고 페미니즘을 그 거점으로 지목하며 이를 비난하는 방식으로 작동한다”고 지적한다. 갈등은 바람직하지 않다는, 마치 중립적 주장인 듯한 외양을 띠지만 결국 “남성을 불편하게 하지 말라”는 의미이고 페미니즘을 이야기하지 말라는 ‘함구령’으로 작용한다는 설명이다.(2022년 8월16일 ‘젠더 갈라치기라는 새로운 함구령을 넘어 젠더폭력에 저항하고 애도하기’ 토론회)
정치인들은 어디서 이런 ‘갈등’ 프레임을 가져오는 걸까. ‘워마드’ 폐쇄를 최우선 목표로 삼았던 하태경 의원과 이준석 전 대표, ‘에펨코리아’(펨코)에 인사를 남겼던 이재명 의원에게서 힌트를 찾을 수 있다. 바로 온라인 커뮤니티다. 특히 대형 남초 커뮤니티인 펨코에서는 젠더갈등이 심각해진 현실에 개탄하는 게시물을 쉽게 찾아볼 수 있다. 그들의 논리는 이렇다. “이건 다 (여성 커뮤니티인) ‘메갈’(메갈리아)과 ‘워마드’ 때문이다.”
“그들(메갈과 워마드)은 여성차별과 여성혐오에 대응해 남성혐오를 표출하는데 이는 오히려 여성혐오를 더욱 심화시키는 결과를 낳고 있다.”(펨코, 2016년 5월22일)
“메갈, 워마드, 트페미(트위터에서 활동하는 페미니스트)들이 한국 페미니스트의 심볼같이 돼버렸는데 결과적으로 여성혐오만 더 키웠지.”(펨코, 2017년 7월4일)
정말 메갈과 워마드 때문에 여성혐오가 더 심해졌을까. 지식콘텐츠 스타트업 ‘언더스코어’와 함께 일간베스트저장소(일베)와 펨코의 여성혐오 게시글과 댓글 추이를 분석해봤다. 일베는 2010년대 초·중반, 펨코는 2010년대 후반 가장 높은 이용률을 보인 남초 커뮤니티다. ‘페미니즘 리부트’를 촉발한 대표적 여초 커뮤니티인 ‘메르스갤러리’가 가장 성장한 시기인 2015년 7월 전후 1년 동안을 분석 대상으로 삼았다. 일베에선 ‘일베 게시판’의 인기글 45만1354건(2011년 7월~2016년 12월)을, 펨코에선 ‘페미니즘·여성가족부·메갈리아·워마드·젠더·성차별·성평등’의 단어로 검색해 수집한 글 6166건(2012년 10월~2019년 1월)을 분석했다. 펨코는 최근 1만 페이지 이내의 게시물만을 제공하고 있어, 5~6년 전 데이터를 확보하기 위해 별도의 검색어를 활용해 게시물을 수집하는 방식을 택했다. 혐오 게시물과 댓글을 분석하는 방법으로는 머신러닝(기계학습)을 이용한 ‘헤이트스코어 알고리즘’을 사용했다.(아래 ‘어떻게 분석했나’ 참조)
분석 결과, 일베와 펨코 모두에서 공통된 경향이 나타났다. 메르스갤러리가 성장하기 이전(2014년 7월~2015년 7월)부터 이미 여성혐오 게시물이 꾸준히 늘어나고 있었다.(그림2 참조) 이 추세는 메르스갤러리가 성장한 이후 1년(2015년 7월~2016년 7월) 동안에도 유의미하게 달라지지 않았다. 오히려 일베의 댓글을 보면, 메르스갤러리 성장 이전 여성혐오 발언 비율 증가폭이 그 이후 1년보다 더 가팔랐다. 댓글이 최소 15개 이상 작성된 게시물 중에서 제목에 ‘페미니즘, 메갈리아, 워마드, 여성가족부’ 등의 단어가 포함된 게시물 1만2532건을 별도로 추출한 뒤 각 게시물의 댓글을 분석한 결과다.
펨코의 경우 여성·페미니즘·여성가족부와 관련한 게시물의 ‘조회수 대비 추천수’를 분석했다. 추천수는 이용자가 해당 게시물에 얼마나 우호적인 의사를 표했는지를 나타낸다. 펨코가 급성장하면서 단순 게시물 수가 늘어났을 가능성을 배제하기 위해서다. 그림3에서 보여지듯이 메르스갤러리 성장 이전 1년 동안 이미 관련 게시물 추천율이 늘어나고 있었다. 이후 1년 동안 추세는 유의미하게 변화하지 않았다. 메르스갤러리 등이 성장한 2015년 10월~2016년 8월 구글에서 ‘페미니즘’이라는 단어를 검색한 양의 변화 추이와 펨코의 여성혐오 댓글 비율 추이를 비교해봐도(그림4 참조) 두 그래프는 완전히 다른 추세를 보였다.
즉, “남초 커뮤니티가 안티페미니즘 성향을 띠는 것을 단순히 온라인 페미니즘 운동의 성장 이후에만 나타난 특수한 젠더갈등이라고 한정해서는 안 된다”(강태영 언더스코어 대표)는 의미다. 권김현영 여성현실연구소장은 “온라인 커뮤니티 안에서 ‘에코체임버’(반향실) 효과로 여성혐오가 자기순환적으로 반복돼왔다는 점, 이들이 여성혐오에 대해 내세우는 (메갈 때문이라는) 전제가 잘못됐다는 것을 보여주는 결과다”라고 말했다.
이처럼 ‘메갈’ 등장 이전에도 존재했던 여성혐오는 끊임없이 “옷을 갈아입으며”(김수아 서울대 언론정보학과 교수) 이어지고 있다. 김수아 교수는 “(여성혐오를) 정당화하는 구조가 달라졌다. 예전에는 연애관계와 관련해 ‘여성이 부도덕하다’는 점을 집중공격했다면 ‘메갈’ 이후에는 ‘이 사람들이 사회적으로 문제를 일으키고 있다’ ‘페미니즘은 불공정한 사상이다’라고 바뀐다”고 설명했다.
실제로 일베에서 여성혐오 강도가 높게 나타난 상위 게시글을 구체적으로 살펴보면, 2011~2015년 가장 많이 등장한 단어가 ‘김치녀’였다. ‘김치녀의 술값 계산법’ ‘뇌 없는 김치녀 특징’과 같은 식이다. 2016년에도 이 추세가 이어지는데 메갈이 ‘페미니스트’ 전체와 치환되면서 새로운 멸칭으로 사용되기 시작했다는 정도의 차이만을 보인다.
펨코의 여성혐오 글 내용 역시 메르스갤러리 성장 이전(2012~2014년)에는 일베와 크게 다르지 않아, 대부분 여성을 성적 대상화하고 있다. 하지만 메갈이 등장한 뒤에는 조금씩 달라진다. 이들 커뮤니티에서는 메갈이 페미니스트, 페미니즘 전체를 가리키는 말로 쓰이는데 메갈 성향을 드러낸 사람을 범죄자 취급한다. 2016년에는 자신이 페미니스트임을 드러낸 이들이 근무하는 회사의 제품을 불매하거나 이들을 업계에서 쫓아내는 소비자운동의 형태까지 나타난다.(45쪽 그림5 참조) 넥슨의 한 게임 성우가 ‘여성은 왕자가 필요 없다’고 쓰인 티셔츠를 입었다는 이유로 게임 이용자들의 항의를 받은 뒤 계약이 해지된 사례가 대표적이다. 최태섭 문화평론가는 “남초 커뮤니티발 집단행동주의의 시초라고 볼 수 있는 넥슨 사태는 불매운동과 집단항의라는 여성들의 운동 방식을 모방한 측면이 컸다”고 말했다. 레진코믹스 소속 웹툰 작가들에게 이른바 ‘메갈 성향’이 보인다는 이유로 탈퇴 인증 게시글을 올리는 집단행동이 이어진 것도 이 무렵이다.
2017년 대선을 거치면서는 문재인 정부, 정의당, 여성가족부 등을 함께 언급하며 정치·정책적으로 비판하는 게시글의 형태가 나타났다. 2018년 5~12월엔 메갈과 페미니즘에 대한 반감이 더욱 높아지고 여성혐오 표현도 다양해졌다. 서울 혜화역에서 불법촬영 범죄에 항의하는 ‘불편한 용기’ 집회가 이어졌던 때다. 이 기간에 펨코 추천 비율 상위 10개 글 중 8개는 ‘페미’ ‘메갈’ ‘워마드’를 혼용한 비난글이었다. 특정 콘텐츠나 인물을 향한 ‘좌표찍기’도 더욱 활성화한다. <82년생 김지영>을 비난하고 여성 유튜버, 여성 게임 스트리머를 신고해달라고 부탁하는 글 등이 예다.
이처럼 매번 겉으로 드러나는 양상만 달라질 뿐 온라인 공간에서의 여성혐오는 지속돼왔다. 이런 맥락을 완전히 삭제한 채, 여성혐오를 ‘젠더갈등’이라는 구도로 치환하는 것은 과연 정당한가.
손희정 경희대 비교문화연구소 교수는 “온라인 남초 커뮤니티란 공간 안에서 (메르스갤러리 성장 등 페미니즘 리부트 이후) 혐오가 양적으로 확장되지 않았다면 이들의 말을 그대로 옮겨와 기삿거리나 의제로 만드는 언론과 정치권의 문제점을 짚어야 한다”고 지적했다. 혐오를 정치적 도구로만 활용하는 토양 위에서 혐오는 무럭무럭 다시 자라난다. 지금의 젠더갈등 프레임을 넘어서는, 혐오에 대한 새로운 질문이 필요한 이유다.
박다해 기자 doall@hani.co.kr
[어떻게 분석했나] 3만5천 개 텍스트 학습한 AI가 게시글·댓글 정밀분석
‘혐오’를 주제로 한 <한겨레21>의 기획취재에서 언더스코어는 ‘헤이트스코어(HateScore) 알고리즘’을 바탕으로 에펨코리아, 일간베스트저장소 등 온라인 커뮤니티 게시물과 네이버와 다음 등 포털 뉴스 댓글을 분석했다. 사람이 직접 온라인 커뮤니티나 댓글을 하나하나 살펴볼 수도 있겠지만, 그 자의적인 판단 가능성을 최소화하고 몇십만 건에 이르는 대규모 데이터의 혐오표현 정도를 하나하나 측정하기 위해서는 정량적인 접근이 필요하기 때문이다.
‘헤이트스코어 알고리즘’은 언더스코어가 스마일게이트AI의 지원을 바탕으로 수집한 3만5천여 건의 온라인 텍스트 데이터를 머신러닝(기계학습)으로 학습했기에, 기존처럼 단순히 게시물 수, 특정 단어의 출현 빈도만을 분석하는 방법을 넘어선다. 또 이분법적으로 악플은 ‘1’, 악플이 아닌 댓글은 ‘0’으로 단순 분류하는 대신, 여성·지역·성소수자·외국인·연령 등 다양한 분야에 대한 다중레이블 방식으로 데이터를 학습하도록 했다.
다중레이블은 하나의 게시물 또는 댓글이 둘 이상의 집단을 동시에 혐오하는 표현을 포함하는 경우를 효과적으로 처리한다는 장점이 있다. 예를 들어 ‘좆족은 21세기의 홍어다’라는 문장에 입력값이 주어졌을 때, 단일레이블 방식으로는 여성/성소수자/남성/인종/지역/종교/연령 중 딱 한 가지만 선택해서 분류할 수 있다. 하지만 다중레이블 방식으로 학습한 헤이트스코어 모델은 해당 문장에 인종혐오와 지역혐오가 모두 포함됐다고 판단이 가능하도록 설계됐다.
헤이트스코어 모델을 활용하면 특정한 댓글이나 게시물의 혐오표현 비율이 어떻게 되는지, 시간의 흐름에 따라 그 변화 양상이 어떻게 되는지를 측정할 수 있다. 예를 들어 ‘퀴어문화축제가 열림으로써 온건층 또는 중도층의 성소수자에 대한 반발감을 오히려 높이는가’와 같은 질문에 성소수자와 관련한 포털 뉴스에 혐오 댓글을 남기는 이용자들의 혐오표현 비율 변화를 분석함으로써 답을 찾으려 한 것이다.
이렇듯 주어진 문장이 혐오발언인지 아닌지, 만약 혐오발언이라면 여성혐오인지 성소수자혐오인지 지역혐오인지 그 확률값을 0~100%에서 계산하도록 하는 헤이트스코어 모델 이외에, 텍스트의 특성을 정량화하기 위해 군집화(clustering) 알고리즘도 이번 분석에서 함께 활용했다. 예를 들어 드라마 <이상한 변호사 우영우>와 관련한 에펨코리아 게시물에서 ‘뒤로 갈수록 PC스러운 소재들이 계속 나오네’라는 문장은 명시적인 혐오발언이라고 볼 수는 없겠지만, 혐오와 관련 있는 소재를 언급했기에 추출할 가치가 있다. 군집화 알고리즘은 이를 위해 주어진 텍스트를 몇 가지 유형으로 나눈 뒤 각 유형이 다루는 주제를 살필 수 있게 돕는다.
지난 몇 년간 여성·성소수자 혐오 등은 소셜미디어에서 많이 회자됐지만, 데이터를 활용해 명확히 답해지지는 않았던 질문이 많았다. 헤이트스코어 모델을 바탕으로 한 정량적인 접근은 ‘지난 10년간 여성혐오의 추세가 어떻게 변화했는지’ ‘과연 퀴어문화축제는 중도층의 성소수자 여론에 대한 백래시(반발)를 유발하는지’ 등 ‘우리의 직관을 넘어 한 단계 더 들어간 질문에 답하기’를 도와준다.
강태영 언더스코어 대표
*본 기획물은 정부 광고 수수료로 조성된 언론진흥기금의 지원을 받았습니다.
한겨레21 인기기사
한겨레 인기기사
‘내란대행’ 한덕수 석달 전 본심 인터뷰 “윤석열은 대인, 계엄령은 괴담”
“백령도 통째 날아갈 뻔…권력 지키려 목숨을 수단처럼 쓰다니”
한덕수, ‘200표 미만’ 탄핵안 가결땐 버틸 수도…국회, 권한쟁의 소송내야
형사법 학자 “내란 반대했어도 회의 참여한 국무위원 처벌 받아야”
새 해운대구청 터 팠더니 쏟아져 나온 이것…누구 소행인가?
국힘 김상욱·김예지·조경태·한지아, 헌법재판관 선출안 표결 참여
분노한 시민들 “헌법 재판관 임명 보류 한덕수 퇴진하라” 긴급 집회
아침에 침대 정리하면 건강을 해칩니다 [건강한겨레]
물에 빠진 늙은 개를 건져주자 벌어진 일 [아침햇발]
[단독] 문상호 “계엄요원 38명 명단 일방 통보받아 황당” 선발 관여 부인