위키트리뷴 <사진/ 위키트리뷴 유튜브 영상 캡쳐>

[뉴스비전e 정윤수 기자] 옥스퍼드사전는 2016년 올해의 단어로 ‘탈진실(post-truth)’를 선정했다. 객관적 사실은 무시한 채 진실보다는 감정에 호소하는 현상을 일컫는 말이다. 지난해 영국 브렉시트 사태나 미국 대선, 그리고 올해 국내에서 치른 대선 기간에도 탈진실과 가짜뉴스(Fake News)를 둘러싼 논란이 가열되기도 했다.

인터넷의 유언비어나 음모론이 많아지면서 가짜뉴스가 저널리즘을 위협하는 수준에 도달했다는 경고도 나오고 있다. 지난 대선 당시 국내 미디어에서도 가장 많이 등장했던 단어 가운데 하나는 팩트 체크다. 세계경제포럼이 발표했던 2014년 전 세계 10대 트렌드 역시 ‘온라인에서의 오보 확산(The rapid spread of misinformation online)’을 지적하고 있다.

진실확인, 펙트체크를 위해 진행되고 있는 알고리즘과 데이터분석의 현황을 짚어봤다. 

 

가짜뉴스와의 전쟁을 선포한 지미 웨일스의 ‘위키트리뷴(Wikitribune)’

지미 웨일스는 위키트리뷴을 “망가진 뉴스를 찾을 방법”이라고 말했다. 위키트리뷴은 집단지성과 증거 기반 저널리즘을 결합한 새로운 온라인 뉴스 플랫폼이라고 볼 수 있다.

위키트리뷴은 전문가와 일반 독자가 연합하는 하이브리드 시스템이라고 할 수 있다. 전문 기자가 사실에 근거해서 기사를 쓰면 일반 독자가 위키피디아처럼 기사 내용을 검수하고 사실과 다르면 자유롭게 수정이나 추가를 할 수 있는 것이 특징이다.

또한 위키트리뷴은 기존 인터넷 미디어처럼 광고 등을 수익 모델로 운영하지 않는다. 위키트리뷴은 크라우드 펀딩 형태, 그러니까 기부 방식으로 재원을 마련하는 것으로 알려졌다. 펀딩에 참여하는 독자는 지원자가 되어 위키트리뷴이 다룰 주제에 대한 견해를 제시할 수 있다.

위키트리뷴은 기부를 통해 언론인이 기사를 쓰게 하고 이를 대중이 개선하는 형태의 하이브리드 뉴스 플랫폼이다. 광고 수익에는 전혀 의존하지 않고 기부와 대중의 눈으로 양질의 기사를 만드는 새로운 인터넷 뉴스 형태를 목표로 하고 있다.

미 대학 중심 개발 '클레임버스터'

미국 텍사스대, 미시시피대 등이 참여한 연구팀은 주장의 신뢰도를 검토하는 인공지능 ‘클레임버스터’를 개발중으로, 이미 베타 서비스(idir-server2.uta.edu/claimbuster)를 출시했다. 

사실이냐 거짓이냐의 이분화 된 판단을 막기 위해서, 신뢰도 기반 표시를 해준다.

문장을 입력하면 0.0에서 1.0 사이의 숫자를 표시함으로써, 1에 가까울수록 거짓에 가깝다는 스프레드식 판별로, '거짓의 농도'를 나타내준다. 데이터를 학습한 기계가 기사나 작성글을 분석하는 방식이다. 

 

거짓뉴스의 패턴을 잡은 국내 연구진

KAIST 문화기술대학원 등 국내 연구진은 팩트에 기반하지 않는 뉴스나 글의 패턴을 분석했다. '어쩌면' ,'아마도', '등등 불확실한 표현이다. ~라고 들었다' 정도의 100% 단언적이지 않는 말들도 분류했다.

이와함께 전파자의 특성, 전파방식의 패턴 등을 분석해 루머를 가려내는 방식이다. 

1차적으로 정제된 데이터가 담긴 포털이 아닌, 트위터 등 SNS를 분석하다보니, 하나하나의 문장을 기계가 학습하게 할 수 있는 정제된 데이터가 부족할 경우 적용할수 있는 필터링 방법으로 평가받는다. 

 

한국언론진흥재단이 운영하는 ‘빅카인즈(bigkinds.or.kr)’

국내 연구진과 달리 언론사들의 참여로 기사들의 유사성을 구성하는 알고리즘을 만들수 있었다. 포털의 정보제공을 언론사들의 참여로 어느정도 보완한 것이다.  
 

◆ 데이터 분석 · 알고리즘은 중립적일수 있을지에 대한 불확신

이는 위키피디아의 예를 살펴보면 짐작할 수 있을 것으로 보인다. 위키트리뷴 자체가 위키피디아에서의 경험을 바탕으로 온라인 커뮤니티를 뉴스 제작의 중심에 두겠다는 점을 기존 미디어와의 차별화 포인트로 삼고 있기 때문이다.

위키피디아에서도 글을 작성할 때 사실 정보전달과 팩트체크가 중요하다. 위키피디아의 콘텐츠 편집이나 수정에 기여하는 사람은 3000∼5000명이다. 지미 웨일스는 위키피디아는 합리적 담론을 나눌 수 있고 외부에 중립적 입장을 견지할 수 있다고 말한다.

매월 10억 개가 넘는 기기를 통해 위키피디아에 접속 중이며 지원 언어도 284개에 달한다. 우리나라의 경우에도 위키피디아 내 한국어 콘텐츠 수는 38만1000개로 언어별로 따지면 25번째로 많다고 한다. 기여자 활동이 전 세계에서 16번째로 활발한 국가이기도 하다.

집단 지성의 활발한 참여, 온라인 커뮤니티의 성공방식 자체는 어떤 면에선 이미 검증되어 있다고 할 수 있다. 지난해 미국 하버드경영대학원 연구팀의 연구에 따르면 초기 정치적 편향성을 지적받기도 했던 위키피디아 내 콘텐츠도 시간이 지나면서 중립적으로 변화하고 있다고 밝혔다.

위키피디아 페이지를 15년 거슬러 올라가 분석하면서 정치적으로 좌우 편향 키워드가 얼마나 나왔는지 횟수를 산출해 낸 통계에 따르면, 예전에는 좌편향이던 콘텐츠 내용도 시간이 지나면서 우측으로 이동하면서 결국 중립적 위치로 정착하는 경향을 보였다고 한다.

그러나 '사실에 가깝다' '사실일것이다' ' 그럴 가능성이 적다' 등 여러 정황과 증거를 모아서 판단을 내리는 일을 자동화된 알고리즘 또는 기계가 맡는것에 대해서는 우려를 나타내는 목소리도 많다. 

마치 판결을 하는 판사의 역할을 알고리즘이 하는 것과 비슷하다는 취지다. 

언론학계에서는 “전문가도 오도할 수 있지만, 인공지능에 대한 사람들의 맹신을 고려하면 더욱 위험할 수 있다”라는 우려가 나오는 이유다.

관련기사

저작권자 © 뉴스비전e 무단전재 및 재배포 금지