[뉴스비전e 정윤수 기자] "알고리즘은 영업권입니다."

최근 국내 통신사가 빅데이터 기반 국내 상권 분석 현황을 발표하자, 기자는 취재중 "어떤 알고리즘인가"라는 질문을 했고, 이에 대한 통신사 관계자의 답이다. 알고리즘은 고유의 영업권이라 공개하지 못하지만, 이를 적용해 나온 결과치는 신뢰성이 상당히 높다는 것이다.  

알로리즘을 설계하는데 들어간, 엄청난 인력과 시간을 생각하면 일리가 있는 말이다. 

<사진 / 뉴스비전e>

그러나 결과값을 도출하기 위해 설정한 기준은 영업권에 해당되니 이에 대해서는 비공개로 하고, 결과값만 무조건 믿으라는 이 말은, "근거는 따지지 말고, 믿거나 말거나는 각자의 선택이다"라는 뜻과 비슷하다.  

기사, 논문, 보고서, 판결문 등등. 전달 대상을 특정 사람을 대상으로 한정하든 대다수의 사람으로 포괄하든, 전망·의견·사실관계·판단 등을 밝힐 때는 이에 대한 근거를 명확히 제시한다.

심지어 일상생활에서 우리가 사소한 판단을 할때 역시 '마음속 알고리즘'을 적용하고 있다. "이런 근거를 통해 볼때 이런 결과를 예상할 수 있을 것"라는 판단은 생활속에서 늘상 하고 있지만 이를 기계화된 언어로 만들지 않았을 뿐이다. 

그러나 4차산업 시대 기계화되는 알고리즘을 통한 중요한 결과값을 밝히는데 있어서 그 근거는 좀처럼 드러나지 않는다. 사회에 굵직한 파장을 주는 데이터값이라고 하더라도, 이를 도출하기까지의 알고리즘은 이른바 '영업권'에 해당되기 때문이다. 

4차산업 시대에 본격적으로 진입하면서 알고리즘의 독선과 이로 인한 치명적 오류에 대한 우려가 높아진다. 

사회에 파장을 주는 데이터값을 도출하는, 이른바 '알고리즘을 지배하는 사람들'에 대한 책임은 어떻게 부여해야 하는지에 대해 사회적 시스템을 정립해 나가야 할 필요도 대두된다. 

데이터 과학자 캐시 오닐 <사진 / TED>

데이터 사이언티스트 캐시오닐(Cathy O'Neil)은 "대다수 사람들이 객관적이고, 과학적이라고 믿고 있고 있는 알고리즘은 대부분은 마케팅 상술에 해당되는 경우가 많다"고 지적했다. 

예를 들어, 객관적 시각으로 인재를 채용하기 위해 어느 회사가 기계적 알고리즘을 적용한 면접시스템에 적용하는 경우를 가정해보자. 

이를 위해 이 회사에서 과거 성공적인 성과를 낸 직원들의 과거 사례가 데이터로 투입되고, 인공지능은 이에 대한 반복 학습을 통해 앞으로 유능할 것으로 여겨지는 인재상에 대한 결과값을 도출할 것이다. 투입될 과거 데이터에는 여성 ,지역, 출신학교 등의 항목들도 대부분 포함될 것이다.  

만약 이 회사가 과거에 여성, 지역, 출신학교 등에 있어 차별을 둬 왔다면, 알고리즘을 통해 새로 도출될 인재상 역시 크게 달라지지는 않을 것이다. 반복적 학습을 통해 더욱 신뢰도가 높아졌다고 여겨질 인재상은 더욱더 편견에 빠져 있을 가능성이 높다.    

이와 같은 알로리즘의 오류는 회사 뿐 아니라, 정부 및 사회 전반에도 일어날 가능성이 적지 않다. 

데이터 과학이 발전하면서 재판, 수사기법, 선거 등 알고리즘의 적용 범위는 앞으로 점점 확대될 공산이 크다. 

<이미지 / 지오비전>

그럼에도 불구하고, 4차산업시대에 알로리즘은 여전히 '영업권'으로 비밀이다. 그 영향력은 파괴적 수준에 달할 수 있음에도, '영업권'이라는 명분하에 공개되지 않는 알로리즘을 제 3자가 감시할 방법은 없다. 알로리즘을 지배하는 자의 힘은 더욱 높아지고, 이에 대한 견제의 목소리를 내기는 점점 더 어려운 사회가 된다.       

알고리즘, 데이터사이언스의 장점이 높이 평가되면서, 반대급부로, 치명적 오류에 대한 우려의 목소리도 조금씩 올라가고 있다. 

영업권을 보호하면서도 이를 적절히 감시할수 있는 방법에 대한 고민이 더 필요하다. 일각에서 제시되는 '알고리즘 감사제' 등 다양한 각도에서 미래 기술을 담을 제도적 준비에 서둘러야 한다는 지적이 나온다. 

저작권자 © 뉴스비전e 무단전재 및 재배포 금지