끄적끄적/생각

포털 사이트의 뉴스 추천 알고리즘의 사례 및 문제점 : 네이버 AIRS, 카카오 루빅스, 필터버블

그랴 2022. 3. 21. 21:36

( 학교 수업 과제로 썼는데,,, 나름 잘 쓴 거 같아서 저장... (✿◠‿◠) )


 인터넷의 이용이 증가한 요즘은 종이 신문보다는 인터넷 뉴스를 이용하는 사람들의 수가 급속히 증가했다. 수많은 기사가 쏟아지는 인터넷 세상에서 적극적으로 뉴스를 찾아보는 사람도 있는 반면, 관심있는 뉴스를 찾아보지 않고 포털이 제공하는 뉴스 큐레이션에 따라 뉴스를 소비하는 사람들도 상당히 많다. 적극적으로 뉴스를 찾아보거나 관심있는 주제를 찾아보는 수용자의 경우에도 기존 뉴스에서 자주 접한 뉴스를 바탕으로 뉴스 관심사를 설정할 가능성이 높을 수 밖에 없으며, 이는 곧 포털이 어떤 방식으로 뉴스를 제공하고 큐레이션하는 가가 언론 생태계와 연결될 수 밖에 없다는 것을 의미한다.

 

 뉴스 이용에 사용되는 알고리즘은 크게 2가지가 있다. 중복기사 배제 알고리즘은 언론사 내 기사 중복과 언론사 외 기사 중복을 배제하며 최근접 이웃 분류기(K-Nearest Neighbor Classifier)를 이용한다. 추천 알고리즘은 뉴스의 속성을 기준으로 하는 콘텐츠 기반 추천/이용자 뉴스 사이에 측정된 유사성을 기준으로 하는 협력적 필터링 추천이며, 네이버의 ‘Airs’와 카카오의 루빅스가 있다.

 

 네이버의 ‘AIRS’AI Recommender System 또는 AI Recommendation and Search의 약자로서 네이버의 추천과 검색의 개인화 추천/검색 플랫폼이다. 네이버와 라인의 여러 서비스를 통해 뉴스/동영상/웹툰/블로그 추천 등 다양한 도메인의 콘텐츠를 대상으로 개인화 추천 서비스를 제공하고 있고, 이러한 서비스의 추천 모델링 업무를 담당한다. 끊임없이 생산되는 다양한 콘텐츠와 대용량 로그를 대상으로 빅데이터 분석에 기반한 추천 모델을 설계하고 이를 구현한다.

 카카오의 루빅스는 실시간으로 사용자 반응을 분석하여 콘텐츠를 추천하는 시스템이다. 루빅스의 첫 적용 사례는 다음 뉴스 서비스였다. 뉴스 콘텐츠는 다른 콘텐츠에 비해서 생명주기가 상당히 짧기 때문에 사용자의 반응을 최대한 빠르게 수집 및 처리하여 추천해야 한다. 따라서 루빅스는 사용자로부터 전달되는 피드백을 최대한 신속하고 안전하게 처리할 수 있는 시스템을 만들기 위해서, 사용자의 피드백 메시지가 대량으로 들어오는 환경에서도 안정적으로 동작하는 메시지 큐와 메시지 큐에 저장된 데이터를 빠른 속도로 처리할 수 있는 데이터 스트림 처리기를 이용했다.

 

 이와 같은 알고리즘들로 이루어진 뉴스 추천 시스템은 과거에 사람이 뉴스 기사를 큐레이션할 때보다 더 공정하고 효과적으로 보여주는 것 같지만, 여러가지 문제점 또한 존재한다. 대표적으로 필터 버블 문제를 볼 수 있다. 필터 버블이란, 정보제공자가 이용자의 관심사에 맞춰 맞춤형 정보를 제공하여 이용자는 필터링된 정보만 접하게 되는 현상이다. 원하는 정보만 보는 것은 편리하고 좋아보이지만, 사회를 객관적으로 파악하는 눈을 기르고, 건강한 사고를 하기 위해서는 다양한 의견의 콘텐츠를 접해야 한다. 특히 필터버블은 편향성을 강화시킬 수 있는 악순환의 고리를 형성하는데, 이는 단순히 개인의 편견과 고정관념을 넘어 사회 전체에 악영향을 끼칠 수 있다. 또한 이러한 문제는 가시적으로 드러나지 않고 점차 진행된다는 점에서 개인이 깨닫지 못할 가능성이 커 더욱 위험하다.

 

 AI 큐레이션이 보편화되면서 뉴스 생산자는 저널리즘 가치 구현보다는 AI 알고리즘의 선택을 받기 위해 자극적인 제목을 단 어그로성 기사를 생산하는 문제가 발생하고 있다. 이재원 이화여자대학교 커뮤니케이션 미디어연구소 연구위원은 구체적인 작동 방식이 알려지지 않은 알고리즘을 예측해 기사를 생산하면서 연예매체 소속 기자들이 양질의 기사를 쓰지 못하는 데 대해 안타까움을 드러내고 있다. 이러한 문제 해결을 위해서 관리자의 개입 또한 필요하지만, 알고리즘이 각 회사의 기밀로서 알려지지 않다보니, 사람은 얼마나 관여하고 있는지 즉, 편집 객관성을 알 수 없는 문제 또한 존재한다.

 

 뉴스 추천에 알고리즘을 적용한 것은 우리에게 맞춤형 컨텐츠를 추천해주는 등의 장점을 가져다 주었지만, 필터버블로 인한 편향된 시각을 주는 등의 문제점 또한 존재한다. 인공지능을 마냥 신뢰하고 따라갈 것이 아니라, 이를 적절한 장소에 잘 제어하여 사용하는 것이 효과적으로 인공지능을 적용했다고 볼 수 있다고 생각한다. 따라서 뉴스 추천 시스템에 적용되는 알고리즘에 대해서는 포털 사이트, 뉴스 생산자(기사), 소비자(독자)의 정기적인 논의를 통해 더 나은 방향으로 발전시켜야한다고 생각한다.

 


[1] 신윤경, 포털뉴스의 AI알고리즘 도입과 구독 서비스에 대한 지역 언론인들의 인식(2022)

[2] 오세욱, 포털의 뉴스 알고리즘: 저널리즘 알고리즘 경향과 분석

[3] 송화연, “AI가 포털 뉴스 편집하자… “심층 기사 대신 클릭용쏟아낸 언론”, 「뉴스원」, 2021.01.25.

[4] 네이버 AIRS, https://naver-career.gitbook.io/kr/service/search/recommendation-airs/al-ml, 2021.09.

[5] 카카오 루빅스, https://tech.kakao.com/2016/04/27/rubics/, 2016.04.27.

[6] 전유진, “편리한 유튜브 알고리즘’, 알고보니 편향된 정보제공? ..’필터 버블개념 소개”, 2021.04.26.