최제힘의 매거진

베일에 싸인 유튜브 알고리즘의 모든 것

최제힘

2023.02.06 09:00
  • 1105
  • 콘텐츠에 ‘좋아’해줘서 고마워요 -
    2
  • 2

알고리즘의 선택, 어떤 원리로 받는지 알려드립니다 

 

2월 1일 블링 블로그에 업로드 된 에피소드를 각색하였습니다. 원본 아티클을 읽고 싶으시다면 링크를 클릭해 주세요.

 

📌 이 글, 이런 분이라면 꼭 읽어 보세요.

1. 베일에 쌓인 유튜브 알고리즘이 궁금한 분

2. 유튜브 알고리즘의 변천사가 궁금한 분

3. 알고리즘의 선택, 어떤 원리로 받는지 궁금한 분

 

 

알 수 없는 유튜브 알고리즘? No!

 

 

유튜브에서 종종 볼 수 있는 ‘알 수 없는 유튜브 알고리즘 밈'

 

‘알 수 없는 유튜브 알고리즘이 나를 이곳으로 이끌었다.’라는 밈을 아시나요? 유튜브를 보다가 알고리즘 덕에 내 취향인 영상이나 유튜버를 만난 경험이 모두 있으실텐데요. 내가 좋아할 법한 영상들만 추천해 주기에 눈을 떼지 못하고 계속 유튜브를 이용하게 되죠.

 

실제로 유튜브 알고리즘은 유튜브에서 가장 중요한 역할을 맡고 있다고 해도 과언이 아닙니다. 유튜브 CPO(최고 제품 책임자) 닐 모한스가 2019년 한 인터뷰에서 추천 알고리즘 덕분에 유튜브 이용 시청 시간의 70%가 발생한다고 언급했을 정도이니 말이죠. 이렇다 보니 유튜브의 알고리즘의 원리를 궁금해 하는 사람들도 많습니다.

 

 알고리즘의 선택을 받은 것으로 유명한 브레이브걸스 롤린 무대 영상과 다나카

 

특히 콘텐츠 제작자에게 알고리즘의 축복은 꿈만 같은 일이죠. 모든 콘텐츠 제작자라면 21년 브레이브 걸스의 롤린 열풍, 22년 나몰라 패밀리 핫쇼의 다나카 열풍처럼 알고리즘을 타고 내가 만든 콘텐츠가 널리 퍼지길 바랄거에요.

 

그렇다면 유튜브 알고리즘에는 어떤 비밀이 숨겨져 있을까요? 오늘 이 글에서 모두 알려드릴테니, 끝까지 집중해 주세요 😉 

 

 

“유튜브 알고리즘의 존재 이유 ”

 

우선 유튜브 알고리즘의 비밀을 파헤치기 전에, 유튜브 알고리즘의 존재 목적부터 살펴보죠. 유튜브는 영상 시청 플랫폼이고 광고주의 광고를 최대한 많은 사람들에게 노출시키기 원해요. 유튜브라는 플랫폼에 계속 머무르며 광고를 시청시켜야 하기 때문에 사용자가 유튜브에 체류할 수 있는 장치가 필요하죠.

그래서 존재하는 것이 바로 유튜브 알고리즘입니다. 사용자가 계속해서 유튜브의 콘텐츠를 시청할 수 있도록, 사용자의 취향을 저격하거나 호기심을 느낄 수 있는 영상을 추천해 한 영상이 끝난 뒤에도 체류하며 영상을 보도록 유도하죠. 즉 사용자의 특성에 맞춰 좋아할 법한 매력적인 콘텐츠를 선별하는 것이 바로 유튜브 알고리즘의 근본적인 존재 이유에요.

 

 

1. 조회수 중심의 알고리즘

: 사람들이 많이 보는 콘텐츠를 추천하면 되지 않을까?

이를 달성하기 위해 2010년대 초반 유튜브는 조회수가 중심의 알고리즘을 운영했어요. 사람들이 많이 보는 콘텐츠에는 이유가 있다는 논리였죠. 인기가 많은 콘텐츠를 추천한다는 명목으로 조회수가 높은 콘텐츠를 추천 콘텐츠로 제안했어요.

 

 

스팸 먹방 중 낚시성 썸네일을 사용했던 유튜버 밴쯔

 

하지만 단순히 조회수만으로 추천 영상을 선별하다 보니 낚시성 콘텐츠가 많아졌어요. 자극적인 제목과 썸네일로 클릭을 유도하는 콘텐츠가 많았죠. 클릭만을 유도하는 것이 급선무였기에 막상 콘텐츠를 시청하면 내가 원했던 내용과 달랐고 가짜뉴스성 정보가 많아졌어요. 외국에서도 Clickbait(클릭을 유도하는 미끼)라는 말이 있을 정도로 조회수 중심의 알고리즘 때문에 피해 보는 사용자가 속출했죠.

 

 

2. ‘추천’ 알고리즘 시대의 시작

: 이용자의 만족도를 높이기 위한 알고리즘의 등장

이런 문제를 해결하기 위해 유튜브는 추천 알고리즘을 고도화하기 시작했어요. 물론 이순간에도 알고리즘은 수정되고 있기에 유튜브 직원이 아니고서는 정확한 추천 알고리즘을 알 수 없지만, 구글이 논문으로 발표한 추천 영상 목록 제작 알고리즘과 추천 영상 선별 알고리즘을 살펴보면 일반적인 유튜브 알고리즘의 원리를 알 수 있죠. 크게 협업 필터링과 콘텐츠 기반 필터링으로 나눠져 있는데요.

 

1) 협업 필터링(Collaborative Filtering)

 

협업 필터링 예시

 

가장 먼저 협업 필터링이에요. 사용자로부터 얻은 선호 정보에 따라 관심사를 예측하는 방법인데요. 협업 필터링은 사용자 기반 추천과 아이템 기반 추천으로 나눌 수 있어요. 이중에서도 특히 사용자 기반 추천은 취향이 비슷한 사용자를 그룹으로 묶어 영상을 추천해 주는 것을 의미하는데요.

 

예를들어 볼게요. A와 B는 모두 해외축구 관련 영상들을 빼놓지 않고 봤다면 알고리즘은 둘을 유사한 사용자로 인식해요. 그럼 사용자 A가 손흥민 득점 영상을 봤을 때 그와 유사한 성향을 가진 B도 이 영상을 좋아할 것이라 생각하고 추천하는 거죠.

 

 

2) 콘텐츠 기반 필터링(Content-Based Filtering)

 

콘텐츠 기반 필터링 예시

 

다만, 협업 필터링 시스템에는 한계가 있어요. 바로 신규 가입자와 같이 콘텐츠를 시청한 이력이 없는 사용자를 위한 추천이 어렵다는것인데요. 이런 한계를 극복하기 위한 것이 바로 콘텐츠 기반 필터링이에요. 

 

콘텐츠 기반 필터링에서는 사용자가 시청한 콘텐츠와 유사한 특성을 가진 콘텐츠를 추천해줘요. 콘텐츠 자체를 분석하는건데요. 이번에는 사용자 A가 계속 보는 영상을 분석해 보니 모두 뉴진스의 Hype Boy 뮤비 영상이었다고 가정해 볼게요. 그럼 알고리즘은 이 사용자가 좋아하는 콘텐츠는 뉴진스의 영상이거나 Hype Boy라는 영상이라는 특징을 도출할 수 있죠.

 

그럼 이 사용자에게는 앞으로 뉴진스의 콘텐츠가 나올때마다 추천을 해줄 수도 있고, Hype Boy의 라이브 영상이 나올때마다 추천을 해줄 수도 있는거에요. 협업 필터링 시스템에서는 어려웠던 신규 사용자를 위한 콘텐츠 추천이 영상 내용 자체를 분석하는 콘텐츠 기반 필터링에서는 가능하죠. 물론 콘텐츠의 특성에 집중하다 보니 정작 사용자의 취향을 파악해 아예 새로운 영상을 추천하는 것에는 한계가 있지만요.

 

여기까지 대표적인 콘텐츠 추천 알고리즘인 협업 필터링과 콘텐츠 기반 필터링을 알아보았는데요. 이후의 유튜브 알고리즘은 이 둘의 장단점을 적절히 조합한 하이브리드 추천 시스템과 머신러닝 추천 시스템이 병행되며 지속적으로 발전하고 있습니다. 

 

그렇다면 하이브리드 추천 시스템과 머신러닝은 어떤 알고리즘이며, 특징이 있을까요? 더욱 자세한 내용은 원본 아티클에서 다루고 있으니 궁금하신 분들은 링크를 클릭해 보셔도 좋을 것 같아요. 

 

저는 앞으로도 재밌는 유튜브 이야기를 들려드릴 테니 많은 기대 부탁드립니다 👋 다음 오픈애즈 아티클에서 만나요!

  • #유튜브
  • #알고리즘
  • #추천
  • #필터링