본문 바로가기
DIY Data Science/Recommender System

[Recommender System] 내용 기반 추천 시스템(Contents-Based Recommender System)

by LydiaRyu 2022. 2. 13.
반응형

 

먼저 내용 기반 추천 시스템이란, 

추천 시스템의 한 종류로 사용자(User)가 경험하고 평가했던 아이템(Item)을 기반으로 분석하여 추천하는 것을 말한다. 

 

예를 들어, 쇼핑몰에서 좋은 평점을 매긴 아이템, 긍정적인 리뷰가 많은 아이템, 구매한 내역이나 장바구니에 추가한 아이템(Item)들을 기반으로 그와 비슷한 새로운 아이템을 추천한다. 

 

  • 프로세스(Process)

1) 콘텐츠에 대한 특징(feature) 분석

 

먼저,  정형 데이터와 비정형 데이터로부터 얻을 수 있는 정보를 통해 콘텐츠에 대한 분석이 필요하다. 

이때 모든 아이템들에 대한 분석이 필요하며 이를 벡터(Vector)화 하여 생성한다. 아이템을 분석할 수 있는 요소는 다양하게 존재한다. 

 

쇼핑몰의 경우 제품의 카테고리, 색상, 계절, 제품의 설명 등의 정보가 주어지고, 영화의 경우 영화 리뷰, 장르, 가사, 제목 등으로 정보를 파악할 수 있다.

 

2) 사용자의 프로필(profile) 분석

 

평점의 평균 및 분포, 리뷰에 대한 텍스트 분석과 같이 사용자가 아이템들에 대해 어떻게 선호도를 가지고 있는지 또는 사용자 자체가 어떤 사람인지에 대한 분석을 한다. 분석한 내용을 metrix로 만들어 사용자가 좋아하는지 안 좋아하는지 분류 문제로 접근하여 해결한다. 

 

어플이나 홈페이지를 이용하기 전에 선호하는 것들을 선택하는 항목과 같이 설문조사나 선호도 파악을 통해 사용자의 정보를 얻거나 기존의 사용자가 이용했던 내역 등을 토대로 사용자의 프로필을 분석한다. 또한, 댓글이나 찜한 상품 등으로도 범위를 넓혀 파악할 수 있다. 

 

3) 유사한 아이템 선정 및 추천

 

1) 번과 2) 번에서 얻을 수 있는 정보를 토대로 사용자가 선호할 것 같은 유사한 아이템을 추천한다.

 

유사도는 유클리드 거리(Euclidean Distance), 코사인 유사도(Cosine Similarity), 맨해튼 거리(Manhattan Distance) 등의 방법을 이용하여 계산할 수 있다. 각 방법별로 최적적의 아이템을 선정하여 사용자에게 추천한다. 

 

 

 

 

728x90

댓글