Advanced
A Study on Recommender Technique Applying User Activity and Time Information
A Study on Recommender Technique Applying User Activity and Time Information
Journal of the Korea Institute of Information and Communication Engineering. 2015. Mar, 19(3): 543-551
Copyright © 2015, The Korean Institute of Information and Commucation Engineering
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License(http://creativecommons.org/li-censes/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.
  • Received : November 17, 2014
  • Accepted : December 30, 2014
  • Published : March 31, 2015
Download
PDF
e-PUB
PubReader
PPT
Export by style
Share
Article
Author
Metrics
Cited by
TagCloud
About the Authors
소영 윤
Department of Computer Engineering, Pukyong National University, Pusan 608-739, Korea
성대 윤
Department of Computer Engineering, Pukyong National University, Pusan 608-739, Korea
sdyoun@pknu.ac.kr

Abstract
인터넷과 모바일 기기의 사용이 보편화되면서 사용자들이 다양한 웹 사이트에서 자신이 원하는 정보를 찾기 위해 검색과 추천을 이용하는 것이 일상화되고 있다. 본 논문에서는 사용자에게 보다 적합한 아이템을 추천하기위해 사용자의 활동과 시간 정보를 적용하여 시간의 흐름에 따른 사용자의 선호도 변화를 반영한 추천 기법을 제안한다. 제안하는 기법은 아이템 선택 시 고려되는 태그 정보를 포함한 데이터를 카테고리별로 분류한 후 시간 변화에 따른 사용자 선호도 변화 정보를 반영한 데이터만을 사용한다. 해당 카테고리를 선호하는 사용자에게는 협업 필터링 기법에 태그 정보를 적용하여 추출한 아이템을 추천하고, 일반 사용자에게는 태그 정보를 사용하여 계산한 순위를 기반 으로 아이템을 추천한다. 제안하는 기법은 hetrec2011-movielens-2k 데이터셋을 사용하여 실험하였으며 실험을 통해 제안한 기법이 기존의 아이템 기반, 사용자 기반 기법보다 추천의 정확성과 적합성이 향상되는 것을 확인하였다.
Keywords
Ⅰ. 서 론
인터넷이나 모바일 기기 사용이 보편화되면서 사용자들은 자신이 원하는 아이템을 찾기 위해 많은 부분에서 검색과 추천을 이용한다. 이 때 사용되는 추천 시스템은 다양한 e-commerce 사이트에서 사용자들이 이용 가능한 서비스나 제품들에 대해 가치 있는 정보를 찾는데 도움을 주기 위해 사용되는 시스템으로 [1] 사용자들이 선호하는 아이템 리스트를 찾기 위해 입력 받은 선호정보를 사용한다 [2] . 추천 시스템에서 가장 많이 사용 되는 방식은 협업 필터링(collaborative filtering) 기법으로 [3] 목표 사용자와 유사한 선호도를 가진 사용자들을 추출하여 이들의 선호에 기반하여 목표 사용자에게 아이템을 추천하는 방식이다 [4] .
사용자들의 아이템에 대한 선호는 시간이 지나면 대부분 자연스럽게 변한다. 또 e-commerce가 일상화되면서 사용자들은 이전에 비해 아이템에 대한 자신의 선호도 표현에 더 적극적이다. 단순히 아이템에 평가값만을 주는 정도에서 이제는 평가값 이외에 리뷰, 코멘트 쓰기 등을 통해 더 적극적으로 아이템에 대해 평가를 하고 있다. 그러나 전통적인 협업 필터링은 이러한 시간의 변화에 따른 선호와 요구의 변화를 반영하지 못하고 [5] , 대규모의 데이터를 분석하거나 다룰 때 확장성과 비능률적 문제점들을 드러냈다 [6] .
전통적인 협업 필터링의 단점을 보완하기 위해 지속적으로 다양한 연구가 진행되어 왔고, 최근에는 빅데이터 분석 기법들의 발전으로 확장성의 문제로부터 어느 정도 자유로워지면서 사용자들이 상품에 남긴 리뷰나 코멘트와 같은 태그 정보를 분석해서 추천에 활용하는 연구 [6 - 8] 등을 포함해 좀 더 다양한 시도가 이루어지고 있다. 태그 정보는 사용자가 해당 아이템에 대한 선호를 좀 더 적극적으로 표현한 것으로 다른 사용자들이 해당 아이템을 선택하는데 영향을 미치므로 이러한 정보를 활용하는 것은 매우 유용하다.
그러나 사용자들이 남긴 태그는 개인적인 표현으로 매우 다양하여 정보들 간에 관련성을 추출하기에는 많은 어려움이 있고, 단순한 태그 개수의 합을 사용하는 방식은 사용자들의 선호도 변화를 적용하지 못하는 단점이 있다.
본 논문에서는 협업필터링 기법의 단점을 보완하고좀 더 정확한 추천을 위해 태그 정보와 시간의 흐름에 따른 사용자들의 선호 변화를 적용하여 아이템을 추천 하는 방식을 제안한다.
제안하는 기법은 사용자의 선호도 변화에 따른 적합한 이웃 선정을 위해 카테고리별로 분류된 데이터들에 시간의 변화에 따른 사용자의 선호도 변화 정보를 적용 하여 조건에 맞는 데이터만을 최근접 이웃 선정과 예측값 생성에 사용한다. 또한 아이템에 대한 선호도 변화와 태그 정보를 아이템 평가값 계산에 적용하여 아이템 순위를 구한 후 해당 카테고리를 선호하는 사용자는 이웃 기반 예측값과 순위 기반 예측값을 사용하여 아이템을 추천하고 일반 사용자에게는 순위 기반 예측값만을 사용하여 아이템을 추천한다. 제안하는 기법은 사용자의 선호도 변화를 이용해 선호도가 변화된 사용자를 제외함으로써 좀 더 정확한 이웃 사용자 평가 정보를 사용할 수 있으며, 단순히 누적된 태그 정보가 아닌 시간 정보를 적용한 태그 정보를 사용함으로써 아이템들에 대한 최근 선호 흐름을 좀 더 정확히 반영할 수 있어 결과적으로 사용자에게 더 정확한 추천이 가능하다.
본 논문의 구성은 다음과 같다. 2장에서는 관련 연구인 협업 필터링에 대해 기술하고, 3장에서는 제안 기법에 대해 살펴본다. 4장에서는 실제 데이터를 대상으로 제안하는 기법의 성능 평가를 하고 마지막 5장에서는 결론을 기술한다.
Ⅱ. 관련 연구
- 2.1. 협업 필터링
많은 분야에서 사용자들이 원하는 정보를 찾는데 도움을 주는 추천 시스템이 데이터를 처리하여 추천목록을 생성하는 기법은 다양하다 [9] . 그 중 협업 필터링은 사용자가 선호하는 패턴과 유사한 다른 사용자들의 선호도를 이용하여 사용자에게 관련된 아이템이나 서비스를 추천하는 기법으로 추천 시스템 분야에서 가장 성공적인 추천 기법으로 전자상거래 기업이 가장 널리 이용하고 있다 [10] .
협업 필터링은 선호도가 유사한 사용자를 기반으로 예측하는 사용자 기반(user-based) 알고리즘과 유사 아이템들을 기준으로 예측하는 아이템 기반(item-based) 알고리즘이 있다. 사용자 기반 알고리즘은 유사한 선호도를 가진 이웃 사용자들이 평가한 아이템을 기반으로 목표 사용자에게 아이템을 추천하는 방식으로, 사용자들 간에 공통으로 평가한 아이템이 적을 경우 정확한 유사도를 구하기 어려운 문제점이 있다. 아이템 기반 알고리즘은 사용자들이 한번 선택한 아이템과 비슷한 아이템을 다시 선택하는 경향이 있음을 전제로 하여 아이템 간의 유사도를 측정하여 유사한 아이템을 목표 사용자에게 추천하는 방식이다. 이 알고리즘은 아이템 간의 유사도만을 고려하므로 선호도가 비슷하지 않은 사용자들의 평가로 인해 예측 성능이 저하되는 문제점이 있다 [11 , 12] .
- 2.2. 협업 필터링 추천 단계
협업 필터링 기법의 추천은 매트릭스 생성 단계, 유사도 계산과 이웃선정 단계, 아이템 추천 단계로 이루어진다.
매트릭스 생성 단계에서 시스템은 사용자들이 상품을 평가한 데이터를 기반으로 사용자-아이템 매트릭스를 생성한다.
유사도 계산과 이웃선정 단계에서는 생성된 매트릭스를 기반으로 목표 사용자와 가장 유사한 사용자들을 찾아낸다. 이를 위해 사용자 간의 유사도를 계산하고 유사도를 기반으로 KNN기법을 이용하여 최근접 이웃을 선정한다. 유사도 계산에는 코사인(Cosine) 유사도, 피어슨(Pearson) 유사도 측정 방식 등이 사용된다 [13] .
식(1)은 코사인 유사도 계산식으로
PPT Slide
Lager Image
는 두 벡터의 내적을 의미하고
PPT Slide
Lager Image
는 각 벡터의 길이를 의미한다 [14] .
PPT Slide
Lager Image
식(2)는 피어슨 유사도를 사용하여 두 사용자간의 유사도를 계산하기 위한 식이다. ra.i , rb,i 는 사용자 a와 사용자 b의 아이템 i에 대한 평가값이고,
PPT Slide
Lager Image
는 사용자 a, b의 평가값 평균이다. Ia,b 는 사용자 a와 b가 모두 평가한 아이템들의 집합이다.
PPT Slide
Lager Image
아이템 추천 단계는 최근접 이웃(KNN)들의 평가값을 기반으로 목표 사용자가 평가하지 않은 아이템에 대해 예측값을 생성하고 상위의 Top-N개를 추천하는 단계이다. 식(3)은 상품 i에 대한 목표 사용자 a의 평가값 예측 식이다.
PPT Slide
Lager Image
Ⅲ. 사용자 활동과 시간 정보를 이용한 추천 기법
본 장에서는 추천의 정확성을 높이기 위해 사용자 활동과 시간의 변화에 따른 사용자 선호 변화를 적용한 추천 기법에 대해 설명한다. 추천 시스템의 구성도는 그림 1 과 같다.
PPT Slide
Lager Image
시스템 구성도 Fig. 1 System Structure Diagram
제안하는 기법은 현재 목표 사용자와 선호도가 더 유사한 근접 이웃을 추출하기 위해 시간정보를 적용하여 데이터를 선별하는 유사 선호자 분류 모듈과 태그 정보를 사용하여 목표 사용자와 선호도가 유사한 사용자를 기반으로 아이템 예측값을 생성하는 가중치 적용 사용자 예측값 모듈, 시간 정보와 태그 정보를 사용하여 아이템의 평가값을 계산하고 이를 바탕으로 순위를 계산하는 가중치 적용 아이템 예측값 모듈, 그리고 두 가중치 적용 예측값 모듈들을 사용하여 최종적으로 아이템을 추천하는 부분으로 구성된다.
- 3.1. 카테고리별 유사 선호자 분류
사용자들의 아이템에 대한 선호는 시간이 지나면 대부분 자연스럽게 변한다. 따라서 본 논문에서는 사용자 선호 변화와 태그 정보를 적용하여 더 정확한 예측값을 생성하여 추천의 정확성을 높이기 위해 전체 사용자 평가 데이터를 카테고리별로 분류한 후 아이템별 평가 시간 정보를 사용하여 데이터를 추출한다.
사용자의 아이템 최초 평가일을 tfr 로 마지막 평가일을 tfr 로 표기하고 기준일에서 tfr 을 뺀 값이 기준 기간 값보다 큰 사용자를 대상으로 최근 일정 기간 동안 해당 카테고리의 아이템을 임계값 미만으로 평가하였거나 사용자의 평가 아이템 전체에서 해당 카테고리에 속하는 평가 아이템의 비율이 낮을 때는 해당 카테고리에 대한 선호도가 바뀌었거나 단순히 인기 아이템을 선택한 것으로 판단하여 해당 사용자의 평가 데이터는 협업 필터링 알고리즘 계산에 사용하지 않고 제외한다.
기준일에서 tfr 을 뺀 값이 기준 기간 값보다 작으면 최근 가입한 회원이므로 이들은 아이템 평가 빈도를 계산하여 가입 기간 대비 빈도가 높으면 해당 카테고리 아이템 평가 비율로 판단하고 그렇지 않으면 유사 사용자 계산에서 제외한다. 카테고리 내에서 사용자 u가 지정 기간 내에 아이템을 평가한 횟수는 CT ( u , g )로 표현 하고, 사용자 u가 지정 기간 내에 평가한 아이템 중 해당 카테고리에 속하는 아이템의 비율은 RT ( u , g )로 표현 한다. RT ( u , g )의 계산식은 식(4)와 같다. cu,g 는 사용자 u가 지정 기간 내 해당 카테고리의 아이템 평가 횟수이고 cu,tot 는 전체 아이템 평가 횟수이다.
PPT Slide
Lager Image
다음 Algorithm 1은 카테고리별 유사 선호자를 분류 하는 과정을 나타낸 것이다.
[Algorithm 1] 유사 선호자 분류 알고리즘
PPT Slide
Lager Image
- 3.2. 가중치 적용 사용자 예측값 생성
선택된 데이터들을 기반으로 태그 가중치를 적용한 사용자 예측값 생성은 다음과 같은 단계로 이루어진다.
- 3.2.1. 태그 가중치를 적용한 유사도 계산
아이템에 대한 태그 정보는 사용자들이 아이템을 선택할 때 참고할 수 있는 유용한 정보로서 해당 아이템에 대한 사용자 만족도의 적극적 표현이다. 평가값이 유사하고 동일 아이템에 태그 정보를 기술한 사용자들은 성향이 더 비슷하다고 할 수 있으며 제안하는 기법은 이러한 속성을 태그 정보 가중치 ωt 로 지정하여 사용자 유사도 계산에 적용한다. 아이템에 대한 평가값 3이상인 사용자의 태그 정보는 선택한 아이템에 만족함을 추가적으로 표현한 것으로, 평가값이 3미만인 사용 자의 태그 정보는 선택 아이템에 만족하지 못함을 추가 적으로 표현한 것으로 간주한다. 이를 바탕으로 목표 사용자와 이웃 사용자가 공통으로 평가한 아이템의 태그 정보의 유무와 평가값의 차에 따라 차등적으로 태그 값을 지정한다. 목표 사용자와 이웃 사용자가 공통으로 평가한 태그 정보를 가진 아이템들의 태그 값의 합을 공통으로 태그 정보를 남긴 아이템들의 수의 합으로 나누어 태그 가중치 ωt 로 정한다.
식(5)는 목표 사용자와 이웃 사용자가 공통 평가한각 아이템의 태그에 대한 값을 계산하는 식이고, 식(6)은 각 태그 값을 사용한 ωt 계산식이다. Tai , Tbi 는 사용자 a와 b가 아이템 i에 남긴 태그를 rai , rbi 는 사용자 a와 b가 아이템 i에 남긴 평가값을 나타낸다. utab 는 두 사용자가 공통으로 평가한 아이템의 태그 값이고, CTab 는 두 사용자가 공통으로 태그를 남긴 아이템 수를 나타낸다.
PPT Slide
Lager Image
PPT Slide
Lager Image
목표 사용자의 근접 이웃을 추출하기 위해 식(2)를 사용하여 사용자간 유사도를 계산한다. 식(2)로 구해진 유사도에 태그 가중치 ωt 와 공통 평가 아이템 임계값을 적용하여 최종 유사도를 구한다. 공통 평가 임계값 γ 는 두 사용자가 공통으로 평가한 아이템의 수가 적음에도 유사도가 높게 나와 정확성이 떨어지는 것을 방지하기 위해 사용한다. 식(7)은 최종 유사도 계산식이다.
PPT Slide
Lager Image
γ 는 두 사용자 간의 공통 평가 아이템 수의 임계값이고, I ( a u )는 사용자 a와 u가 공통으로 평가한 아이템의 수이다.
다음 Algorithm 2는 태그 가중치를 적용한 사용자 유사도 계산 알고리즘이다.
[Algorithm 2] 사용자 유사도 계산 알고리즘
PPT Slide
Lager Image
- 3.2.2. 이웃 선정 및 예측값 생성
태그 가중치를 적용하여 목표 사용자와 이웃 사용자 간의 유사도를 구한 후 유사도 임계값 이상의 유사도를 가진 이웃 사용자들만을 최근접 이웃으로 지정한다. 최근접 이웃들의 평가값과 유사도 만을 사용하여 목표 사용자가 아직 선택하지 않은 아이템들의 예측값을 식(8)을 사용하여 계산한다.
PPT Slide
Lager Image
PPT Slide
Lager Image
는 목표 사용자 a와 근접 이웃 u의 평가값 평균을 ru,i 는 이웃 u의 아이템 i에 대한 평가값을 나타낸다.
PPT Slide
Lager Image
식(8)을 사용하여 추출한 예측값 중 Top-N개의 아이템들을 선택한다.
- 3.3. 가중치 적용 아이템 예측값 생성
본 논문에서는 추천의 정확성을 높이기 위해 사용자들이 특정 카테고리에서 아이템을 선택할 때 참고하는 순위 정보를 아이템 추천에 활용한다. 순위는 단순 누적 카운트만을 사용하여 구하는 것이 아니라 태그 정보를 사용한 가중치와 시간의 변화에 따른 사용자들의 아이템 선호도 변화를 적용한다. 아이템 순위는 [15] 에서 제안한 기간 정보를 적용한 아이템 평가값 추출 계산식에 태그 값 가중치를 적용하여 평가값을 구한 후 지정한다. 태그 값 가중치는 아이템에 대한 태그의 수를 사용하여 지정한다.
식(9)는 [15] 에서 제안한 기간 정보를 적용하여 아이템 평가값을 구하는 식이다. R 은 아이템 평가값 평균, u 는 아이템에 대한 평가 개수, m 은 최소 평가 개수, C 는 전체 아이템에 대한 평가값 평균이다. u ′, m ′, R ′, C ′은 각각 특정기간 내의 아이템 평가 개수, 최소 평가 개수, 아이템의 평가값 평균, 전체 아이템에 대한 평가값 평균을 나타낸다.
PPT Slide
Lager Image
식(10)은 식(9)에 태그 값 가중치를 적용하여 아이템에 대한 최종 평가값 P′ri 를 계산하는 식이다. tncti 는 아이템 i에 대한 태그의 수를 나타내고, θ 는 임계값, ε 는 가중치를 나타낸다.
PPT Slide
Lager Image
시간 정보와 태그값 가중치를 사용하여 아이템의 평가값을 계산하여 아이템 순위를 지정함으로써 최근 사용자들이 선호하는 아이템을 좀 더 정확히 추천할 수있다.
- 3.4. 최종 예측값 생성 및 추천
목표 사용자에게 아이템을 추천하기 위해 가중치를 적용해 추출한 사용자 기반 예측 아이템들의 예측값과 가중치를 적용해 추출한 아이템 예측값을 사용한다. 해당 카데고리를 선호하는 목표 사용자는 식(8)을 사용하여 추출한 Top-N개의 아이템들의 예측값과 식(10)을 사용하여 계산한 해당 아이템들의 평가값의 평균을 구한 후 최종적으로 Top-N개의 아이템을 추천한다. 반면 일반 사용자들은 아이템의 순위를 기반으로 아직 선택하지 않은 Top-N개의 아이템을 추천한다.
식(11)은 해당 카테고리를 선호하는 사용자의 최종 예측값 P ′ ( a , i ) 를 계산하는 식이다.
PPT Slide
Lager Image
다음 Algorithm 3은 최종 사용자 예측값 알고리즘 이다.
[Algorithm 3] 예측값 생성 및 추천 알고리즘
PPT Slide
Lager Image
Ⅳ. 실험 및 평가
- 4.1. 실험 데이터 및 평가 방법
본 논문에서는 제안하는 추천기법의 성능을 평가하기 위해 실험 데이터로 GroupLens Research Project에 의해 수집된 MovieLens10M dataset을 확장한 hetrec 2011-movielens-2k dataset을 사용하였다. Dataset은 2113명의 사용자가 10197개의 영화에 대하여 평가한 855598개의 평가값을 가지며, 사용자, 영화, 감독, 배우, 국가, 태그 정보 등을 포함하고 있다. 사용자들은 평균 404개의 아이템에 대해 선호도를 1~5의 값으로 평가하였고, 아이템에 평균 22개의 태그 정보를 남겼다. 영화는 평균 84개의 평가 값과 8개의 태그 값을 가지고 있다.
성능 실험을 위해 dataset에서 사용자, 태그, 영화 정보만을 사용하여 dataset을 training dataset과 test dataset으로 분류한 후 다시 아이템들을 장르를 기준으로 18개의 카테고리로 분류하여 실험에 활용하였다.
성능 평가를 위해 검색 분야에서 많이 사용되는 Precision, Recall, F 1 -measure 기법을 사용하였다. Precision은 추천시스템이 생성한 추천 목록의 아이템들 중에서 목표고객이 실제로 구매한 아이템의 비율이고, Recall은 목표 고객이 실제로 구매한 아이템 중 추천 시스템이 추천한 상품의 비율이다. F 1 -measure 기법은 Precision과 Recall을 사용한 기법으로 Precision과 Recall은 추천의 개수를 증가시키면 Recall은 증가하지만 Precision은 감소하는 상충관계에 있으므로 두 방식을 동일한 가중치로 결합하여 보완한 F1-measure를 함께 사용한다. F 1 값이 클수록 추천의 적합성이 좋다고 할 수 있다 [16] .
식(12), 식(13), 식(14)는 각각 Precision, Recall, F 1 을 계산하는 식이다. 식(12), 식(13)에서 T는 구매 상품 리스트의 집합이고 R은 추천 상품 리스트의 집합을 의미한다.
PPT Slide
Lager Image
PPT Slide
Lager Image
PPT Slide
Lager Image
- 4.2. 실험 결과
실험은 협업 필터링 기법의 아이템 기반 추천기법, 사용자 기반 추천기법과 제안하는 추천기법에 대하여 이웃 사용자 수 변화에 따른 Precision, Recall, F 1 비교로 이루어졌다. 실험 데이터에서 근접 이웃의 수를 10명에서 50명까지 10명씩 변화를 주어 평균 결과 값을 추출하였다.
그림 2 , 그림 3 , 그림 4 는 근접 이웃 수 변화에 따른 Precision, Recall, F 1 값 결과를 나타낸 것이다.
PPT Slide
Lager Image
이웃 수 변화에 따른 Precision 비교 Fig. 2 Comparision of Precision under the different number of neighbors
PPT Slide
Lager Image
이웃 수 변화에 따른 Recall 비교 Fig. 3 Comparision of Recall under the different number of neighbors
PPT Slide
Lager Image
이웃 수 변화에 따른 F1 비교 Fig. 4 Comparision of F1 under the different number of neighbors
실험 결과 제안하는 기법이 기존 기법들보다 Precision은 평균 21%~37% 정도, Recall은 23%~51% 정도, F 1 은 22%~42% 정도 향상되어 추천의 정확성과 적합성이 향상된 것을 알 수 있다. 표 1 은 실험의 평균 결과를 나타낸 것이다.
추천에 대한 정확도 비교(%)Table. 1 The accuracy comparison for recommendation
PPT Slide
Lager Image
추천에 대한 정확도 비교(%) Table. 1 The accuracy comparison for recommendation
Ⅴ. 결론 및 향후 연구방향
인터넷과 모바일 기기의 사용이 일반화되면서 사용자들이 각종 사이트에서 자신이 원하는 아이템을 찾거나 추천을 받는 것이 일상화되었다. 그러나 대부분의 사이트들은 단순한 누적 랭킹이나 아이템에 대한 태그 누적 개수, 최신 상품 순 등의 아이템이 등록된 후 누적의 개념을 사용한 추천을 주로 하고 있다.
따라서 본 논문에서는 사용자들이 원하는 아이템을좀 더 정확하게 추천하기 위해 태그 정보와 시간의 흐름에 따른 사용자들의 선호도 변화를 적용한 추천 기법을 제안하였다. 제안하는 기법은 아이템들을 카테고리별로 분류한 후 태그 정보 가중치와 시간의 흐름에 따른 사용자 선호도 변화, 아이템 선호도 변화를 적용하여 사용자 기반과 순위 기반으로 예측값을 생성하고 해당 카테고리를 선호하는 사용자들과 일반 사용자들에게 다른 방식으로 아이템을 추천 하였다. 카테고리를 선호하는 사용자에게는 태그 가중치를 적용한 사용자 기반 기법과 순위 기반 예측을 모두 사용하여 아이템을 추천하고 일반 사용자에게는 순위 기반 예측만을 사용하여 아이템을 추천하였다.
실험 평가를 통해 제안하는 기법과 두 비교 기법의 예측값을 비교한 결과 제안하는 기법의 추천의 정확성은 두 비교 기법보다 평균 21%~37% 정도 향상되었고 적합성은 22%~42%정도 향상됨을 알 수 있었다. 제안 하는 기법은 카테고리 선호 사용자 뿐 아니라 구매 빈도가 낮거나 cold-start 사용자에게도 선호도 변화와 태그 가중치가 적용된 순위기반 추천을 통해 비교 기법들보다 정확한 추천이 가능하다.
향후 연구과제는 빅데이터 분석기술을 사용해 급격히 늘어나는 데이터들을 좀 더 빠르게 분석해 사용자에게 빠르고 정확한 추천이 가능하도록 하는 예측방법을 연구하는 것이다.
Acknowledgements
이 논문은 부경대학교 자율창의학술연구비(2014년)에 의하여 연구되었음
BIO
윤소영(So-Young Yun)
2007.2. 부경대학교 경영대학원 국제물류학과 경영학석사
2011.2. 부경대학교 전자상거래 협동과정 공학박사
※관심분야 : 추천시스템, m-commerce, 빅데이터 등
윤성대(Sung-Dae Youn)
제18권 2호 참조
1989~현재 부경대학교 컴퓨터공학과 교수
※관심분야 : 병렬처리, 멀티캐스팅통신, 데이터마이닝 등
References
Su X , Khoshgoftaar T.M. 2009 "A survey of colleaborative filtering techniques," Advances in Artificial Intelligence 2009 (4)
Resnick P. , Iacovou N. , Suchak M. , Bergstrom P. , Riedl J. “Grouplens: an open architecture for collaborative filtering of Netnews,” Proceedings of the ACM Conference on Computer Supported Cooperative Work New York, NY, USA 1994 175 - 186
Linden G. , Smith B. , York J. 2003 “Amazon.com recommendations: item-to-item collaborative filtering,” IEEE Internet Computing 7 (1) 76 - 80    DOI : 10.1109/MIC.2003.1167344
Papagelisa Manow , Plexoosakis Dimitris 2004 "Qualotative analysis of user-based and item-based prediction algorithms for recommendation agents," ACM Transactions on Information Systems 22 (1) 116 - 142    DOI : 10.1145/963770.963775
Ding Y. , Li X. "Time weight collaborative filtering," in Proceedings of the 14th ACM international conference on Information and knowledge management Bremen, Germany November 2005 485 - 492
Meng S. , Dou W. , Zhang X. , Chen J. 2013 "KASR : A Keyword-Aware Service Recommendation Method on MapReduce for Big Data Applications,"IEEE Transations on Parallel and Distributed Systems TPDS-2013-12-1141 1 - 11
Liang H. , Xu Y. , Li Y. , Nayak R. , Shaw. G. “A Hybrid Recommender Systems based on Weighted Tags,” 10th SIAM International Conference on Data Mining 2010
Stanescu A. , Nagar S. , Caragea. D. "A Hybrid Recommender System : User Profiling from Keywords and Ratings," 2013 IEEE/WIC/ACM International Joint Conferences on Web Intelligence(WI) and Intelligenr Agent Technologies(IAT) 2013 73 - 80
Renick P. , Varian H.R. 1997 "Recommender systems," Communications of the ACM 40 (3) 56 - 58    DOI : 10.1145/245108.245121
Pazzani M. , Billsus D. 1997 "Learning and revising user profiles: the identification of interesting Web sites," Machine Learning 27 (3) 313 - 331    DOI : 10.1023/A:1007369909943
Konstan J. A. , Miller B. , Maltz D. , Herlocker J. L. , Gordon L. R. , Riedl J. 1997 "GroupLens: Applying Collaborative Filtering to Usene News," Communications of the ACM 40 (3) 77 - 87    DOI : 10.1145/245108.245126
Sarwar B. , Karypis G. , Konstan J. , Riedl J. “Item-based Collaborative Filtering Recommendation Algorithms," ACM Press Processing of the 10th International World Wide Web Conference 2001 285 - 295
Sarwar B. , Karypis G. , Konstan J. , Riedl J. “Analysis of Recommendation Algorithms for E-Commerce," Proc of ACM EC '00 conference Oct. 2000 158 - 167
Choi Yoon Kyoung , Kim Sung Kwon 2013 "Recommendation Algorithms for Online Shopping Malls with Periodically Purchasing Users", Korean Institute of Information Scientists and Engineers 40 (8) 453 - 462
Yun So Young , Youn Sung-Dae 2014 "The User Informationbased Mobile Recommendation Technique" Journal of the Korea Institute of Information and Communication Engineering 18 (2) 379 - 386    DOI : 10.6109/jkiice.2014.18.2.379
Ko Su-Jeong 2009 “A Recommender Agent using Associ-ation Item Trees”, Korean Institute of Information Scientists and Engineers 36 (4) 298 - 305