Advanced
A Design and Implementation of Needs Analysis System in Internet Shopping Mall
A Design and Implementation of Needs Analysis System in Internet Shopping Mall
Journal of the Korea Institute of Information and Communication Engineering. 2015. Sep, 19(9): 2073-2080
Copyright © 2015, The Korean Institute of Information and Commucation Engineering
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License(http://creativecommons.org/li-censes/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.
  • Received : June 30, 2015
  • Accepted : August 07, 2015
  • Published : September 30, 2015
Download
PDF
e-PUB
PubReader
PPT
Export by style
Share
Article
Author
Metrics
Cited by
TagCloud
About the Authors
성훈 박
진덕 김
jdk@deu.ac.kr

Abstract
온라인에서 제품을 고르고 실질적인 구매는 오프라인에서 이루어지는 역 쇼루밍이 급격히 늘고 있다. 역 쇼루밍이 늘고 있다는 것은 이미지와 설명을 기반으로 한 인터넷 쇼핑몰의 사용자 분석에 한계가 있음을 의미한다. 따라서 대형 온라인 쇼핑몰은 고객 맞춤형 쇼핑정보를 제공하고 있으나, 단순히 고객이 검색하거나 구매한 상품을 나열하여 제공하여 준다. 따라서 사용자의 다양한 요구를 분석하고 적용할 수 있는 온라인 쇼핑몰이 필요하다. 본 논문에서는 새로운 니즈분석 시스템을 제안한다. 제안된 시스템은 사용자 정의 모듈과 후기 분석 모듈로 구성되어 있다. 전자는 두 개의 상품을 지정하고 개인별 사용자 선호도를 수집하며, 후자는 저장된 데이터베이스 사전을 이용하여 구매 상품의 후기를 분석한다. 구현된 시스템은 개별 사용자의 요구를 충족하는 상품을 추천할 수 있음을 보였다.
Keywords
Ⅰ. 서 론
최근 오프라인 매장에서는 상품의 품질을 보고 가격을 온라인과 비교 후 온라인이 더 저렴할 경우 할인된 가격에 구입을 하는 것이다. 이를 가리켜 ‘쇼루밍족’ 이라한다 [1] . 더군다나 쇼루밍족과는 반대의 형태인 상품의 탐색은 온라인에서하고, 구매는 오프라인에서 하는 “역쇼루밍족” 도 증가하는 추세이다. 역 쇼루밍족의 증가는 온라인 쇼핑몰에서 제공하는 상품정보(이미지 및 설명) 만을 이용하여 상품을 구매하는 것은 위험 부담이 있음을 의미한다. 따라서 고객에게 상품분석 정보 및 타인의 선호도와 같은 다양한 정보를 온라인에서 제공하는 것이 온라인 쇼핑몰의 경쟁력을 높이는 길이다.
한편, 대규모 인터넷 쇼핑몰은 고객 맞춤형 쇼핑정보를 제공하고 있다. 그러나 대다수의 쇼핑몰들은 고객이 구매하거나, 보았던 상품을 단순히 나열하는 것에 그치고 있다. 따라서 이러한 문제를 해결하고자 본 논문에서는 고객의 니즈분석을 제안하고 모바일 쇼핑몰에 적용한다.
상품을 구매하고자 하는 사용자가 선택한 두 가지 상품에 대해 개인 및 특정 그룹(연령별, 성별)의 선호도를 분석 할 수 있는 시스템을 고안하여 의사결정을 지원하여 주며, 해당 상품에 대한 타인의 반응을 쉽게 볼 수 있도록 하여 댓글 작성자가 아닌 타인도 해당 상품에 대한 선호도를 손쉽게 획득 할 수 있도록 하였다.
이를 통하여 개개인의 선호도를 파악하고 선호도에 따라 맞춤상품을 추천할 수 있도록 한다. 구현결과 사용자 지정 선호도 분석 시스템을 이용하여 두 가지 상품을 손쉽게 비교할 수 있었고, 니즈분석 모듈을 이용하여 상품에 대한 개인 및 그룹의 선호도를 수치화하여 활용할 수 있었다.
이 논문의 구성은 다음과 같다. 2장에서 사용자들의 소비패턴과 자연어 분석에 대한 관련 연구와 문제점들을 살펴본다. 3장에서 고안된 시스템의 전체 구조 및 각 모듈에 대하여 설명하고, 사용자들의 후기를 분석하기 위해 구축된 데이터베이스 사전과 카테고리 분류에 대하여 알아본다. 그리고 사용자 지정 선호도 분석 시스템에 대하여 설명한다. 4장에서는 제안한 시스템의 구현결과를 살펴보고, 끝으로 5장에서 결론을 맺는다.
Ⅱ. 관련연구
관련연구 [2] 에서는 데이터마이닝 기법을 이용한 인터넷 쇼핑몰 고객의 구매패턴 식별에 관한 연구로서 오프라인의 상품 구매 데이터에서 고객의 구매패턴을 찾아 연관성 있는 제품을 선정한 후, 수집된 고객들의 구매 정보(로그 데이터)를 기반으로 선별된 고객의 구매패턴과 비교하여 고객의 쇼핑패턴을 분석하였다.
관련연구 [3 , 4] 에서는 온라인 쇼핑몰에서의 제품 구매 후기와 배송 서비스의 질에 따라 사용자에게 미치는 영향에 대해 언급하고 있었다.
본 논문에서는 사용자의 니즈를 분석함에 있어 신뢰도를 향상시키기 위한 방안으로 상품에 대한 후기를 등록 할 때 배송 및 상품에 대한 만족도를 별점으로 평가할 수 있는 방법을 추가하였다.
니즈를 분석하기 위한 가장 큰 요인은 상품에 대한 후기를 분석하는 것이다. [5] 에서는 감성분석 방법을 검증할 수 있는 실험 집합 및 검증 방법의 어려움에 대하여 말하고 있으며, 이를 효과적으로 입증하기 위하여 단어를 특정 주제에 관하여 긍정, 부정, 중립 세 가지 성향으로 분류하고 있다.
본 논문에서는 모호한 단어들을 제외시키고자 해당 주제에 대한 긍정과 부정의 단어들만을 데이터베이스 사전으로 구축하였으며 상품 마다 언급되는 단어의 빈도수를 측정하여 추가적인 데이터베이스 사전을 구축하였다.
관련연구 [6] 은 상품평 자동분류를 위한 감성분석 알고리즘을 제시하고 있으며, 상품평 수집, 형태소 분석, 감성분석, 요약화 4단계를 거쳐 해당상품평의 성향을 분석하고 있다.
그러나 형태소 분석을 위하여 상품에 대한 주요 속성들을 정의하고 속성별로 형태소, 즉 단어들을 분류함에 있어 많은 시간과 비용이 소모되며 각 상품마다 동일작업을 반복해야 한다.
본 논문에서는 형태소 분류 없이 상품이 소속된 카테고리를 분류하였으며 카테고리별로 주로 언급되는 단어들을 수집하고 빈도수에 따라 별도의 데이터베이스 테이블을 구축함으로서 시간과 비용을 절약 할 수 있도록 하였다.
Ⅲ. 니즈분석 방법
- 3.1. 전체 시스템 구조
제안하는 니즈분석 시스템은 SNS 분석, 성향 분석, 후기 분석, 행동 분석 4가지로 구성된다.
PPT Slide
Lager Image
시스템 구조 Fig. 1 System Architecture
니즈분석 모듈은 SNS 분석, 사용자 지정 시스템에서 획득한 성향 분석, 후기 분석 및 행동 분석의 결과를 통합하여 활용하는 모듈로서 각 하위 모듈의 역할은 다음과 같다.
  • ① SNS 분석 모듈은 SNS를 통하여 타인의 선호도를 파악 할 수 있도록 고안한 모듈로서 외부 SNS(트위터)의 리트윗 수를 파악하고 데이터베이스에 저장한다. SNS 분석에 대한 연구[8]에서는 내·외부 SNS를 기반으로 SNS 분석 결과의 활용방법에 대하여 기술하고 있다.
  • ② 성향 분석 모듈은 사용자 지정 선호도 분석 시스템에서 획득 되어진 데이터(사용자가 지정한 두 가지 상품에 대한 개인 및 특정 그룹의 선호도)를 수집하고 데이터베이스에 저장한다.
  • ③ 후기 분석 모듈은 사용자가 작성한 후기(별점 및 등록 내용)를 기반으로 하여 상품에 대한 사용자의 반응을 수치화 하고 데이터베이스에 저장하는 모듈로서 사용자 선호도 분석에 크게 작용한다.
  • ④ 행동 분석 모듈은 모바일 쇼핑몰 사용자가 카테고리 선택, 상품 구매, 댓글 작성 등의 행동을 취할 시에 생기는 로그 데이터를 수집하고 데이터베이스에 저장하는 모듈이다.[7]에서는 행동분석을 위한 사용자의 행동별 데이터 수집 및 분석 방법에 대해 기술하고 있다.
기존 사이트에서 보여주던 추천 상품 등의 기능은 사용자가 구매하거나 클릭한 상품을 단순히 나열하여 보여주는 기능에 불과하였다. 이를 해결하고자 본 논문에서는 사용자가 상품 구매 시 취하는 여러 행동(상품 카테고리 선택, 선호 상품 체크, 리뷰 작성, 상품 구매)들을 통하여 누적된 로그 데이터를 분석하여 사용자 개인에게 맞는 상품들을 추천해줌으로써 상품 구매율을 향상시킬 수 있도록 하였다.
- 3.2. 후기분석을 위한 데이터베이스 사전 구축방법
후기분석의 신뢰도는 매칭되는 데이터베이스 사전의 완성도와 연관이 있다. 따라서 국내 대표 쇼핑몰들의 후기를 각 카테고리 마다 100개의 후기를 수집하고 분석한 결과 그림 2 와 같이 상품의 카테고리에 따라 사용되는 특정 단어들이 있음을 파악했다.
PPT Slide
Lager Image
상품별 사용되는 특정 단어 Fig. 2 Specific words for representing each goods
해당 상품의 후기에는 몇몇 단어들이 주로 사용되는 것을 발견하고, 이 단어들의 가중치를 조정하여 신뢰도를 향상시키고자 하였다.
우선적으로 해당 상품의 카테고리를 정립할 필요성이 있었다. 그 이유는 그림3 과 같다.
PPT Slide
Lager Image
쇼핑몰마다 일관되지 않은 상품카테고리 Fig. 3 Product category that is not consistent with the shopping mall
그림 3 에서 구두 A는 쇼핑몰의 차이만 있을 뿐 동일한 제품이다. 그러나 해당 상품의 카테고리는 차이를 보인다. 이는 카테고리별 자주 쓰이는 단어를 선별할 때 상당한 어려움이 있었고, 후기분석 결과의 신뢰도가 감소하게 된다. 이를 최소화하고자 여러 쇼핑몰의 카테고리를 수집하여 연관성 있는 제품들끼리 묶어 상품의 카테고리를 표1 과 같이 34개로 정리하였다.
정리된 카테고리Table. 1 Organized categories
PPT Slide
Lager Image
정리된 카테고리 Table. 1 Organized categories
각 카테고리마다 긍정적인 성향의 단어와 부정적인 성향의 단어를 분류하였고, 그 빈도수를 토대로 자주 쓰이는 단어들을 다시 분류하여 데이터베이스 사전을 두 가지(기본 단어 사전, 자주 쓰이는 단어 사전)로 구축하였다( 그림 4 ). 상품의 후기들은 상품의 속성별로 언급되는 특정 단어들이 존재하였다.
PPT Slide
Lager Image
데이터베이스 사전 구축 과정 Fig. 4 Process for building DB dictionary
- 3.3. 사용자 지정 선호도 분석 모듈
이 모듈은 쇼핑몰 사용자가 직접 두 가지 상품을 지정하고 두 가지 상품에 대한 타사용자의 선호도를 비교할 수 있도록 지원한다. 사용자 지정 선호도 분석 시스템을 통하여 등록되는 정보는 그림 5 와 같다.
PPT Slide
Lager Image
사용자 지정 선호도 분석 모듈 Fig. 5 User designated preference Analysis module
  • ①은 사용자가 지정한 두 가지 상품이 어떤 카테고리에 속하는지 표시하여 주며, 선택된 카테고리에 맞는 상품만을 비교 할 수 있도록 지원한다.
  • ②는 등록된 비교 글의 제목 및 내용으로서, 지정 된 상품을 왜 비교하는지에 대한 간략한 내용을 표시한다.
  • ③은 실제 비교되는 상품명 및 이미지를 표시하는 영역으로서 원형으로 표시된 영역의 숫자는 상품이 추천받은 횟수를 나타내고 사선 영역은 본인이 선택한 상품이 어떠한 것인지 보여준다.
- 3.4. 상품 후기의 선호도 분석을 위한 수치화 방법
니즈분석에 가장 큰 영향을 주는 것이 쇼핑몰 사용자가 직접 작성한 상품 후기를 분석하는 것이다 [9] . 또한 후기 분석의 결과를 보정하기 위하여 후기 작성에 앞서 상품에 대한 별점을 평가할 수 있는 방법을 고안하였다. 다음의 과정을 거쳐 사용자의 선호도가 수치화 된다.
첫 번째로 사용자가 직접 상품에 대한 별점을 평가하도록 한다. 상품 구매 때 사용자의 선호도에 영향을 미치는 요인으로 네 가지(포장 상태, 택배 신속성, 제품의 사이즈, 제품 상태)를 반영하였다. 각 요인을 0 ~ 5 점으로 평가하고 4가지 요인의 평균을 기준으로 후기 분석 결과를 4가지로 나눈다.
두 번째로 작성된 후기를 자주 쓰이는 단어 사전과 우선적으로 매칭한 후 성향에 맞는 가중치를 곱하여 수치를 합산(a) 하고, 매칭된 단어를 제외한 나머지 단어들 또한 기본 단어 사전과 매칭 후 성향에 맞는 가중치를 곱하여 수치를 합산(b)한다. (a)와 (b)는 식(1)에 의해 계산된다.
PPT Slide
Lager Image
여기서, FR 은 자주 쓰이는 단어들의 매칭 결과로, ft 는 자주 쓰이는 긍정 단어의 수를 ff 는 자주 쓰이는 부정단어의 수를 나타낸다.
DR 은 기본 단어들의 매칭 결과로, dt 는 기본 긍정단어의 수를 df 는 기본 부정 단어의 수를 나타낸다. 각 Weight 표 2 에 따라 부여된다.
단어별 가중치Table. 2 Weight per Word
PPT Slide
Lager Image
단어별 가중치 Table. 2 Weight per Word
식 1에서 획득 되어진 FR DR 은 합산하여 그림7 의 B를 획득 한다.
그림 6 의 알고리즘을 이용하여 선호도 분석 결과 R을 획득한다. 그러나 별점과 매칭 합산 결과의 관계가 모호해지는 경우(별점이 1점인데 후기 매칭결과가 매우 높을 때 = 별점 및 후기 매칭 결과를 신용할 수 없음)가 발생한다. 따라서 표 3 에 따라 가중치 비율을 적용하여 선호도 분석 결과를 보정한다.
PPT Slide
Lager Image
선호도 수치화 알고리즘 Fig. 6 Algorithm to calculate Preference
별점과 단어의 가중치 비율Table. 3 Weighting factor of rating and point
PPT Slide
Lager Image
별점과 단어의 가중치 비율 Table. 3 Weighting factor of rating and point
Ⅳ.구현 결과
3장에서 제시한 사항들을 만족할 수 있도록 데이터 베이스 사전과 모바일 애플리케이션을 구축하였다.
- 4.1. 데이터베이스 사전 구축
데이터베이스 사전은 3장에서 선별된 34개의 카테고리를 기준으로 대형 쇼핑몰에서 카테고리별 100 ~ 150개의 후기를 선별하여 약 4천개의 후기를 수집하였다.
수집된 후기들은 단어 단위로 나뉘어져 해당 상품에 대하여 긍정/부정의 성향을 뛰는 단어들로 나누었으며, 단어의 빈도수가 가장 높은 긍정 3단어, 부정 3단어를 선별하여 높은 가중치를 두었다. 자주 언급되는 214단어와 기본 1744단어를 선별하였다.
- 4.2. 선호도 수치화 알고리즘 검증
선호도 수치화 알고리즘의 검증을 위하여 동일한 상품에 대한 상품 후기 3 가지를 선정 하였다. 각 후기에 대한 인간의 판단결과는 그림 7 과 같다.
PPT Slide
Lager Image
상품 후기 및 선호도 수치화 결과 Fig. 7 Example of Review and Result of calculate Preference
이후 각각의 후기들을 개발한 모바일 쇼핑몰을 이용하여 후기를 등록하였으며 분석된 선호도 수치는 10점, 42점, 50점으로 인간의 판단과 유사한 결과였다.
- 4.3. 모바일 앱 구현
모바일 앱은 니즈분석 시스템을 탑재한 모바일 쇼핑몰로서 2가지 페이지(상품의 구매가 가능한 페이지, 사용자 지정 선호도 분석 시스템을 포함한 페이지)로 구성되어 있다.
PPT Slide
Lager Image
모바일 앱 구성화면 Fig. 8 Frame of Mobile App
사용자 지정 분석 시스템은 앞서 언급한 대로 사용자가 지정한 두 가지 상품의 추천수를 통하여 개인 및 특정 그룹의 선호도를 알 수 있도록 하였다.
또한 후기 작성 페이지로 연결되도록 구현하여 상품에 대한 후기를 작성하고 볼 수 있도록 구현하였다. 후기는 사용자가 별점을 평가하는 부분과 이미지 및 상품에 대한 내용을 작성하는 2페이지로 구성되어있다.
PPT Slide
Lager Image
후기작성 페이지 Fig. 9 Review Page
- 4.4. 니즈분석 결과 반영
- ① 행동분석 모듈
행동분석 모듈 [7] 을 위해 제안한 시스템은 고객들의 다양한 활동들을 정의하여 각각의 가중치를 차별화하여 앱을 종료할 때 사용자의 로그 데이터를 분석하여 니즈분석 결과에 반영하도록 하였다.
사용자가 카테고리 중 하나를 선택하게 될 경우 사용자의 로그 데이터는 저장된다. 따라서 저장된 로그데이터는 앱이 종료될 때 니즈분석 결과에 반영되게 된다.
그림 10 을 보면 사용자가 선택한 카테고리 데이터를 축적하고 이를 바탕으로 가장 많이 선택된 카테고리를 추출하여 개인 선호도 테이블에 저장한다.
PPT Slide
Lager Image
카테고리 선택 후 데이터베이스 Fig. 10 Database after Selecting Category
그림 11 은 니즈분석 결과가 반영된 화면으로 사용자가 “신발-여성화” 에 관심이 있음을 알 수 있다. 사용자가 상품을 구매하거나 후기를 남기는 일련의 행동이 없더라도 관심 있는 카테고리를 선택하였을 때의 로그데이터를 분석하여 니즈분석에 활용 하도록 하였다.
PPT Slide
Lager Image
카테고리 선택 후 니즈분석 결과화면 Fig. 11 Result of Needs Analysis after Selecting Category
- ② 사용자 지정 선호도 분석 모듈 결과
사용자 지정 선호도 분석 시스템에서 지정된 두 가지 상품 중 하나를 선택 하였을 때 저장된 데이터는 그림 12 의 최상단 테이블(ProductChoice)과 같다. 이 정보를 기반으로 하여 개인 선호도 테이블에 반영 하였다.
PPT Slide
Lager Image
상품 지정 후 반영된 선호 상품정보 Fig. 12 Database after Selecting Category
- ③ 후기 분석 모듈
등록된 후기는 선호도 수치화 알고리즘에 의하여 데이터베이스에 저장된 별점과 후기 내용에 따라 수치화하여 후기분석 결과 테이블에 저장되게 된다.
수치화된 결과는 20점을 기준으로 사용자의 선호도 유무를 판단하여 20점 이하는 관심있는 카테고리 내에서도 해당 제품은 제외시키도록 하였으며, 20점 이상부터는 선호도에 따라 정렬되도록 하였다.
그림 14 는 행동 분석 및 성향 분석의 결과에 후기 분석 결과를 결합한 니즈 분석 결과로서 그림 13 의 후기 분석 결과(선호도 수치 20 이하)에 따라 상품 번호에 해당하는 “남자 야상” 제품이 니즈분석 결과 화면에서 제외되도록 하였다. 그 결과 고객이 선호하는 카테고리는 니즈 분석 결과에 반영하고, 비선호 하는 상품에 대한 정보는 제외하여 고객 맞춤 정보를 제공할 수 있었다.
PPT Slide
Lager Image
저장된 후기 및 수치화된 결과 Fig. 13 Numerical result of a Review
PPT Slide
Lager Image
니즈분석 결과화면 Fig. 14 Screen of Needs Analysis
Ⅴ. 결 론
본 논문에서는 인터넷 쇼핑몰에서 적용 가능한 니즈분석 시스템을 제안하였다. 기존 구매 내역을 단순히 나열하는 방식에서 벗어나 쇼핑몰 사용자의 여러 가지 데이터들을 활용하여 사용할 수 있는 시스템이다.
제안된 니즈분석 시스템은 사용자가 직접 두 가지 상품을 지정하고 비교할 수 있도록 사용자 지정 선호도 분석 시스템을 구현하였으며, 이를 이용하여 개인 및 타인의 선호도까지 획득 할 수 있도록 하였다. 또한 상품에 대한 후기를 등록할 때 별점 평가 기능을 적용하여 후기 분석의 신뢰도를 향상 시켰다. 따라서 제안된 니즈 분석 시스템은 사용자 지정 시스템으로 획득한 성향 분석, 후기 분석 및 행동 분석의 결과를 통합하여 활용함으로써 니즈분석의 신뢰도를 향상 시킬 수 있었다.
본 논문에서는 후기분석을 위한 데이터베이스 사전을 구축할 때 단순히 카테고리에 별로 사용되는 단어의 성향을 분석하여 활용 하였으나 향후 상품의 속성까지 고려하여 단어들을 분류하고 활용할 수 있다면 보다 정확한 니즈분석 결과를 획득할 수 있을 것으로 사료된다.
BIO
박성훈(Sung-Hoon Park)
2012년 2월 : 동의대학교 컴퓨터공학과(학사).
2012년 ~ 현재 : 동의대학교 컴퓨터공학과 석사과정
※관심분야 : 데이터베이스, 모바일, GIS, 스마트 애플리케이션
김진덕(Jin-Deog Kim)
2000년 8월 : 부산대학교 컴퓨터공학과 졸업(공학박사)
2001년 ~ 현재 : 동의대학교 컴퓨터공학과 교수
※관심분야 : 데이터베이스, GIS, 모바일 시스템, LBS
References
Oh Su Yeon “Catch the showrooming jok“ Marketing 48th 2015 Vol.3 60 - 63
Kim Sun Hyoung “Identification of Internet Customer Purchase Pattern Using Web Mining Techniques” The Graduate School of Hannam University
Jang Jung Hee “Qualitative study on how purchasing fashion products in online shopping mall influences on consumer’s attitude toward purchasing” The Graduate School of Design, Kookmin University
Park Na Ri “A Study on the Effects of Delivery Service Quality on Customer Satisfaction in Internet Apparel Shopping Mall” The Graduate School of Chungang University
Park Yong Min 2012 “Construction of Korean test collection for social media text sentiment analysis” KIISE 39 118 - 120
Chang Jae Young “A Sentiment Analysis Algorithm for Automatic Product Reviews Classification in On-Line Shopping Mall” Hansung University
Lee Ahn Hee 2015 “Needs Implementation for SCS“ KIICE 19 xx - xx
Park Sung Hoon 2015 “Analysis of Consumer Preferences based on Integration of External Social Network with Internal Group” KIICE 19 xx - xx
Ding Xiaowen , Lui Bing “The Utility of Linguistic Rules in Opinion Mining,” SIGIR 2007 811 - 812