Advanced
Classification and Recommendation of Scene Templates for PR Video Making Service based on Strategic Meta Information
Classification and Recommendation of Scene Templates for PR Video Making Service based on Strategic Meta Information
Journal of Broadcast Engineering. 2015. Dec, 20(6): 848-861
Copyright © 2015, The Korean Society of Broadcast Engineers
  • Received : September 15, 2015
  • Accepted : October 29, 2015
  • Published : December 30, 2015
Download
PDF
e-PUB
PubReader
PPT
Export by style
Share
Article
Author
Metrics
Cited by
About the Authors
종 빈 박
jpark@keti.re.kr
한 덕 이
경 원 김
종 진 정
태 범 임

Abstract
본 논문에서는 메타정보로 표현된 마케팅 및 홍보전략·의도 등을 이용하여 홍보동영상을 쉽게 제작하는 웹기반 서비스 시스템을 소개한다. 홍보영상제작 시스템은 홍보물을 제작하려는 사용자가 사진이나 동영상을 제공하면 업종정보와 잠재고객정보 등을 이용해서 관련된 홍보동영상을 자동으로 생성하는 시스템이며 IT기술에 어려움을 느끼는 사용자들을 배려한다. 이와 관련된 기존 서비스들은 사전 정의되거나 새로 추가한 테마나 범주에 맞춰 템플릿들을 제작하고, 이를 갤러리 형식의 인터페이스로 제시하면 사용자가 원하는 템플릿을 직접 선택하여 홍보영상을 완성하는 방식이었다. 통상적으로 이를 실현하기 위해서는 템플릿 등에 해당 파일을 설명할 수 있는 태그를 붙여서 분류하고 검색하는 방식을 사용하는데 정형화되지 않은 메타정보들을 포함하는 템플릿 등이 새롭게 추가될 경우 관리 및 분석을 위해 별도의 정형화 과정이 필요하다. 이 작업은 서비스 규모가 커지고 시간당 처리수가 증가할수록 부담이 된다. 이를 해결하고자 본 논문에서는 장면템플릿 관련 비정형 메타정보를 주제모델링 방법을 사용해서 자동 분류한다. 또한 홍보전략 및 홍보의도를 표현하는 정형화 되지 않은 전략메타정보를 이용해서 적절한 장면템플릿을 추천하는 방법을 제안한다.
Keywords
Ⅰ. 서 론
통상적으로 홍보라 함은 개인, 기업, 단체 또는 조직체가 커뮤니케이션을 통해 생각, 활동, 재화 등을 널리 알리거나 판매하기 위한 활동으로 해석할 수 있다. 구체적 홍보 방법으로는 직접 만나서 대화를 나누는 것에서부터, 신문이나 방송과 같은 다양한 매스미디어를 이용하여 홍보의 파급력을 증가시키는 방법에 이르기까지 그 종류 및 방법이 매우 다양하다 [1] . 홍보 활동은 인간과 인간 사이의 의사소통의 한 가지 방법이라고도 해석할 수 있으며 보고, 말하고, 냄새 맡고, 듣고, 느끼는 감각들을 효과적으로 활용할 때 그 효과가 극대화 될 수 있음은 물론이다. 지금의 기술 수준에서는 시각과 청각을 이용하는 방식이 일반적이면서도 효과적이다. TV나 인터넷을 통한 동영상 매체들이 대표적인 예이다. 여전히 신문, 라디오, TV와 같은 매스미디어 등을 이용한 홍보는 그 영향력이 매우 크기 때문에 소수의 전문가들이 고품질의 홍보물을 제작하고 이를 각종 매스미디어를 통해 다수의 소비자들에게 단방향으로 전달하는 방식이 사용되고 있다. 그러나 최근 인터넷 기술의 진화와 빠른 보급, 다양한 미디어 저작 도구들의 등장으로 직접 홍보물을 만들고 배포하는 환경이 빠르게 조성되고 있다. 인터넷 환경을 통해 동영상의 실시간 스트리밍이 가능해지고, 모바일 기기들의 급속한 보급으로 언제 어디서나 홍보물에 접근할 수 있는 인프라가 갖춰진 것도 이러한 환경 변화의 주된 동력이다. 이제는 일반 사용자들이 각자의 능력과 의지가 있다면 콘텐츠를 직접 생산하고 배포할 수 있는 환경이 갖춰졌다고 생각할 수 있는 것이다 [2 - 4] .
그러나 관련 인프라의 발전에도 불구하고 홍보 목적에 적합한 고품질의 홍보물을 생성하고 배포하는 것은 여전히 어려운 것이 사실이다. 멀티미디어 콘텐츠를 쉽게 제작할 수 있는 강력하고 다양한 편집 도구들과 서비스들을 이용할 수 있으나, 도구를 숙달되게 활용하기 위해선 여전히 오랜 인내심을 요하는 습득과정이 필요하고 관련 도구를 갖추기 위한 비용 역시 적지 않다. 이를 전문적으로 수행하는 스튜디오 등에 위탁하여 홍보용 콘텐츠를 제작하는 방식도 고려될 수 있으나 역시나 매우 고가이며 일반인이 이용하기에는 무리가 있다. 즉, 개인이나 소규모 업주들이 직접 홍보용 미디어 콘텐츠를 제작하기에는 전문적 지식의 부족, 추가 비용 소요 등에 의한 부담이 여전히 크다.
[5] , [6] 에서는 이러한 문제들과 요구(Needs)를 해결하기 위해 홍보동영상을 자동으로 제작하는 프레임워크와 기술들을 제안했다. 본 논문은 [6] 을 개선하고 정교화 시키는 내용이라 할 수 있다. 구체적으로는 웹 기반의 홍보동영상 제작 서비스로써 다중 사용자들이 동시 접속하여 자신들만의 홍보물을 만들고 이를 배포할 수 있도록 하는 핵심 기능을 제공하며 IT 관련 시스템 사용에 부담을 느끼는 사용자들을 대상으로 개발이 진행되고 있다. 따라서 이러한 사용자의 의도와 목적에 맞게 홍보용 동영상을 자동으로 생성하는 웹기반 서비스 시스템 기술을 소개하고 이를 실현하기 위한 요소 기술을 제안한다.
제안방법의 특징을 요약하면 마케팅, 홍보전략, 홍보의도 등의 외부적 요구사항 뿐만 아니라 홍보물을 만들고자 하는 사용자의 의도까지 반영하여 목적에 맞는 홍보동영상을 생성할 수 있도록 한다는 것이다. 이런 정보들을 본 논문에서는 전략메타정보라 정의하는데 이 정보는 서비스 시나리오의 특성상 정형정보 뿐만 아니라 일관된 구조를 갖지 않는 비정형정보까지 혼재된 상태로 제공된다. 이를 사전에 정의된 규격화된 포맷으로 가공 처리하는 방식도 가능하지만 메타정보의 발생 소스가 매우 다양하고, 새로운 정보 형태가 발생할 때마다 추가 작업이 필요하다는 단점이 있다. 또한 다양한 사용자들로부터 발생하는 메타 정보의 경우 형태와 포맷의 일관성이 낮으므로 분산되고 상호 이질적인 형태를 갖는 메타정보를 직접적으로 처리하는 방법의 필요성이 더욱 대두되었다. 이에 대한 해결책으로써 본 논문에서는 다양한 형태의 메타정보들을 주제모델링(Topic Modeling) 기술을 사용하여 일관성 있게 분류하고 추천하는 방법을 제안한다.
본 논문의 각 장별 구성 내용은 II장에서는 제안방법의 기반이 되는 홍보동영상 제작 서비스 시스템을 소개하고, III장에서는 논문에서 제안하는 분류 및 추천 방법을 설명한다. IV장에서는 구현과 실험내용을 보이며, V장에서 결론 및 향후 개발 내용을 정리한다.
Ⅱ. 홍보동영상 제작 서비스 시스템 소개
- 1. 홍보동영상 제작 서비스 시스템
그림 1 은 본 논문의 홍보동영상 제작 서비스 시스템의 주요 구성요소들을 나타낸다. 홍보동영상 제작부는 마케팅 전략분석, 홍보전략분석, 배포까지 포함하는 홍보 서비스 프레임워크의 일부로써 입력은 사진이나 동영상과 같은 리소스이며 출력은 최종 홍보동영상이다. 이는 기존 웹 기반 동영상 제작 서비스와 일면 유사하나 일반인들이 손쉽게 동영상 홍보물을 만들어서 제품이나 가게를 홍보하도록 특화되어 있으며, IT 기술에 대한 친숙함이 적은 사용자들까지 고려하여 가이드 UI를 적용한 부분들이 차별점이다. 추가 입력정보로써 홍보전략 및 홍보의도가 반영되는데 이는 템플릿을 변화시켜서 출력물을 고유하게 만들고 홍보조건에 맞는 콘텐츠를 제작하는 메커니즘이 된다. 그러나 이러한 메타정보는 정형화된 형태를 갖기도 하지만 대부분은 정해진 형태가 없는 자유로운 포맷이다. 이런 정보를 이용해서 템플릿이나 영상들을 자동 분류하고 홍보전략 및 홍보의도를 반영해서 적절한 템플릿을 추천하는 것이 본 논문이 해결하고자 하는 부분이다.
PPT Slide
Lager Image
홍보동영상 제작 서비스 시스템[6] Fig. 1. PR video making service system[6]
- 2. MLT 멀티미디어 프레임워크
동영상 제작 시스템에서 실제 영상을 만드는 작업은 렌더링 엔진이 담당한다. 상용품질의 결과물을 만들어내는 렌더링 엔진들은 다양한 포맷의 입력 리소스들을 처리할 수 있으며, 강력하고 다양한 전환 및 필터효과, 2차원 및 3차원 그래픽 효과 등을 지원한다. 또한 지원하는 출력 형식도 다양하고 지속적 개선을 통해 결과 영상의 품질 역시 우수하다. 그러나 상용 동영상 렌더링 엔진을 사용해서 웹 서비스를 개발 하려면 라이선스 획득을 위한 추가 비용이 발생하고, 계약 조건에 따라 향후 서비스가 활성화 되었을 때 법적 문제가 발생할 수도 있다는 위험요소가 존재한다. 그리고 이런 렌더링 엔진은 제작 업체의 영업전략 및 안정성 등의 이유로 비선형편집을 위한 사용자 환경이 밀접하게 결합되어 패키지 형태로 판매되고 있으며 별도의 API를 제공하지 않는 것도 사실이다. API가 제공되지 않는다는 사실은 서비스 개발의 제한을 의미한다. [5] 에서는 이런 문제를 해결하기 위해 자체적인 렌더링 엔진과 저작도구를 개발했으나, 지속적인 기능 추가 및 유지보수에 대한 부담이 발생했다. 특히 저작도구 역시도 기존에 잘 알려진 편집환경과는 차이가 있어서 디자이너에 대한 교육 등이 선행되어야 하는 등 서비스 확산에도 어려움이 존재했다. 따라서 [6] 에서는 MLT(Media Lovin' Toolkit) 멀티미디어 프레임워크 [7] 를 사용하는 비디오 생성 방식을 제안했다.
MLT는 공개소스 멀티미디어 프레임워크로써 텔레비전 방송을 위해 설계되고 개발되고 있는 공개소스 프로젝트이다 [7] . 다양한 프로그래밍 언어에서 활용 가능한 의존성이 적은 API를 제공하여 방송 콘텐츠, 비디오 편집기, 미디어 재생기, 변환부호화기, 비디오 스트리밍과 같은 다양한 응용에 적용 가능하도록 제작되었다. 게다가 MLT는 LGPL을 사용하므로 상용솔루션 개발이 용이하며 멀티미디어 콘텐츠들을 쉽게 조합하고 표시하는 필수 기능들을 제공하기도 한다. 다양한 플러그인들을 사용하여 새로운 기능들을 쉽게 추가할 수 있다는 점도 주요 장점이다 [7] .
전체 시스템 관점에서 MLT는 영상생성에 필요한 저수준 기능들에 특화되어 있으므로 업종정보나 잠재고객 성향을 반영하는 홍보물을 만들기 위해서는 보다 상위 수준에서 이와 관련된 처리를 수행해야만 한다.
Ⅲ. 제안방법
- 1. 전략메타정보를 이용한 홍보동영상 제작 방법
그림 2 는 전략메타정보를 이용한 홍보동영상 제작 순서를 나타낸다. 입력된 전략메타정보는 실제 동영상을 만드는데 활용되는데 이를 위해서 본 논문의 홍보동영상 제작시스템은 기본적으로 템플릿을 기반으로 관련 리소스들을 수집하고(“Gathering of resources”) 이를 대치, 수정, 조합하는 방식으로 영상을 생성한다. 동영상 렌더링은 MLT 멀티미디어 프레임워크를 사용하며, 최종 완성된 홍보동영상은 CMS(Content Management Server)가 관리한다.
PPT Slide
Lager Image
전략메타정보를 이용한 홍보동영상 제작 순서 Fig. 2. Flowchart of PR video making using strategic meta information
각각의 용어들을 정의하면, 먼저 식 (1)의 S 는 장면템플릿(Scene template)의 집합으로 정의되며, 장면템플릿이란 추상화된 스토리를 표현하기 위해 필터와 효과 등을 이용해 디자인한 결과물이라 할 수 있다. N 은 유한한 정수 값을 의미한다. 식 (2)의 D 는 전략메타정보이며 장면템플릿 각각의 메타정보들의 집합으로 정의된다. 본 논문에서는 메타정보의 형태를 텍스트문자열(Text String)의 집합으로 한정한다.
PPT Slide
Lager Image
PPT Slide
Lager Image
식 (3)의 R 은 리소스들의 집합으로 정의된다. 리소스 R 의 형태는 사진, 동영상, 음악, 텍스트정보 등이 가능하다.
PPT Slide
Lager Image
이러한 장면템플릿들은 식 (4)와 같이 사용자들이 제공한 사진이나 동영상 혹은 음악 파일들을 이용해서 식(5)와 같은 여러 개의 프로젝트 파일들의 집합 P 를 구성한다. 본논문에서는 집합 P 를 구성하는 각각의 프로젝트 파일들을 동영상을 렌더링하기에 충분한 정보를 포함하고 있는 리소스 및 정보들의 집합으로 정의한다. 즉, 임의의 프로젝트 파일은 MLT 프레임워크에서 해석 가능한 XML 파일 정보와 영상을 만들 때 필요한 사진이나 동영상 등을 모두 포함하게 된다. 이때 식 (4)의 추가 리소스는 장면템플릿을 기반으로 유일한 홍보동영상을 만들 때 콘텐츠의 차별성을 부여하는데 일정부분 역할을 한다. 그러나 분위기나 느낌을 결정하는데 장면템플릿 자체의 영향이 매우 크기 때문에 장면템플릿 간 조합 및 내부 변경을 통해 더욱 개성 있는 영상 합성이 가능하지만 이는 본 논문의 범위를 벗어나므로 하나의 장면템플릿은 하나의 프로젝트로 변형되는 것으로 한정한다.
PPT Slide
Lager Image
PPT Slide
Lager Image
즉, 본 논문의 주요 제안내용은 식 (1)과 같은 장면템플릿들을 주제에 맞게 자동으로 분류하고 그림 2 에서 “Strategic meta information” 으로 표시된 블록과 같이 다양한 소스들로부터 입력된 정형, 비정형 형태의 전략 메타정보를 이용해서 적절한 장면템플릿을 추천하는 방법에 관한 것이다.
표 1 은 식 (2)의 전략메타정보에 대한 예시이다. 마케팅 방법의 메타정보(마케팅전략), 홍보 방법을 지시하는 메타 정보(홍보전략), 사용자가 직접 입력하는 메타정보(홍보의도), 사용자가 사전에 입력한 사전정보(예: 업종, 지역 등), 만들어진 홍보동영상을 관리하는 CMS(Content Management Server)가 제공하는 영상 서비스 정보 등이 전략메타 정보로 활용될 수 있다. 주의할 점은 이런 소스(Source)들은 새롭게 추가되거나 내부 형식이 수시로 바뀔 수 있다는 점이다.
전략메타정보의 예시Table 1. Examples of strategic meta information
PPT Slide
Lager Image
전략메타정보의 예시 Table 1. Examples of strategic meta information
Examples of strategic meta information
PPT Slide
Lager Image
Examples of strategic meta information
표 1 의 전략메타정보는 내부처리과정을 거쳐 비정형 포맷과 정형 포맷으로 가공된다. 정형 포맷은 DB상의 엔티티 혹은 XML포맷, JSON포맷 등으로 기술되므로 태그매칭이나 결정트리 등의 다양한 알고리즘을 적용하기 편리하다 [8] , [9] . 그러나 앞서 기술한 바와 같이 서비스 시나리오의 특징과 확장성을 고려하여 본 논문에서는 비정형 포맷과 정형 포맷의 메타정보를 동시에 이용하는 방법을 제안한다. 이때 표 1 에서의 메타정보는 소스별로 부분처리도 가능하나 단순한 구성을 위해 식 (6)과 같이 N 개의 소스에서 제공된 각각의 메타정보를 하나의 통합 텍스트 메타정보 q 로 처리한다.
PPT Slide
Lager Image
- 2. 주제모델링 (Topic Modeling)
그림 2 의 “Recommendation and categorization of scene templates using topic modeling” 블록은 본 논문이 제안하는 주요내용을 포함하며 이를 기술하면 다음과 같다. 홍보 동영상 제작 서비스 시스템은 다양한 메타문서가 포함된 리소스, 템플릿 정보들을 이용해서 홍보동영상을 합성한다. 이를 위해서 분류, 유사도 계산, 검색과 추천 기술이 내부적으로 필요하다. 구현관점에서 리소스나 장면템플릿들에 일련의 태그(tag) 정보를 붙이고 이를 벡터공간(Vector Space)으로 표현하여 처리하는 방식, 혹은 이를 확장하여 텍스트로 표현된 메타정보의 단어별 빈도를 이용해서 처리하는 TF-IDF(Term Frequency-Inverse Document Frequency)기법 역시 간결하면서도 효과적이다 [10] . 하지만 TF-IDF 방법은 메타정보량이 커지는 경우 유사도 추정의 정확도가 감소하고, 검색 키워드(Search Keyword)와 메타문서 상의 단어 상호간에 완벽하게 일치하는 경우에만 유사도 계산에 반영되어 추가 성능 개선을 위해서는 키워드에 대한 정제와 정규화 과정이 필요하다. 또한 모델을 단순화하기 위해 단어(word or term)들 사이에 통계적 독립을 가정하므로 유사도 계산의 정확도 향상에도 한계를 지닌다 [11] .
이를 해결하는 방법으로써 본 논문에서는 주제모델링(Topic modeling) 기법을 사용한다. 주제모델링 기법은 주어진 문서들에서 숨겨진 주제들을 찾는 도구라 할 수 있다. 구체적인 응용들로는 (1)“주어진 문서(document)들에 포함된 숨겨진 주제(topic, theme)들 찾기”, (2)“찾아진 주제들에 따라 주석(annotation) 추가하기”, (3)“주석을 사용해서 문서들을 구성(organization), 요약(summarization), 검색(searching), 예측(prediction) 하기” 등이 가능하다 [11] . 이는 일종의 입력 정보들에 대한 분류(Clustering) 과정으로써 기계학습(Machine Learning)에서 자율학습기법(Unsupervised Learning)의 범주에 속한다.
주제모델링을 위한 다양한 기법들이 존재하지만 그 중에서도 LSA(Latent Sematic Analysis/Indexing) [12] 방법과 LDA(Latent Dirichlet Allocation)방법 [11] 은 간결하면서도 성능이 우수하다.
LSA방법은 신호처리에서의 주성분 분석(PCA; Principle Component Analysis) 개념과 유사하다. 관측 가능한 문서들의 집합인 A [n × m] 를 식 (7)과 같이 SVD(Singular Value Decomposition)를 사용해서 분해함으로써 주제모델링을 수행하는 방식이다. 텍스트 기반의 주제모델링 관점에서 식 (7)을 해석하면 n 은 입력 문서의 개수, m 은 단어(word or term)의 개수, r 은 주제의 개수에 대응한다. 외부에 노출된 자료는 A [n × m] 뿐이지만 이를 SVD를 수행함으로써 숨겨져 있었던 U [n × r] , S [r × r] , V [m × r] 를 찾을 수 있는데 이를 이용하는 방식에 따라 주제모델링이나 자료압축(Data Compression)에 활용된다. 주제모델링 관점에서 U [n × r] 는 문서들을 주제로 대응시키는 벡터, V [m × r] 는 단어들을 주제로대응시키는벡터로해석할수있다. S [r × r] 는고유값(Eigenvalue)으로 이뤄진 대각행렬(Diagonal matrix)로써 값의 크기에 따라 찾아진 주제의 강도(Strength)를 나타낸다 [12] .
PPT Slide
Lager Image
LDA방법은 주제(topic), 문서(document), 단어(word)라는 일상적 개념들을 확률 모델로 해석한다. 주제는 단어들의 집합이지만 이를 확률이론으로 해석하면 단어라는 확률 변수들로 구성된 확률분포 함수라고 생각할 수 있다. 각각 의 문서도 단어들의 집합이지만 임의의 주제들에 대한 가중합된 혼합확률분포 함수라고 간주할 수 있다. 따라서 주제, 단어, 문서는 확률 모델로 해석할 수 있으며, 상호간에는 숨겨진 연결 구조를 가지고 있음을 추측할 수 있다 [11] . LDA를 확률문제 관점에서 보면 혼합확률분포함수에서 이를 구성하는 개별적인 확률분포 함수들과 가중치 매개변수(parameter) 값들을 찾는 과정이라 할 수 있다. 여기서 단어들의 배치 순서는 고려하지 않음으로써 모델을 상대적으로 단순화 시킨다. 이를 “bag-of-words” 가정이라 부른다. 이렇게 문제를 정의하고 나면 혼합확률분포함수의 매개변수를 찾는 문제로 귀결되며 주로 EM(Expectation Maximization) 알고리즘이나 이를 개선한 방법들을 사용한다. LDA는 베이지언 확률연산에 유용한 드리클레 분포(Dirichlet distribution)로 가정하고, K 개의 확률분포함수의 개수는 사용자가 제시한다 [11] .
- 3. 제안하는 분류 및 추천 방법
장면템플릿을 분류하고 추천하기 위해 본 논문에서는 여러 주제 모델링 방법들 중에서 LSA방법을 사용한다. 이는 TF-IDF 방법의 단점을보완하면서도, LDA방법에 비해 간단하고 안정적인 성능을 제공하기 때문이다. 주제모델링 기술을 장면템플릿 분류 및 추천에 적용해 보면 식 (2)의 장면템플릿과 연결된 메타정보( D )들을 이용해서 주제모델링을 수행하는문제가된다. 표 2 는 이에 대한구체적인 방법으로써 템플릿 메타문서들에 포함된 단어들의 출현 패턴을 바탕으로 숨겨진 주제들을 찾고 주제에 맞게 분류하는 순서를 나타낸다. 주제의 개수는 K 개로 주어지는데 선택 방법은 휴리스틱 적이다 [11] , [12] . 주제모델링이 완료된 상태에서 각종 전략메타정보에 따라 장면템플릿을 추천하는 제안 방법은 표 3 과 같다. 두 벡터 A , B 사이의 유사도(similarity)를 계산하기 위해서 는 식 (8)과 같은 코사인 유사도(Cosine similarity) 공식을 사용했다. 즉, 유사도가 –1은 서로 반대인 경우, 0은 서로 상관성이 없는 경우, 1은 완벽히 일치함을 의미한다.
PPT Slide
Lager Image
딕셔너리 갱신 및 주제모델링 과정Table 2. Update Dictionary and Topic Modeling
PPT Slide
Lager Image
딕셔너리 갱신 및 주제모델링 과정 Table 2. Update Dictionary and Topic Modeling
Update Dictionary and Topic Modeling
PPT Slide
Lager Image
Update Dictionary and Topic Modeling
전략메타정보를 이용해서 장면템플릿을 추천하는 과정Table 3. Scene Template Recommendation using Strategic Meta Information
PPT Slide
Lager Image
전략메타정보를 이용해서 장면템플릿을 추천하는 과정 Table 3. Scene Template Recommendation using Strategic Meta Information
Scene Template Recommendation using Strategic Meta Information
PPT Slide
Lager Image
Scene Template Recommendation using Strategic Meta Information
Ⅳ. 개발결과
- 1. 홍보동영상 제작 서비스 시스템 개발 내용
제안하는 홍보동영상 제작 서비스 시스템은 웹상에서 서비스를 제공한다. 데이터베이스 연동을 통한 동적 서비스 제공을 위해 PHP언어를 사용해서 구현했다 [13] . 하드웨어 시스템은 사용자 정보를 관리하는 프론트페이지서버(Front Page Server), 동영상 렌더링을 담당하는 렌더링서버(Rendering Server), 만들어진 영상을 저장하고 스트리밍하는 CMS부(Contents Management Server)로 구성된다.
그림 3 은 홍보동영상을 제작하기 위해 구현한 사용자 환경이다. 서비스에 가입하고 로그인하면 초기화면이 나타나고(a) 콘텐츠 관리 페이지를 통해 사진이나 동영상을 업로드(b) 할 수 있도록 한다. 그리고 최종 완성된 홍보물들을 갤러리 형식으로 관리하는 관리 페이지(c)를 제공하여 콘텐츠 다운로드 및 재생 빈도를 파악할 수 있다. 홍보동영상을 만들기 위해서 사용자로부터 홍보의도를 직관적으로 선택하게 하고(d), 이를 통해 적절한 템플릿을 추천하도록 한다(e). 템플릿을 이용해서 영상을 합성하려면 관련된 사진이나 동영상, 혹은 텍스트와 같은 리소스 정보가 필요하므로 이를 제공하는 가이드 사용자 환경(Guide User Interface)을 제공한다. 이는 사용자가 무슨 조작을 해야 할 지 사전에 모르더라도 쉽게 사용할 수 있도록 하기 위함이다. (f), (g)는 이에 대한 예시로써 홍보하려는 업체정보와 메뉴사진을 입력하도록 안내하고 있다. 영상 렌더링은 CPU 클록속도가 3GHz 정도의 단일쓰레드(Single thread) 환경에서 3분~20분 정도가 소요되어 이에 대한 진행률을 제공하여 완료 예상 시간을 쉽게 추정할 수 있게 했다. 또한 완료됐을 때 단문문자서비스(Short Message Service)로 결과를 알려주는 기능도 제공한다(h). 영상 제작이 최종 완료되면 이를 로컬 저장소에 저장하거나 웹 주소를 공유하여 영상을 배포할 수 있도록 했다. 그림 4 는 시스템 관리자용 사용자환경으로써 만들어진 홍보물에 대한 서비스 정보를 기초로 선호되는 콘텐츠, 접속 단말별 UserAgent정보, 접속한 IP주소들을 보여준다.
PPT Slide
Lager Image
제작된 홍보동영상 제작 서비스 시스템 및 사용자 환경 Fig. 3. PR Video Making Service System and User Interface
PPT Slide
Lager Image
시스템 관리자용 사용자 환경 Fig. 4. User Interface for System Administrator
- 2. 장면템플릿 분류 및 추천
그림 3 (e)와 같이 장면템플릿을 추천하기 위해서 제안하는 분류 및 추천 과정이 시스템에 적용되었다. 이에 대한 성능 분석을 위해 관련서비스를 수행 중인 [14] 를 참고하여 40개의 장면템플릿별 메타정보를 준비했다. 표 4 는 문장형태의 메타정보들에서 형태소 분석 후 단어를 추출하여 정리한 것이다. 메타정보는 장면템플릿의 디자인 단계에서 설명글 형태로 추가되는데 실험에 사용한 메타정보에서 추출한 단어들의 수는 평균 7~10개 정도였다. 실험에 사용된 장면템플릿은 홍보할 업종을 고려하여 {여행, 숙박, 식당, 카페, 디자인, 게임, 기타}와 같이 7개 주제로 구분할 수 있다. {기타}를 제외하고는 분류항목별로 5개씩이 서로 유사한 분류로 묶여있다는 점이 특징이다. 예를 들어 표 4 에서 0~4번은 {여행}, 5~9번은 {숙박}과 관련되어 있음을 알 수 있다. 메타정보들은 서로 다른 분류항목들과도 일정부분 연관성이 존재하지만 {기타}에서 36번과 같이 다른 모든 항목들에서 전혀 사용하지 않은 단어로만 구성된 경우도 존재한다.
장면템플릿별 메타정보 예시Table 4. Examples of meta information for each scene templates
PPT Slide
Lager Image
장면템플릿별 메타정보 예시 Table 4. Examples of meta information for each scene templates
표 5 표 4 의 템플릿 메타정보를 이용하여 LSA 방법으로 주제모델링을 수행하고, 전략메타정보를 입력했을 때 적절한 장면템플릿을 추천하는 예시를 보여준다. 주제모델링 알고리즘은 gensim 라이브러리를 사용했다 [15] . 표 5 에서 전략메타정보로부터 추출된 단어들은 표 4 의 10번 항목과 동일하여 유사도가 거의 1로 나타났으며, 12, 14, 11, 13, 8, ... 번순으로 식당이나 숙박과 관련된 템플릿이 상위에 추천되었다. 음수의 유사도가 나오는 이유는 식 (8)의 코사인 유사도 공식을 사용했기 때문이다. 이 예시는 제안 방법을 사용해서 전략메타정보가 정형 메타정보와 비정형 메타 정보로 함께 구성되어 있더라도 원래 의도에 부합하는 장면템플릿들이 추천되고 있음을 보여준다.
LSA를 사용한 주제모델링 예시Table 5. Example of topic modeling using LSA
PPT Slide
Lager Image
LSA를 사용한 주제모델링 예시 Table 5. Example of topic modeling using LSA
그림 5 는 TF-IDF와 LSA 주제모델링 방법으로 40개의 메타정보들 사이의 상호 유사도 관계를 보여준다. 이는 장면템플릿간의 분류에 활용될 수 있으며, 그림 5 의 결과를 통해 TF-IDF와 LSA방법의 차이와 장단점을 확인할 수 있다. TF-IDF의 유사도 값은 LSA방법과는 다르게 0에서 1사이의 값을 갖는데 그림 5 (a)의 결과와 같이 단어들 사이에 100% 일치하지 않는 경우 유사도 계산에 반영되지 않으므로 의미가 비슷하더라도 많은 경우에서 0의 값을 보였다. 반면 LSA 방법은 당초 예상대로 5개정도의 템플릿들끼리 그룹지어 분리되고 있음을 확인할 수 있다. 그러나 그림에서 대각선 항목은 자기 자신과의 유사도이므로 1의 값을 갖는 게 맞지만 매우 이질적인 메타정보들의 경우는 주제 모델링에 전혀 반영되지 못해서 0의 값을 보이기도 한다. LSA방법은 주제의 개수 K 에 따라 결과의 차이는 발생하고 있으나 분류 관점에서 보면 TF-IDF 방법에 비해 우수한 결과를 보이고 있다고 할 수 있다. 그림 5 에는 나타내지 않은 LDA 방법의 경우 메타정보의 개수와 단어 수의 제한으로 인해 본 논문의 실험조건 하에서는 결과가 수렴하지 못하는 문제가 발생했다.
PPT Slide
Lager Image
장면템플릿 분류 결과 Fig. 5. Results of scene templates
제안 방법은 그림 3 과 같이 홍보동영상을 만들기 위한 과정에 적용되었다. 그림 3 (d)에서는 사용자 의도와 업종정보를 파악하는 단계로써 식 (6)과 같은 방법으로 질의문(Query statement)을 생성한다. 그림 3 (e)는 이를 통해 적절한 장면템플릿이 추천되는 과정을 보였다. 그림 3 (e)의 예에서는 업종을 “음식점(한식)”으로 사전에 정하고, 잠재고객을 “30대, 여성”으로 설정한 결과 이와 관련된 업종과 분위기의 장면템플릿이 추천되는 결과를 보여준다. 만약 업종을 “카페”로 사전에 정하면 카페와 관련된 장면템플릿들이 상위에 추천된다. 이런 방법으로 추천된 장면템플릿들을 사용자가 직접 확인하고 선택할 수 있도록 함으로써 결과물에 대한 만족도를 향상 시키고 매출 향상에도 기여할 수 있게 된다. 구현한 홍보동영상 제작 서비스 시스템에 LSA 기반의 제안 방법을 적용한 결과 그림 5 에 부합하는 주관적 만족도를 얻을 수 있었다. 이에 대한 보다 객관적인 평가는 기 개발한 피드백 정보 분석부와 연계하여 처리가 가능하나 본 논문의 범위를 벗어나므로 후속 연구로 진행할 계획이다. 제안 방법의 가장 주요한 특징 및 장점은 실제 서비스 되는 시스템에 쉽고 확장성 있게 적용 가능하다는 점이다. 제안 방법을 서비스 중인 시스템에 적용한 결과 전략메타정보가 새롭게 추가 되는 경우라도 프로그램 내부의 구조적 변경이 불필요했다.
Ⅴ. 결 론
본 논문에서는 메타정보로 표현된 마케팅 및 홍보전략·의도 등을 이용하여 홍보동영상을 자동으로 제작하는 웹기반 서비스프레임워크를 제시했다. 비정형화된 템플릿과 리소스 관련 메타정보를 주제모델링 방법을 사용해서 자동분류하고 홍보전략 및 홍보의도를 표현하는 정형화 되지 않은 전략메타정보를 이용한 유사도 분석을 통해 적절한 장면템플릿을 추천하는 방법을 제안했다. 향후 더 많은 테스트 집합과 시험 집합을 통해 성능 평가 방법을 개선할 예정이며, 장면템플릿 뿐만 아니라 사진이나 동영상과 같은 리소스에 포함된 정보까지 활용하여 만족도 높은 홍보 동영상을 생성하는 연구를 진행할 계획이다.
BIO
박 종 빈
- 2004년 : 성균관대학교 정보통신공학부 학사
- 2006년 : 성균관대학교 전자전기컴퓨터공학부 석사
- 2008년 : 캐나다통신연구소(CRC) 방문연구원
- 2011년 : 성균관대학교 전자전기컴퓨터공학부 박사
- 2012년 : 성균관대학교 정보통신공학부 박사후 연구원
- 2012년 ~ 현재 : 전자부품연구원 스마트미디어연구센터
- ORCID : orcid.org/0000-0002-6123-5300
- 주관심분야 : 멀티미디어신호처리, 데이터 압축, 정보추론, IoT 및 임베디드 시스템 기술
이 한 덕
- 2008년 : 건국대학교 학사
- 2011년 : 건국대학교 석사
- 2011년 ~ 현재 : 전자부품연구원 스마트미디어연구센터
- ORCID : orcid.org/0000-0001-9474-4171
- 주관심분야 : 비디오 인코딩, 인공지능, 병렬처리, 분산처리
김 경 원
- 2001년 : 한국외국어대학교 컴퓨터공학과 학사
- 2003년 : 한국외국어대학교 컴퓨터공학과 석사
- 2013년 : 건국대학교 컴퓨터·정보통신공학과 박사수료
- 2004년 ~ 현재 : 전자부품연구원 스마트미디어연구센터
- ORCID : orcid.org/0000-0001-6530-8426
- 주관심분야 : 메타데이터, 스마트 TV, N-스크린 서비스, 맞춤형방송, 멀티미디어 검색
정 종 진
- 1997년 : 성균관대학교 정보통신공학부 학사
- 2002년 : 성균관대학교 전자전기컴퓨터공학부 석사
- 2002년 ~ 현재 : 전자부품연구원 스마트미디어연구센터
- ORCID : orcid.org/0000-0003-3924-8938
- 주관심분야 : 멀티미디어신호처리, 빅데이터 기반 스마트 서비스, 클라우드 기반 스마트홈 플랫폼
임 태 범
- 1995년 : 서강대학교 물리학과 학사
- 1997년 : 서강대학교 전자계산학과 석사
- 2002년 : 대우전자 영상연구소 전임연구원
- 2012년 : 건국대학교 컴퓨터공학과 박사
- 2002년 ~ 현재 : 전자부품연구원 스마트미디어연구센터장
- ORCID : orcid.org/0000-0003-1173-6606
- 주관심분야 : 홈네트워크 솔루션, IoT, 클라우드 방송, DTV방송, 맞춤형방송, 멀티미디어 검색, IPTV
References
https://en.wikipedia.org/wiki/Public_relations
Jung E. , Choi J. , Shon Y. 2012 "Influence of advertising type and gender on advertising effectiveness: The efficacy of storytelling advertising" Korean Journal of the science of Emotion & sensibility 489 - 502
Miller Michael 2011 YouTube for business: Online video marketing for any business 2nd Edition Pearson Education
Scott David Meerman 2009 The new rules of marketing and PR: how to use social media, blogs, news releases, online video, and viral marketing to reach buyers directly John Wiley & Sons
Park J. , Park M. , Kim K. , Jeong J. , Lee J. , Lim T. “Development of Cloud-based Service Framework for Promotional Video Synthesis” KICS, 2015 Winter Conference 2015 795 - 796
Park J. , Kim K. , Jeong J. , Lim T. "Development of Processing Interface for Promotional Video Making System based on MLT Multimedia Framework" 2015 Korean Society of Broadcast Engineers Summer Conference 2015 w2.4-4 1 - 2
MLT Multimedia Framework http://www.mltframework.org/
Toby Segaran 2007 Programming collective intelligence: building smart web 2.0 applications O'Reilly Media, Inc.
Wes McKinney 2012 Python for data analysis: Data wrangling with Pandas, NumPy, and IPython. O'Reilly Media, Inc.
Salton G. , McGill M. 1983 Introduction to Modern Information Retrieval. McGraw-Hill
Blei David M. , Ng Andrew Y. , Jordan Michael I. (2003) "Latent dirichlet allocation." the Journal of machine Learning research 3 993 - 1022
Deerwester Scott C. 1990 "Indexing by latent semantic analysis." JAsIs 41 (6) 391 - 407
PHP http://www.w3schools.com/php/
Shakr https://www.shakr.com/
gensim https://radimrehurek.com/gensim/