본문 바로가기

[빅데이터 분석방법] 소셜 마이닝, 현실 마이닝, 의미연결망 분석

1. 소셜 마이닝(Social Mining)

소셜 네트워크의 분석은 수학의 그래프 이론에 뿌리를 두고 있으며, 소셜 네트워크 연결구조 및 연결 강도 등을 바탕으로 사용자의 명성 및 영향력을 측정하여, 소셜 네트워크상에서 입소문의 중심이나 허브 역할을 하는 사용자를 찾는데 주로 활용된다. 소셜 미디어에 올라오는 글과 사용자를 분석해 소비자의 흐름이나 패턴 등을 분석하고, 판매나 홍보에 적용 마케팅 분야뿐만 아니라 사회의 흐름과 트렌드, 여론 변화 추이를 읽어내는 소셜 미디어 시대의 새로운 마이닝 기법이다.

 

 

 

2. 현실 마이닝(Reality Mining)

현실 마이닝(Reality Mining)은 사람들의 행동패턴을 예측하기 위해 사회적 행동과 관련된 정보를 기기를 통해 얻고 분석하는 기술이다. 휴대폰 등 모바일 기기들을 통해 현실에서 발생하는 정보를 기반으로 인간관계와 행동양태 등을 추론한다.

Technology Review 2014년 3,4월호에서 10가지 떠오르는 기술 중의 하나로 소개된 현실 마이닝은 사람들의 삶에서 패턴을 발견하는 것에 관심을 가지며, 이를 통해 사람들이 편리한 삶을 살아가도록 도와주는 것을 목적으로 한다. 데이터 마이닝도 마찬가지의 목적이라고 볼 수 있지만, 현실 마이닝은 모바일 기기의 발전을 통해 가능해진 사람들의 이동경로, 통화내용, 접촉하는 사람들과 같은 현실에서 발생하는 정보를 입력정보로 활용한다는 것이 차이점이라고 볼 수 있다. 국내에서도 GPS를 이용한 이동경로 분석에 대한 연구와 활용은 많이 진척되고 있다.

 

 

 

현실 마이닝에 대한 연구를 수행하고 있는 MIT 미디어랩의 Pentland교수는 강연에서 때로는 사람들이 인지하고 있는 것과 실제로 행동하는 것은 다르며, 실제 행동에서 더 의미있는 정보를 파악할 수 있다고 언급하였다. 지금까지 현실 마이닝을 적용하고 있는 분야는 기업에서 조직 구성원 간의 관계 파악, 커뮤니티 내의 소셜 네트워크 파악, 질병의 전파경로 파악, 개인의 건강상태 점검 등이다. Pentland 교수는 일본의 한 기업에서 직원들이 패용하고 있는 카드에 RFID를 삽입하여 직원들의 이동경로 데이터를 수집하였다. 이를 통해 조직 내의 소셜 네트워크를 파악할 수 있었으며, 마케팅 부서와 생산 부서가 정말 잘 의사소통하고 있는지와 같은 조직 구성원 간의 관계에 대한 분석을 수행하였다고 한다. 또 Pentland 교수는 100명의 MIT 학생과 교수들을 대상으로 이들의 휴대전화 통화내역과 블루투스 센서를 통해 얻어진 위치정보를 활용하여 이들 간의 소셜 네트워크를 모형화하였으며, 소셜 네트워크 관계에 있는 구성원들이 언제 어디서 만나게 될지를 예측하는 데에도 활용하였다.

 

 

 

이러한 모형화방안을 전염병의 확산경로를 파악하는데 적용하려는 연구도 진행되고 있다. 최초 감염자가 누구인지가 파악되면 이를 통해 예상 전파경로를 파악할 수 있다는 것이다. 또한 모바일 기기에 장착된 마이크나 모션 감지장치를 통해 사용자의 건강상태를 점검하는 데에도 활용할 수 있다. 휴대폰 통화 시에 마이크를 통해 감지되는 목소리를 통해 사용자의 우울증 여부를 파악하는데 도움을 줄 수 있으며, 모션 감지장치를 통해 사용자가 파킨슨병과 같은 행동에 영향을 미치는 질병에 걸렸을 가능성이 있는지를 추정할 수 있다. 실제로 한 기업의 연봉협상과정을 녹음하여 분석한 결과 연봉협상자와 인사담당자 간의 초기 3분간의 목소리 톤 패턴 분석을 통해 연봉협상자의 연봉이 인상될지 아니면 삭감될지를 예측하는 것이 가능하였다.

 

다양한 원천으로 부터 개인들의 행동에 대한 정보를 얻을 수 있는 상황이 되어 가고 있으며, 이를 활용하여 기업의 문제나 편리성을 제공하기 위한 연구뿐만이 아니라 개인의 삶을 편리하게 하는 데에도 적용할 분야는 많다. 언제나 개인들의 자료를 가지고 분석하는 경우에 개인정보보호의 문제가 뒤따르기 마련이며 현실 마이닝도 이러한 문제에 직면하게 되지만, 많은 구성원들의 데이터를 합쳐서 사용하게 되는 경우에는 어느 정도 이러한 문제를 해결할 수 있을 것이다.

 

 

 

3. 의미연결망 분석(semantic network analysis)

의미연결망의미 연결망 분석(semantic network analysis)은 단어 간에 공유된 의미를 바탕으로 구조의 체계화를 분석하는 소셜 네트워크 분석기법으로 수집된 데이터의 키워드 간 연결 관계를 파악하는 방법이다. 의미 연결망 분석은 특정한 주제의 방식과 단어를 어떻게 사용하고 배치했는지에 대한 텍스트 간의 구조적 분석이 가능하고, 비정형 데이터에서 정형화된 정보를 추출하여 커뮤니케이션 과정의 의미체계 및 패턴의 시각화라는 장점을 가지고 있다. 또한, 실증적 연구방법론으로서 연구대상으로 시스템을 구성하는 개체 간의 구조관계를 설정하여 개별 요소들의 분석이 아니라 각 요소 간의 관계성을 가진 연결망인 구조(structure)를 살펴보는 것이 주요 분석틀이다.

 

의미연결분석-예시
승부조작 관련기사 키워드 의미연결망분석

 

 

 

이러한 의미연결망분석은 일반적으로 문장 내 ‘단어’를 텍스트의 특성을 나타내는 기본개념으로 간주하여 분석단위로 삼으며 단어의 특성과 단어들 간의 의미적 관계에서 나타내는 속성들을 파악하는데 유용한 방법이다. 이에 언어 네트워크 분석은 ‘주제어 네트워크(network of the keywords)’분석은 텍스트 내 출현 단어의 단순 빈도 분석보다 유의미한 구조를 발견할 수 있는 분석방법이다. 특히 이 방법은 단어의 연결 패턴의 정량화와 핵심 주제어 추출과 같은 분석 결과를 통해 언어의 구조를 파악할 수 있다.

 

 

 

따라서, 이러한 언어, 주제어 등을 활용한 네트워크분석은 네트워크 분석을 통해 산출한 연결정도 중심성(degree centrality), 매개 중심성(between centrality), 고유 벡터 중심성(eigenvector centrality)을 기준으로 주제어를 파악하고 해석한다. 여기서의 ‘연결정도 중심성’은 네트워크의 노드들이 얼마나 많은 연결을 가지고 있는지를 측정한다. ‘매개 중심성’은 매개 중심성을 계산하는 방식 중 가장 많이 사용되는 프리만(Freeman)의 노드 매개 중심성을 사용하였는데 이 매개 중심성은 “한 노드가 네트워크 내의 다른 노드들 사이에 위치하는 정도를 측정하는 것”으로 이 매개 중심성이 높은 노드는 “정보의 흐름을 통제하는 데 큰 영향력을 가질 수 있다. 고유 벡터 중심성은 네트워크에서 가장 일반적인 영향력을 가지는 노드를 파악할 수 있는 근접 중심성(closeness centrality)을 보완한 척도이다.

facebook twitter kakaoTalk kakaostory naver band

본 사이트는 쿠팡 파트너스 활동을 통해 일정액의 수수료를 제공받을 수 있습니다.

Copyright © Weekly Clip All rights reserved.