Media Log

Co-occurrence Network 생성 플러그인 소개



이 플러그인은 co-occurrence 네트워크 데이터를 자동으로 생성 해줍니다. 


예를 들어, 공동저자 네트워크를 만들기 위해 아래와 같은 raw data가 있을 수 있습니다.


sample raw data

========================

"Paper1","A,B,C","Field1"

"Paper2","A,B,D,E","Field2"

"Paper3","C,D,E","Field2"

"Paper4","A,D","Field3"

"Paper5","B,E,F","Field3"

"Paper6","F,G,C","Field4"

"Paper7","B,C","Field2"

"Paper8","F,G,H","Field4"

"Paper9","I,G,J","Field1"

"Paper10","H,K","Field3"

"Paper11","I,K,J","Field5"

"Paper12","D,F,G,H","Field6"

"paper13","A,B,E","Field3"

========================


논문의 저자를 단순히 나열한 데이터입니다. 

논문1은 A, B, C라는 저자들이, 논문2는 A, B, D, E라는 저자들이 작성하였음을 알 수 있습니다. 


이 csv 형식의 데이터를 co-occurrence network 생성 플러그인을 실행하여 불러오면 각 저자들이 공동 저자로 함께 몇 회 등장했는지에 대한 관계정보를 담은 데이터로 아래와 같이 변환해 줍니다.


result

========================

A,B,3

A,E,2

B,E,3

G,C,1

G,J,1

D,H,1

  .

  .

==========================


넷마이너 Co-occurrence Network 생성 플러그인 다운받기




그럼, 이 플러그인을 어디에 어떻게 사용하면 좋을까요?


이 플러그인을 활용하여 예능 프로그램에 등장하는 출연자들의 co-occurrence 네트워크를 만들어보면서 플러그인의 사용 방법에 대해 함께 알아보겠습니다.



Co-occurrence Network 생성 플러그인 활용하기 - 예능 공동출연 네트워크 만들기


1) 예능프로그램 출연자 데이터 수집


먼저 네트워크를 만들어보기 위해 데이터가 있어야 겠죠~!


현재 지상파, 종편 및 케이블에 출연중인 출연자들을 프로그램에 따라 차례대로 나열하는 것만으로 데이터를 준비할 수 있습니다.


예능 프로그램 및 출연자에 대한 정보는 네이버 검색을 활용하였습니다. 지상파, 케이블, 종편을 모두 포함하여 4월 마지막 주 한 주간에 진행된 모든 예능 프로그램을 대상으로 수집하였습니다.




‘위기탈출 넘버원’이라는 예능 프로그램은 ‘김종국, 장윤정, 김준현’ 세 명의 출연자가 기록되어 있습니다. 김종국, 장윤정, 김준현 세 사람이 이 한가지 프로그램에 공동 출연한 것으로 판단하고 데이터를 입력합니다.


이러한 방법으로 다른 예능 프로그램들을 검색하여 기록된 출연자들을 차례로 나열하여 아래와 같은 데이터가 준비되었습니다. 



CSV(쉼표로 구분) 파일로 저장해 줍니다.


위의 그림에서 실제 플러그인이 활용하게 되는 부분은 B컬럼의 데이터입니다. 다른 컬럼은 프로그램을 구분하기 위해 수집한 정보를 입력해 놓았지만 플러그인을 실행했을 때 이 부분의 데이터는 사라지게 됩니다.


분석에 사용될 데이터를 아래와 같이 종합(지상파+종편+케이블)/ 지상파/ 종편&케이블 세가지 데이터로 만들어 준비하였습니다. 다운 받아서 한번 따라 해보세요~ :)


예능데이터(종합).csv


예능데이터(지상파).csv


예능데이터(종편&케이블).csv



2) 플러그인 실행하기


데이터 수집이 완료되었으니, 이제 플러그인을 사용하여 Co-occurrence 네트워크를 만들어 보겠습니다. 


플러그인을 설치하는 방법에 대해 모르시는 분들은 아래 링크를 참조해 주세요~

2013/05/20 - [NetMiner/NetMiner 플러그인] - 넷마이너에 플러그인 설치하기



다운 받은 플러그인을 실행시키면 다음과 같은 창이 열립니다.


 

‘Browse’ 버튼을 클릭하여 준비된 csv 파일을 지정해 줍니다. 


Select target column란에는 ‘0’이라고 표시되어 있습니다. 데이터가 시작되는 컬럼을 0으로 보고있기 때문에 만약 등장할 노드들이 작성한 데이터 상에서 두번째 컬럼에 있다면 1이라고 입력하시면 됩니다.


Seperator란에는 데이터상에서 노드들을 구분해 주는 구분자를 입력합니다. 예를 들어 위에서 작성한 예능 데이터의 경우 각 이름 사이를 ‘, ’(쉼표와 공백)으로 구분하고 있기 때문에 ‘,(공백)’을 입력하였습니다.


이제, OK를 클릭하면 co-occurrence network 데이터가 생성 됩니다. 짜잔~!!


3) 데이터 보기

 

 




방향이 없고, 함께 출연한 횟수를 가중치(weight)로 가진 예능프로그램 공동출연 네트워크가 생성되었습니다.


공동출연 네트워크이기 때문에 홀로 프로그램을 진행하는 경우는 네트워크에서 제외되었습니다.



다음 포스팅에서는 플러그인으로 만든 공동출연 네트워크를 분석하여 네트워크상의 능력자를 함께 찾아보겠습니다!! 기대해 주세요~ =)















저작자 표시 비영리 변경 금지
신고
크리에이티브 커먼즈 라이선스
Creative Commons License

submit

티스토리 툴바