[UPDATE] 수만개의 트윗을 단 5분 만에 처리한다?! - NetMiner 4.4.2
안녕하세요, 사이람입니다. 최근 사용 편의 향상을 위해 버그를 수정하고 불편했던 점을 개선하여 NetMiner가 4.4.2 로 업데이트 되었습니다! 우선 텍스트 데이터를 불러오는 속도가 매우 빨라졌습니다! 실제 약 5만개의 한글 트윗에서 단어(형태소)를 추출하여 빈도와 TF-IDF 를 계산하고, 문장과 문단을 뽑아 구성하는데까지 단 2~3분!동일한 데이터를 불러오는데 약 4~5시간 정도의 시간이 걸렸던 과거에 비하면 아주 획기적인 변화라고 할 수 있겠죠? 참고로 아래 이미지는 테스트 데이터를 불러올 때 NetMiner 의 Progress Bar 에 표시되는 소요시간 입니다. 텍스트 데이터를 불러올 때는 4단계의 처리 과정을 거치게 되어있는데 그 중 Building Network 를 효율적으로 개선하여 소..
NetMiner 이야기/NetMiner 및 이벤트 소식
2018. 11. 28. 17:25