JLab Miner로 돌아가기 <ⓒ 2023. 정재학 Jaihak Chung, All right reserved>

Text Miner란?

저희는 텍스트 빅데이터를 VOC(고객의 소리)를 담고 있는 데이터로 정의하고 있습니다 (정재학 2016). 빅데이터는 텍스트 데이터(온라인 후기), 이미지 데이터 (온라인 사진) 등등 여러가지인데, 현재 가장 많은 것이 온라인상에서 고객들이 작성한 메시지 (고객 후기 등) 즉, 텍스트 빅데이터 입니다.

과거에는 주로 서베이를 통해 측정을 해왔으나, 2000년대 이후 온라인 sns의 발달에 따라 온라인상에서 고객들이 자발적으로 자연스럽게 표출한 대량의 VOC 데이터를 더욱 더 활용하게 되었습니다. 흥미로운 점은, 전통적 서베이 데이터에서 VOC는 숫자(Metric Data)형태로 되어 있는 반면, 온라인 상에서 VOC(고객의 소리)가 담긴 데이터는 대부분 글(텍스트)로 표현되어 있다는 점 입니다.

JLab Miner는 개발 초기 부터 사실, 빅데이터 중 텍스트 데이터를 중점적으로 분석하는 방법론들을 개발해 왔습니다. 텍스트 분석은 아래 4가지 단계를 거쳐 진행됩니다.

Text Miner 분석 전 정제 (전처리) ?

Text Miner 중급?