JLab Miner로 돌아가기 <ⓒ 2023. 정재학 Jaihak Chung, All right reserved>
빅데이터는 현재 텍스트 데이터가 주류이나, 점차 이미지 데이터들이 많아지고 있다. 문제는 이미지 데이터의 경우, 어떻게 전처리를 해야 할지, 이 이미지속에 담긴 정보가 무엇이고 어떻게 정보를 추출(인식)해야 할지에 대한 연구가 매우 미비하다. 이 과정에 필요한 분석 기법은 텍스트 데이터 분석에서 주로 쓰인 자연어처리 (Natural Language Processing)으로는 안되며, 보다 많은 컴퓨팅 리소스 (메모리, 연산량등)이 요구된다. 때문에 일반 기업에서 이미지 데이터를 무척 많이 보유하고 있음에도 불구하고, 이 자료들을 활용하지 못하고 있기에 이를 위해 전처리, 기초 분석등에 필요한 방법론과 프로그램들을 개발 제공하고자 한다.