표제어 처리(Lemmatization)란?

표제어 처리는 단어의 형태가 변해도 그 의미를 파악할 수 있도록 단어의 기본형(표제어)으로 변환하는 과정입니다. 한국어에서는 용언(동사, 형용사)의 어간과 어미를 분리하여 어간만 추출하는 작업이 대표적입니다.

예를 들어:

표제어 처리 방법 설명

1안: 형태소 분석기 이용한 표제어 처리

2안: 직접 사용자 정의 사전 활용

3안: JLab 전용 코드 (추후 소개)