[텍스트 전처리] 형태소 분석
이 글은 한국어의 형태소 분석에 관한 기록입니다. 형태소 분석 속도 및 결과를 기준으로 한국어 형태소 분석기를 비교한 글은 이 곳에서 볼 수 있습니다.
형태소 분석
단어 토큰화는 토큰의 단위를 단어로 하여, 코퍼스 내 텍스트를 단어 단위로 구분하는 작업을 의미합니다. 영어의 경우 단어 토큰화를 수행할 때 띄어쓰기를 단어 구분 기준으로 하는데, 이를 어절 토큰화라고 합니다. 그런데 한국어의 경우 단어 토큰화를 수행할 때 어절 토큰화를 사용하는 것은 부적절합니다. 이는 한국어가 교착어라는 점에 기인합니다. 대신, 한국어의 경우 단어 토큰화를 수행할 때 토큰의 단위를 형태소로 하는 형태소 토큰화를 사용합니다.
교착어
한국어는 교착어입니다. 교착어란 조사, 어미 등을 붙여서 말을 만드는 언어를 의미합니다. 예를 들어, “그”라는 단어에 다양한 조사를 붙여서 “그가”, “그에게”, “그를”, “그와” 등의 말을 만들 수 있습니다. 이때 조사는 “그”라는 단어 뒤에 띄어쓰기 없이 바로 붙게 됩니다. 즉 한국어는 어절이 독립적인 단위로 구성되지 않습니다. 조사 등의 무언가가 붙어있는 경우가 많기 때문입니다. 따라서 어절 토큰화를 사용할 수 없습니다. NLP에서는 단어의 형태가 달라 같은 단어임에도 다른 단어인 것처럼 취급되는 것이 큰 문제로 작용합니다. 따라서 한국어에서는 조사, 어미 등을 분리해야 할 필요가 있습니다. 이를 위해서는 토큰의 단위를 형태소로 하는 형태소 토큰화를 사용해야 합니다.
형태소
형태소(morpheme)란 뜻을 가진 가장 작은 말의 단위를 의미합니다. 형태소는 자립 형태소와 의존 형태소로 나뉩니다.
- 자립 형태소 : 접사, 어미, 조사와 상관없이 자립하여 사용할 수 있는 형태소 : 체언 (명사, 대명사, 수사), 수식언 (관형사, 부사), 감탄사 등 => 그 자체로 단어
- 의존 형태소 : 다른 형태소와 결합하여 사용되는 형태소 : 조사, 접사, 어간, 어미
예를 들어 아래와 같은 문장에 대하여 형태소 분석을 하면 다음과 같습니다.
문장 : 에디가 딥러닝책을 읽었다
자립 형태소 : 에디, 딥러닝책
의존 형태소 : -가, -을, 읽-, -었, -다
형태소 분석기
한국어의 경우 KoNLPy
를 활용하여 단어 토큰화가 가능합니다. KoNLPy에서 제공하는 형태소 분석기는 다음과 같습니다.
형태소 분석기를 사용하여 단어 토큰화를 수행한다는 것은 형태소 토큰화를 수행한다는 것입니다.
한국어 형태소 분석 Code
먼저 텍스트 데이터를 불러옵니다. 여기에서는 예제로 아이유의 “마음을 드려요” 가사를 가져왔습니다.
text = '당신에게 드릴 게 없어서 나의 마음을 드려요 그대에게 받은 게 많아서 표현을 다 할 수가 없어요 나지막한 인사에 수많은 내 마음 고이 담아 그대에게로 건네면 내 마음 조금 알까요 어떤 이유로 만나 나와 사랑을 하고 어떤 이유로 내게 와 함께 있어준 당신 부디 행복한 날도 살다 지치는 날도 모두 그대의 곁에 내가 있어줄 수 있길 어떤 소식 보다 더 애타게 기다려지는 그대 엇갈리지 않게 여기 기다릴게요 눌러 적은 편지에 수많은 그리움 고이 담아 그대 내게로 올 때면 그 손에 쥐어줄게요 어떤 이유로 만나 나와 사랑을 하고 어떤 이유로 내게 와 함께 있어준 당신 부디 행복한 날도 살다 지치는 날도 모두 그대의 곁에 내가 있어줄 수 있길 네 번의 모든 계절들과 열두 달의 시간을 너와 숨이 차게 매일 사랑하며 함께 할게 어떤 이유로 만나 우리 사랑을 했던 지금 이 순간처럼 매일 바라보며 애써주기를 부디 행복한 날도 살다 지치는 날도 모두 그대의 곁에 내가 있어줄 수 있길 부디 추억만 남지 않길 너완'
text
'당신에게 드릴 게 없어서 나의 마음을 드려요 그대에게 받은 게 많아서 표현을 다 할 수가 없어요 나지막한 인사에 수많은 내 마음 고이 담아 그대에게로 건네면 내 마음 조금 알까요 어떤 이유로 만나 나와 사랑을 하고 어떤 이유로 내게 와 함께 있어준 당신 부디 행복한 날도 살다 지치는 날도 모두 그대의 곁에 내가 있어줄 수 있길 어떤 소식 보다 더 애타게 기다려지는 그대 엇갈리지 않게 여기 기다릴게요 눌러 적은 편지에 수많은 그리움 고이 담아 그대 내게로 올 때면 그 손에 쥐어줄게요 어떤 이유로 만나 나와 사랑을 하고 어떤 이유로 내게 와 함께 있어준 당신 부디 행복한 날도 살다 지치는 날도 모두 그대의 곁에 내가 있어줄 수 있길 네 번의 모든 계절들과 열두 달의 시간을 너와 숨이 차게 매일 사랑하며 함께 할게 어떤 이유로 만나 우리 사랑을 했던 지금 이 순간처럼 매일 바라보며 애써주기를 부디 행복한 날도 살다 지치는 날도 모두 그대의 곁에 내가 있어줄 수 있길 부디 추억만 남지 않길 너완'
먼저 형태소 분석기를 클래스로 선언합니다.
from konlpy.tag import *
komoran = Komoran()
kkma = Kkma()
okt = Okt()
mecab = Mecab()
각 형태소 분석기 클래스는 아래와 같은 메소드를 가지고 있습니다.
Tagger.nouns()
: 명사 반환 (품사가 명사인 형태소만을 반환)Tagger.morphs()
: 형태소 반환Tagger.pos()
: 형태소와 품사 태그 반환Tagger.tagset
: 품사 태그의 기호와 의미 반환
먼저 nouns()
메소드를 활용하여 텍스트 데이터로부터 명사를 추출해봅니다.
# 명사 추출
print('=====원문=====')
print(text)
print('=====Komoran=====')
print(komoran.nouns(text))
print('=====Kkma=====')
print(kkma.nouns(text))
print('=====Okt=====')
print(okt.nouns(text))
print('=====Mecab=====')
print(mecab.nouns(text))
=====원문=====
당신에게 드릴 게 없어서 나의 마음을 드려요 그대에게 받은 게 많아서 표현을 다 할 수가 없어요 나지막한 인사에 수많은 내 마음 고이 담아 그대에게로 건네면 내 마음 조금 알까요 어떤 이유로 만나 나와 사랑을 하고 어떤 이유로 내게 와 함께 있어준 당신 부디 행복한 날도 살다 지치는 날도 모두 그대의 곁에 내가 있어줄 수 있길 어떤 소식 보다 더 애타게 기다려지는 그대 엇갈리지 않게 여기 기다릴게요 눌러 적은 편지에 수많은 그리움 고이 담아 그대 내게로 올 때면 그 손에 쥐어줄게요 어떤 이유로 만나 나와 사랑을 하고 어떤 이유로 내게 와 함께 있어준 당신 부디 행복한 날도 살다 지치는 날도 모두 그대의 곁에 내가 있어줄 수 있길 네 번의 모든 계절들과 열두 달의 시간을 너와 숨이 차게 매일 사랑하며 함께 할게 어떤 이유로 만나 우리 사랑을 했던 지금 이 순간처럼 매일 바라보며 애써주기를 부디 행복한 날도 살다 지치는 날도 모두 그대의 곁에 내가 있어줄 수 있길 부디 추억만 남지 않길 너완
=====Komoran=====
['드릴', '게', '마음', '그대에게', '게', '표현', '수', '인사', '마음', '그대에게', '마음', '이유', '사랑', '이유', '행복', '날', '날', '곁', '수', '소식', '편지', '그리움', '내', '게로', '때', '손', '이유', '사랑', '이유', '행복', '날', '날', '곁', '수', '번', '계절', '달', '시간', '숨', '사랑', '이유', '사랑', '순간', '행복', '날', '날', '곁', '수', '추억', '남지']
=====Kkma=====
['당신', '나', '마음', '그대', '표현', '수', '인사', '내', '이유', '사랑', '행복', '날', '곁', '소식', '대', '여기', '편지', '그리움', '때', '손', '번', '계절', '달', '시간', '너와', '숨', '우리', '순간', '주기', '추억']
=====Okt=====
['당신', '드릴', '게', '나', '마음', '그대', '게', '표현', '수가', '인사', '내', '마음', '고이', '그대', '내', '마음', '조금', '요', '이유', '사랑', '이유', '준', '당신', '부디', '날', '날', '모두', '그대', '곁', '내', '수', '소식', '더', '애', '그대', '여기', '편지', '그리움', '고이', '그대', '내게로', '때', '그', '손', '이유', '사랑', '이유', '준', '당신', '부디', '날', '날', '모두', '그대', '곁', '내', '수', '네', '번의', '모든', '계절', '달', '시간', '너', '숨', '매일', '사랑', '이유', '우리', '사랑', '지금', '이', '순간', '매일', '주기', '부디', '날', '날', '모두', '그대', '곁', '내', '수', '부디', '추억', '남지', '너완']
=====Mecab=====
['당신', '게', '나', '마음', '그대', '게', '표현', '수', '인사', '마음', '그대', '내', '마음', '이유', '사랑', '이유', '내게', '당신', '행복', '날', '날', '그대', '곁', '내', '수', '소식', '그대', '여기', '게요', '편지', '그리움', '그대', '내게로', '때', '손', '이유', '사랑', '이유', '내게', '당신', '행복', '날', '날', '그대', '곁', '내', '수', '번', '계절', '열', '달', '시간', '너', '숨', '사랑', '게', '이유', '우리', '사랑', '지금', '순간', '행복', '날', '날', '그대', '곁', '내', '수', '추억', '너']
다음으로 morphs()
메소드를 활용하여 텍스트 데이터로부터 형태소를 추출합니다.
# 형태소 추출
print('=====원문=====')
print(text)
print('=====Komoran=====')
print(komoran.morphs(text))
print('=====Kkma=====')
print(kkma.morphs(text))
print('=====Okt=====')
print(okt.morphs(text))
print('=====Mecab=====')
print(mecab.morphs(text))
=====원문=====
당신에게 드릴 게 없어서 나의 마음을 드려요 그대에게 받은 게 많아서 표현을 다 할 수가 없어요 나지막한 인사에 수많은 내 마음 고이 담아 그대에게로 건네면 내 마음 조금 알까요 어떤 이유로 만나 나와 사랑을 하고 어떤 이유로 내게 와 함께 있어준 당신 부디 행복한 날도 살다 지치는 날도 모두 그대의 곁에 내가 있어줄 수 있길 어떤 소식 보다 더 애타게 기다려지는 그대 엇갈리지 않게 여기 기다릴게요 눌러 적은 편지에 수많은 그리움 고이 담아 그대 내게로 올 때면 그 손에 쥐어줄게요 어떤 이유로 만나 나와 사랑을 하고 어떤 이유로 내게 와 함께 있어준 당신 부디 행복한 날도 살다 지치는 날도 모두 그대의 곁에 내가 있어줄 수 있길 네 번의 모든 계절들과 열두 달의 시간을 너와 숨이 차게 매일 사랑하며 함께 할게 어떤 이유로 만나 우리 사랑을 했던 지금 이 순간처럼 매일 바라보며 애써주기를 부디 행복한 날도 살다 지치는 날도 모두 그대의 곁에 내가 있어줄 수 있길 부디 추억만 남지 않길 너완
=====Komoran=====
['당신', '에게', '드릴', '게', '없', '어서', '나', '의', '마음', '을', '드리', '어요', '그대에게', '받', '은', '게', '많', '아서', '표현', '을', '다', '하', 'ㄹ', '수', '가', '없', '어요', '나지막', '하', 'ㄴ', '인사', '에', '수많', '은', '내', '마음', '고이', '담', '아', '그대에게', '로', '건네', '면', '내', '마음', '조금', '알', 'ㄹ까요', '어떤', '이유', '로', '만나', '아', '나오', '아', '사랑', '을', '하', '고', '어떤', '이유', '로', '내', '게', '오', '아', '함께', '있', '어', '주', 'ㄴ', '당신', '부디', '행복', '하', 'ㄴ', '날', '도', '살', '다', '지치', '는', '날', '도', '모두', '그대', '의', '곁', '에', '내', '가', '있', '어', '주', 'ㄹ', '수', '있', '기', 'ㄹ', '어떤', '소식', '보다', '더', '애타', '게', '기다리', '어', '지', '는', '그대', '엇갈리', '지', '않', '게', '여기', '기다리', 'ㄹ게요', '누르', '어', '적', '은', '편지', '에', '수많', '은', '그리움', '고이', '담', '아', '그대', '내', '게로', '올', '때', '이', '면', '그', '손', '에', '쥐', '어', '주', 'ㄹ게요', '어떤', '이유', '로', '만나', '아', '나오', '아', '사랑', '을', '하', '고', '어떤', '이유', '로', '내', '게', '오', '아', '함께', '있', '어', '주', 'ㄴ', '당신', '부디', '행복', '하', 'ㄴ', '날', '도', '살', '다', '지치', '는', '날', '도', '모두', '그대', '의', '곁', '에', '내', '가', '있', '어', '주', 'ㄹ', '수', '있', '기', 'ㄹ', '네', '번', '의', '모든', '계절', '들', '과', '열두', '달', '의', '시간', '을', '너', '와', '숨', '이', '차', '게', '매일', '사랑', '하', '며', '함께', '하', 'ㄹ게', '어떤', '이유', '로', '만나', '아', '우리', '사랑', '을', '하', '았', '던', '지금', '이', '순간', '처럼', '매일', '바라보', '며', '애쓰', '어', '주', '기', '를', '부디', '행복', '하', 'ㄴ', '날', '도', '살', '다', '지치', '는', '날', '도', '모두', '그대', '의', '곁', '에', '내', '가', '있', '어', '주', 'ㄹ', '수', '있', '기', 'ㄹ', '부디', '추억', '만', '남지', '않', '기', 'ㄹ', '너', '와', 'ㄴ']
=====Kkma=====
['당신', '에게', '드리', 'ㄹ', '것', '이', '없', '어서', '나', '의', '마음', '을', '드', '려요', '그대', '에게', '받으', 'ㄴ', '것', '이', '많', '아서', '표현', '을', '다', '하', 'ㄹ', '수', '가', '없', '어요', '나지막', '하', 'ㄴ', '인사', '에', '수많', '은', '내', '마음', '고이', '담', '아', '그대', '에게', '로', '건네', '면', '내', '마음', '조금', '알', 'ㄹ까요', '어떤', '이유', '로', '만', '나', '나오', '아', '사랑', '을', '하', '고', '어떤', '이유', '로', '내', '게', '오', '아', '함께', '있', '어', '주', 'ㄴ', '당신', '부디', '행복', '하', 'ㄴ', '날', '도', '살', '다', '지치', '는', '날', '도', '모두', '그대', '의', '곁', '에', '나', '가', '있', '어', '주', 'ㄹ', '수', '있', '기', '를', '어떻', 'ㄴ', '소식', '보다', '더', '애타', '게', '기다리', '어', '지', '는', '그', '대', '엇갈리', '지', '않', '게', '여기', '기다리', 'ㄹ게요', '눌', '러', '적', '은', '편지', '에', '수많', '은', '그리움', '고이', '담', '아', '그대', '내', '게', '로', '오', 'ㄹ', '때', '이', '면', '그', '손', '에', '쥐', '어', '주', 'ㄹ게요', '어떤', '이유', '로', '만', '나', '나오', '아', '사랑', '을', '하', '고', '어떤', '이유', '로', '내', '게', '오', '아', '함께', '있', '어', '주', 'ㄴ', '당신', '부디', '행복', '하', 'ㄴ', '날', '도', '살', '다', '지치', '는', '날', '도', '모두', '그대', '의', '곁', '에', '나', '가', '있', '어', '주', 'ㄹ', '수', '있', '기', '를', '네', '번', '의', '모든', '계절', '들', '과', '열', 'ㄹ', '두', '달', '의', '시간', '을', '너와', '숨', '이', '차', '게', '매일', '사랑', '하', '며', '함께', '하', 'ㄹ', '것', '이', '어떤', '이유', '로', '만', '나', '우리', '사랑', '을', '하', '었', '던', '지금', '이', '순간', '처럼', '매일', '바라보', '며', '애써', '주기', '를', '부디', '행복', '하', 'ㄴ', '날', '도', '살', '다', '지치', '는', '날', '도', '모두', '그대', '의', '곁', '에', '나', '가', '있', '어', '주', 'ㄹ', '수', '있', '기', '를', '부디', '추억', '만', '남', '지', '않', '기', '를', '느', '어', '와', 'ㄴ']
=====Okt=====
['당신', '에게', '드릴', '게', '없어서', '나', '의', '마음', '을', '드려요', '그대', '에게', '받은', '게', '많아서', '표현', '을', '다', '할', '수가', '없어요', '나지막한', '인사', '에', '수많은', '내', '마음', '고이', '담아', '그대', '에게로', '건네면', '내', '마음', '조금', '알까', '요', '어떤', '이유', '로', '만나', '나와', '사랑', '을', '하고', '어떤', '이유', '로', '내게', '와', '함께', '있어', '준', '당신', '부디', '행복한', '날', '도', '살다', '지치는', '날', '도', '모두', '그대', '의', '곁', '에', '내', '가', '있어줄', '수', '있길', '어떤', '소식', '보다', '더', '애', '타게', '기다려지는', '그대', '엇갈리지', '않게', '여기', '기다릴게요', '눌러', '적은', '편지', '에', '수많은', '그리움', '고이', '담아', '그대', '내게로', '올', '때', '면', '그', '손', '에', '쥐어줄게요', '어떤', '이유', '로', '만나', '나와', '사랑', '을', '하고', '어떤', '이유', '로', '내게', '와', '함께', '있어', '준', '당신', '부디', '행복한', '날', '도', '살다', '지치는', '날', '도', '모두', '그대', '의', '곁', '에', '내', '가', '있어줄', '수', '있길', '네', '번의', '모든', '계절', '들', '과', '열두', '달', '의', '시간', '을', '너', '와', '숨', '이', '차게', '매일', '사랑', '하며', '함께', '할게', '어떤', '이유', '로', '만나', '우리', '사랑', '을', '했던', '지금', '이', '순간', '처럼', '매일', '바라보며', '애써', '주기', '를', '부디', '행복한', '날', '도', '살다', '지치는', '날', '도', '모두', '그대', '의', '곁', '에', '내', '가', '있어줄', '수', '있길', '부디', '추억', '만', '남지', '않길', '너완']
=====Mecab=====
['당신', '에게', '드릴', '게', '없', '어서', '나', '의', '마음', '을', '드려요', '그대', '에게', '받', '은', '게', '많', '아서', '표현', '을', '다', '할', '수', '가', '없', '어요', '나지막', '한', '인사', '에', '수많', '은', '내', '마음', '고이', '담', '아', '그대', '에게', '로', '건네', '면', '내', '마음', '조금', '알', '까요', '어떤', '이유', '로', '만나', '나와', '사랑', '을', '하', '고', '어떤', '이유', '로', '내게', '와', '함께', '있', '어', '준', '당신', '부디', '행복', '한', '날', '도', '살', '다', '지치', '는', '날', '도', '모두', '그대', '의', '곁', '에', '내', '가', '있', '어', '줄', '수', '있', '길', '어떤', '소식', '보다', '더', '애타', '게', '기다려', '지', '는', '그대', '엇갈리', '지', '않', '게', '여기', '기다릴', '게요', '눌러', '적', '은', '편지', '에', '수많', '은', '그리움', '고이', '담', '아', '그대', '내게로', '올', '때', '면', '그', '손', '에', '쥐', '어', '줄게요', '어떤', '이유', '로', '만나', '나와', '사랑', '을', '하', '고', '어떤', '이유', '로', '내게', '와', '함께', '있', '어', '준', '당신', '부디', '행복', '한', '날', '도', '살', '다', '지치', '는', '날', '도', '모두', '그대', '의', '곁', '에', '내', '가', '있', '어', '줄', '수', '있', '길', '네', '번', '의', '모든', '계절', '들', '과', '열', '두', '달', '의', '시간', '을', '너', '와', '숨', '이', '차', '게', '매일', '사랑', '하', '며', '함께', '할', '게', '어떤', '이유', '로', '만나', '우리', '사랑', '을', '했', '던', '지금', '이', '순간', '처럼', '매일', '바라보', '며', '애써', '주', '기', '를', '부디', '행복', '한', '날', '도', '살', '다', '지치', '는', '날', '도', '모두', '그대', '의', '곁', '에', '내', '가', '있', '어', '줄', '수', '있', '길', '부디', '추억', '만', '남', '지', '않', '길', '너', '완']
마지막으로 pos()
메소드를 활용하여 텍스트 데이터로부터 형태소와 품사 태그를 추출합니다.
# 형태소 & 품사 추출
print('=====원문=====')
print(text)
print('=====Komoran=====')
print(komoran.pos(text))
print('=====Kkma=====')
print(kkma.pos(text))
print('=====Okt=====')
print(okt.pos(text))
print('=====Mecab=====')
print(mecab.pos(text))
=====원문=====
당신에게 드릴 게 없어서 나의 마음을 드려요 그대에게 받은 게 많아서 표현을 다 할 수가 없어요 나지막한 인사에 수많은 내 마음 고이 담아 그대에게로 건네면 내 마음 조금 알까요 어떤 이유로 만나 나와 사랑을 하고 어떤 이유로 내게 와 함께 있어준 당신 부디 행복한 날도 살다 지치는 날도 모두 그대의 곁에 내가 있어줄 수 있길 어떤 소식 보다 더 애타게 기다려지는 그대 엇갈리지 않게 여기 기다릴게요 눌러 적은 편지에 수많은 그리움 고이 담아 그대 내게로 올 때면 그 손에 쥐어줄게요 어떤 이유로 만나 나와 사랑을 하고 어떤 이유로 내게 와 함께 있어준 당신 부디 행복한 날도 살다 지치는 날도 모두 그대의 곁에 내가 있어줄 수 있길 네 번의 모든 계절들과 열두 달의 시간을 너와 숨이 차게 매일 사랑하며 함께 할게 어떤 이유로 만나 우리 사랑을 했던 지금 이 순간처럼 매일 바라보며 애써주기를 부디 행복한 날도 살다 지치는 날도 모두 그대의 곁에 내가 있어줄 수 있길 부디 추억만 남지 않길 너완
=====Komoran=====
[('당신', 'NP'), ('에게', 'JKB'), ('드릴', 'NNP'), ('게', 'NNG'), ('없', 'VA'), ('어서', 'EC'), ('나', 'NP'), ('의', 'JKG'), ('마음', 'NNG'), ('을', 'JKO'), ('드리', 'VV'), ('어요', 'EC'), ('그대에게', 'NNP'), ('받', 'VV'), ('은', 'ETM'), ('게', 'NNG'), ('많', 'VA'), ('아서', 'EC'), ('표현', 'NNG'), ('을', 'JKO'), ('다', 'MAG'), ('하', 'VV'), ('ㄹ', 'ETM'), ('수', 'NNB'), ('가', 'JKS'), ('없', 'VA'), ('어요', 'EC'), ('나지막', 'XR'), ('하', 'XSA'), ('ㄴ', 'ETM'), ('인사', 'NNG'), ('에', 'JKB'), ('수많', 'VA'), ('은', 'ETM'), ('내', 'NP'), ('마음', 'NNG'), ('고이', 'MAG'), ('담', 'VV'), ('아', 'EC'), ('그대에게', 'NNP'), ('로', 'JKB'), ('건네', 'VV'), ('면', 'EC'), ('내', 'NP'), ('마음', 'NNG'), ('조금', 'MAG'), ('알', 'VV'), ('ㄹ까요', 'EC'), ('어떤', 'MM'), ('이유', 'NNG'), ('로', 'JKB'), ('만나', 'VV'), ('아', 'EC'), ('나오', 'VV'), ('아', 'EC'), ('사랑', 'NNG'), ('을', 'JKO'), ('하', 'VV'), ('고', 'EC'), ('어떤', 'MM'), ('이유', 'NNG'), ('로', 'JKB'), ('내', 'VV'), ('게', 'EC'), ('오', 'VV'), ('아', 'EC'), ('함께', 'MAG'), ('있', 'VV'), ('어', 'EC'), ('주', 'VX'), ('ㄴ', 'ETM'), ('당신', 'NP'), ('부디', 'MAG'), ('행복', 'NNG'), ('하', 'XSV'), ('ㄴ', 'ETM'), ('날', 'NNG'), ('도', 'JX'), ('살', 'VV'), ('다', 'EC'), ('지치', 'VV'), ('는', 'ETM'), ('날', 'NNG'), ('도', 'JX'), ('모두', 'MAG'), ('그대', 'NP'), ('의', 'JKG'), ('곁', 'NNG'), ('에', 'JKB'), ('내', 'NP'), ('가', 'JKS'), ('있', 'VV'), ('어', 'EC'), ('주', 'VX'), ('ㄹ', 'ETM'), ('수', 'NNB'), ('있', 'VV'), ('기', 'ETN'), ('ㄹ', 'JKO'), ('어떤', 'MM'), ('소식', 'NNG'), ('보다', 'MAG'), ('더', 'MAG'), ('애타', 'VV'), ('게', 'EC'), ('기다리', 'VV'), ('어', 'EC'), ('지', 'VX'), ('는', 'ETM'), ('그대', 'NP'), ('엇갈리', 'VV'), ('지', 'EC'), ('않', 'VX'), ('게', 'EC'), ('여기', 'NP'), ('기다리', 'VV'), ('ㄹ게요', 'EC'), ('누르', 'VV'), ('어', 'EC'), ('적', 'VA'), ('은', 'ETM'), ('편지', 'NNG'), ('에', 'JKB'), ('수많', 'VA'), ('은', 'ETM'), ('그리움', 'NNG'), ('고이', 'MAG'), ('담', 'VV'), ('아', 'EC'), ('그대', 'NP'), ('내', 'NNB'), ('게로', 'NNP'), ('올', 'MM'), ('때', 'NNG'), ('이', 'VCP'), ('면', 'EC'), ('그', 'MM'), ('손', 'NNG'), ('에', 'JKB'), ('쥐', 'VV'), ('어', 'EC'), ('주', 'VX'), ('ㄹ게요', 'EC'), ('어떤', 'MM'), ('이유', 'NNG'), ('로', 'JKB'), ('만나', 'VV'), ('아', 'EC'), ('나오', 'VV'), ('아', 'EC'), ('사랑', 'NNG'), ('을', 'JKO'), ('하', 'VV'), ('고', 'EC'), ('어떤', 'MM'), ('이유', 'NNG'), ('로', 'JKB'), ('내', 'VV'), ('게', 'EC'), ('오', 'VV'), ('아', 'EC'), ('함께', 'MAG'), ('있', 'VV'), ('어', 'EC'), ('주', 'VX'), ('ㄴ', 'ETM'), ('당신', 'NP'), ('부디', 'MAG'), ('행복', 'NNG'), ('하', 'XSV'), ('ㄴ', 'ETM'), ('날', 'NNG'), ('도', 'JX'), ('살', 'VV'), ('다', 'EC'), ('지치', 'VV'), ('는', 'ETM'), ('날', 'NNG'), ('도', 'JX'), ('모두', 'MAG'), ('그대', 'NP'), ('의', 'JKG'), ('곁', 'NNG'), ('에', 'JKB'), ('내', 'NP'), ('가', 'JKS'), ('있', 'VV'), ('어', 'EC'), ('주', 'VX'), ('ㄹ', 'ETM'), ('수', 'NNB'), ('있', 'VV'), ('기', 'ETN'), ('ㄹ', 'JKO'), ('네', 'MM'), ('번', 'NNB'), ('의', 'JKG'), ('모든', 'MM'), ('계절', 'NNG'), ('들', 'XSN'), ('과', 'JC'), ('열두', 'NR'), ('달', 'NNG'), ('의', 'JKG'), ('시간', 'NNG'), ('을', 'JKO'), ('너', 'NP'), ('와', 'JKB'), ('숨', 'NNG'), ('이', 'JKS'), ('차', 'VV'), ('게', 'EC'), ('매일', 'MAG'), ('사랑', 'NNG'), ('하', 'XSV'), ('며', 'EC'), ('함께', 'MAG'), ('하', 'VV'), ('ㄹ게', 'EC'), ('어떤', 'MM'), ('이유', 'NNG'), ('로', 'JKB'), ('만나', 'VV'), ('아', 'EC'), ('우리', 'NP'), ('사랑', 'NNG'), ('을', 'JKO'), ('하', 'VV'), ('았', 'EP'), ('던', 'ETM'), ('지금', 'MAG'), ('이', 'MM'), ('순간', 'NNG'), ('처럼', 'JKB'), ('매일', 'MAG'), ('바라보', 'VV'), ('며', 'EC'), ('애쓰', 'VV'), ('어', 'EC'), ('주', 'VX'), ('기', 'ETN'), ('를', 'JKO'), ('부디', 'MAG'), ('행복', 'NNG'), ('하', 'XSV'), ('ㄴ', 'ETM'), ('날', 'NNG'), ('도', 'JX'), ('살', 'VV'), ('다', 'EC'), ('지치', 'VV'), ('는', 'ETM'), ('날', 'NNG'), ('도', 'JX'), ('모두', 'MAG'), ('그대', 'NP'), ('의', 'JKG'), ('곁', 'NNG'), ('에', 'JKB'), ('내', 'NP'), ('가', 'JKS'), ('있', 'VV'), ('어', 'EC'), ('주', 'VX'), ('ㄹ', 'ETM'), ('수', 'NNB'), ('있', 'VV'), ('기', 'ETN'), ('ㄹ', 'JKO'), ('부디', 'MAG'), ('추억', 'NNP'), ('만', 'JX'), ('남지', 'NNP'), ('않', 'VX'), ('기', 'ETN'), ('ㄹ', 'JKO'), ('너', 'NP'), ('와', 'JKB'), ('ㄴ', 'JX')]
=====Kkma=====
[('당신', 'NP'), ('에게', 'JKM'), ('드리', 'VV'), ('ㄹ', 'ETD'), ('것', 'NNB'), ('이', 'JKS'), ('없', 'VA'), ('어서', 'ECD'), ('나', 'NP'), ('의', 'JKG'), ('마음', 'NNG'), ('을', 'JKO'), ('드', 'VV'), ('려요', 'ECD'), ('그대', 'NP'), ('에게', 'JKM'), ('받으', 'VV'), ('ㄴ', 'ETD'), ('것', 'NNB'), ('이', 'JKS'), ('많', 'VA'), ('아서', 'ECD'), ('표현', 'NNG'), ('을', 'JKO'), ('다', 'MAG'), ('하', 'VV'), ('ㄹ', 'ETD'), ('수', 'NNB'), ('가', 'JKS'), ('없', 'VA'), ('어요', 'EFN'), ('나지막', 'XR'), ('하', 'XSA'), ('ㄴ', 'ETD'), ('인사', 'NNG'), ('에', 'JKM'), ('수많', 'VA'), ('은', 'ETD'), ('내', 'NP'), ('마음', 'NNG'), ('고이', 'MAG'), ('담', 'VV'), ('아', 'ECD'), ('그대', 'NP'), ('에게', 'JKM'), ('로', 'JKM'), ('건네', 'VV'), ('면', 'ECE'), ('내', 'NP'), ('마음', 'NNG'), ('조금', 'MAG'), ('알', 'VV'), ('ㄹ까요', 'ECD'), ('어떤', 'MDT'), ('이유', 'NNG'), ('로', 'JKM'), ('만', 'JX'), ('나', 'NP'), ('나오', 'VV'), ('아', 'ECS'), ('사랑', 'NNG'), ('을', 'JKO'), ('하', 'VV'), ('고', 'ECE'), ('어떤', 'MDT'), ('이유', 'NNG'), ('로', 'JKM'), ('내', 'VV'), ('게', 'ECD'), ('오', 'VV'), ('아', 'ECS'), ('함께', 'MAG'), ('있', 'VV'), ('어', 'ECD'), ('주', 'VXV'), ('ㄴ', 'ETD'), ('당신', 'NP'), ('부디', 'MAG'), ('행복', 'NNG'), ('하', 'XSV'), ('ㄴ', 'ETD'), ('날', 'NNG'), ('도', 'JX'), ('살', 'VV'), ('다', 'ECS'), ('지치', 'VV'), ('는', 'ETD'), ('날', 'NNG'), ('도', 'JX'), ('모두', 'MAG'), ('그대', 'NP'), ('의', 'JKG'), ('곁', 'NNG'), ('에', 'JKM'), ('나', 'NP'), ('가', 'JKS'), ('있', 'VV'), ('어', 'ECD'), ('주', 'VXV'), ('ㄹ', 'ETD'), ('수', 'NNB'), ('있', 'VV'), ('기', 'ETN'), ('를', 'JKO'), ('어떻', 'VA'), ('ㄴ', 'ETD'), ('소식', 'NNG'), ('보다', 'JKM'), ('더', 'MAG'), ('애타', 'VV'), ('게', 'ECD'), ('기다리', 'VV'), ('어', 'ECS'), ('지', 'VXV'), ('는', 'ETD'), ('그', 'MDT'), ('대', 'NNG'), ('엇갈리', 'VV'), ('지', 'ECD'), ('않', 'VXV'), ('게', 'ECD'), ('여기', 'NP'), ('기다리', 'VV'), ('ㄹ게요', 'EFN'), ('눌', 'VV'), ('러', 'ECD'), ('적', 'VA'), ('은', 'ETD'), ('편지', 'NNG'), ('에', 'JKM'), ('수많', 'VA'), ('은', 'ETD'), ('그리움', 'NNG'), ('고이', 'MAG'), ('담', 'VV'), ('아', 'ECD'), ('그대', 'NP'), ('내', 'VV'), ('게', 'ECS'), ('로', 'JKM'), ('오', 'VV'), ('ㄹ', 'ETD'), ('때', 'NNG'), ('이', 'VCP'), ('면', 'ECE'), ('그', 'MDT'), ('손', 'NNG'), ('에', 'JKM'), ('쥐', 'VV'), ('어', 'ECD'), ('주', 'VXV'), ('ㄹ게요', 'EFN'), ('어떤', 'MDT'), ('이유', 'NNG'), ('로', 'JKM'), ('만', 'JX'), ('나', 'NP'), ('나오', 'VV'), ('아', 'ECS'), ('사랑', 'NNG'), ('을', 'JKO'), ('하', 'VV'), ('고', 'ECE'), ('어떤', 'MDT'), ('이유', 'NNG'), ('로', 'JKM'), ('내', 'VV'), ('게', 'ECD'), ('오', 'VV'), ('아', 'ECS'), ('함께', 'MAG'), ('있', 'VV'), ('어', 'ECD'), ('주', 'VXV'), ('ㄴ', 'ETD'), ('당신', 'NP'), ('부디', 'MAG'), ('행복', 'NNG'), ('하', 'XSV'), ('ㄴ', 'ETD'), ('날', 'NNG'), ('도', 'JX'), ('살', 'VV'), ('다', 'ECS'), ('지치', 'VV'), ('는', 'ETD'), ('날', 'NNG'), ('도', 'JX'), ('모두', 'MAG'), ('그대', 'NP'), ('의', 'JKG'), ('곁', 'NNG'), ('에', 'JKM'), ('나', 'NP'), ('가', 'JKS'), ('있', 'VV'), ('어', 'ECD'), ('주', 'VXV'), ('ㄹ', 'ETD'), ('수', 'NNB'), ('있', 'VV'), ('기', 'ETN'), ('를', 'JKO'), ('네', 'MDN'), ('번', 'NNB'), ('의', 'JKG'), ('모든', 'MDT'), ('계절', 'NNG'), ('들', 'XSN'), ('과', 'JKO'), ('열', 'VV'), ('ㄹ', 'ETD'), ('두', 'MDN'), ('달', 'NNG'), ('의', 'JKG'), ('시간', 'NNG'), ('을', 'JKO'), ('너와', 'NNG'), ('숨', 'NNG'), ('이', 'JKS'), ('차', 'VV'), ('게', 'ECD'), ('매일', 'MAG'), ('사랑', 'NNG'), ('하', 'XSV'), ('며', 'ECE'), ('함께', 'MAG'), ('하', 'VV'), ('ㄹ', 'ETD'), ('것', 'NNB'), ('이', 'JKS'), ('어떤', 'MDT'), ('이유', 'NNG'), ('로', 'JKM'), ('만', 'JX'), ('나', 'NP'), ('우리', 'NP'), ('사랑', 'NNG'), ('을', 'JKO'), ('하', 'VV'), ('었', 'EPT'), ('던', 'EFQ'), ('지금', 'MAG'), ('이', 'MDT'), ('순간', 'NNG'), ('처럼', 'JKM'), ('매일', 'MAG'), ('바라보', 'VV'), ('며', 'ECE'), ('애써', 'MAG'), ('주기', 'NNG'), ('를', 'JKO'), ('부디', 'MAG'), ('행복', 'NNG'), ('하', 'XSV'), ('ㄴ', 'ETD'), ('날', 'NNG'), ('도', 'JX'), ('살', 'VV'), ('다', 'ECS'), ('지치', 'VV'), ('는', 'ETD'), ('날', 'NNG'), ('도', 'JX'), ('모두', 'MAG'), ('그대', 'NP'), ('의', 'JKG'), ('곁', 'NNG'), ('에', 'JKM'), ('나', 'NP'), ('가', 'JKS'), ('있', 'VV'), ('어', 'ECD'), ('주', 'VXV'), ('ㄹ', 'ETD'), ('수', 'NNB'), ('있', 'VV'), ('기', 'ETN'), ('를', 'JKO'), ('부디', 'MAG'), ('추억', 'NNG'), ('만', 'JX'), ('남', 'VV'), ('지', 'ECD'), ('않', 'VXV'), ('기', 'ETN'), ('를', 'JKO'), ('느', 'VV'), ('어', 'ECS'), ('와', 'VV'), ('ㄴ', 'ETD')]
=====Okt=====
[('당신', 'Noun'), ('에게', 'Josa'), ('드릴', 'Noun'), ('게', 'Noun'), ('없어서', 'Adjective'), ('나', 'Noun'), ('의', 'Josa'), ('마음', 'Noun'), ('을', 'Josa'), ('드려요', 'Verb'), ('그대', 'Noun'), ('에게', 'Josa'), ('받은', 'Verb'), ('게', 'Noun'), ('많아서', 'Adjective'), ('표현', 'Noun'), ('을', 'Josa'), ('다', 'Adverb'), ('할', 'Verb'), ('수가', 'Noun'), ('없어요', 'Adjective'), ('나지막한', 'Adjective'), ('인사', 'Noun'), ('에', 'Josa'), ('수많은', 'Adjective'), ('내', 'Noun'), ('마음', 'Noun'), ('고이', 'Noun'), ('담아', 'Verb'), ('그대', 'Noun'), ('에게로', 'Josa'), ('건네면', 'Verb'), ('내', 'Noun'), ('마음', 'Noun'), ('조금', 'Noun'), ('알까', 'Verb'), ('요', 'Noun'), ('어떤', 'Adjective'), ('이유', 'Noun'), ('로', 'Josa'), ('만나', 'Verb'), ('나와', 'Verb'), ('사랑', 'Noun'), ('을', 'Josa'), ('하고', 'Verb'), ('어떤', 'Adjective'), ('이유', 'Noun'), ('로', 'Josa'), ('내게', 'Verb'), ('와', 'Verb'), ('함께', 'Adverb'), ('있어', 'Adjective'), ('준', 'Noun'), ('당신', 'Noun'), ('부디', 'Noun'), ('행복한', 'Adjective'), ('날', 'Noun'), ('도', 'Josa'), ('살다', 'Verb'), ('지치는', 'Verb'), ('날', 'Noun'), ('도', 'Josa'), ('모두', 'Noun'), ('그대', 'Noun'), ('의', 'Josa'), ('곁', 'Noun'), ('에', 'Josa'), ('내', 'Noun'), ('가', 'Josa'), ('있어줄', 'Adjective'), ('수', 'Noun'), ('있길', 'Adjective'), ('어떤', 'Adjective'), ('소식', 'Noun'), ('보다', 'Verb'), ('더', 'Noun'), ('애', 'Noun'), ('타게', 'Verb'), ('기다려지는', 'Verb'), ('그대', 'Noun'), ('엇갈리지', 'Verb'), ('않게', 'Verb'), ('여기', 'Noun'), ('기다릴게요', 'Verb'), ('눌러', 'Verb'), ('적은', 'Verb'), ('편지', 'Noun'), ('에', 'Josa'), ('수많은', 'Adjective'), ('그리움', 'Noun'), ('고이', 'Noun'), ('담아', 'Verb'), ('그대', 'Noun'), ('내게로', 'Noun'), ('올', 'Verb'), ('때', 'Noun'), ('면', 'Josa'), ('그', 'Noun'), ('손', 'Noun'), ('에', 'Josa'), ('쥐어줄게요', 'Verb'), ('어떤', 'Adjective'), ('이유', 'Noun'), ('로', 'Josa'), ('만나', 'Verb'), ('나와', 'Verb'), ('사랑', 'Noun'), ('을', 'Josa'), ('하고', 'Verb'), ('어떤', 'Adjective'), ('이유', 'Noun'), ('로', 'Josa'), ('내게', 'Verb'), ('와', 'Verb'), ('함께', 'Adverb'), ('있어', 'Adjective'), ('준', 'Noun'), ('당신', 'Noun'), ('부디', 'Noun'), ('행복한', 'Adjective'), ('날', 'Noun'), ('도', 'Josa'), ('살다', 'Verb'), ('지치는', 'Verb'), ('날', 'Noun'), ('도', 'Josa'), ('모두', 'Noun'), ('그대', 'Noun'), ('의', 'Josa'), ('곁', 'Noun'), ('에', 'Josa'), ('내', 'Noun'), ('가', 'Josa'), ('있어줄', 'Adjective'), ('수', 'Noun'), ('있길', 'Adjective'), ('네', 'Noun'), ('번의', 'Noun'), ('모든', 'Noun'), ('계절', 'Noun'), ('들', 'Suffix'), ('과', 'Josa'), ('열두', 'Modifier'), ('달', 'Noun'), ('의', 'Josa'), ('시간', 'Noun'), ('을', 'Josa'), ('너', 'Noun'), ('와', 'Josa'), ('숨', 'Noun'), ('이', 'Josa'), ('차게', 'Verb'), ('매일', 'Noun'), ('사랑', 'Noun'), ('하며', 'Verb'), ('함께', 'Adverb'), ('할게', 'Verb'), ('어떤', 'Adjective'), ('이유', 'Noun'), ('로', 'Josa'), ('만나', 'Verb'), ('우리', 'Noun'), ('사랑', 'Noun'), ('을', 'Josa'), ('했던', 'Verb'), ('지금', 'Noun'), ('이', 'Noun'), ('순간', 'Noun'), ('처럼', 'Josa'), ('매일', 'Noun'), ('바라보며', 'Verb'), ('애써', 'Verb'), ('주기', 'Noun'), ('를', 'Josa'), ('부디', 'Noun'), ('행복한', 'Adjective'), ('날', 'Noun'), ('도', 'Josa'), ('살다', 'Verb'), ('지치는', 'Verb'), ('날', 'Noun'), ('도', 'Josa'), ('모두', 'Noun'), ('그대', 'Noun'), ('의', 'Josa'), ('곁', 'Noun'), ('에', 'Josa'), ('내', 'Noun'), ('가', 'Josa'), ('있어줄', 'Adjective'), ('수', 'Noun'), ('있길', 'Adjective'), ('부디', 'Noun'), ('추억', 'Noun'), ('만', 'Josa'), ('남지', 'Noun'), ('않길', 'Verb'), ('너완', 'Noun')]
=====Mecab=====
[('당신', 'NP'), ('에게', 'JKB'), ('드릴', 'VV+ETM'), ('게', 'NNB+JKS'), ('없', 'VA'), ('어서', 'EC'), ('나', 'NP'), ('의', 'JKG'), ('마음', 'NNG'), ('을', 'JKO'), ('드려요', 'VV+EC'), ('그대', 'NP'), ('에게', 'JKB'), ('받', 'VV'), ('은', 'ETM'), ('게', 'NNB+JKS'), ('많', 'VA'), ('아서', 'EC'), ('표현', 'NNG'), ('을', 'JKO'), ('다', 'MAG'), ('할', 'VV+ETM'), ('수', 'NNB'), ('가', 'JKS'), ('없', 'VA'), ('어요', 'EF'), ('나지막', 'XR'), ('한', 'XSA+ETM'), ('인사', 'NNG'), ('에', 'JKB'), ('수많', 'VA'), ('은', 'ETM'), ('내', 'MM'), ('마음', 'NNG'), ('고이', 'MAG'), ('담', 'VV'), ('아', 'EC'), ('그대', 'NP'), ('에게', 'JKB'), ('로', 'JKB'), ('건네', 'VV'), ('면', 'EC'), ('내', 'NP+JKG'), ('마음', 'NNG'), ('조금', 'MAG'), ('알', 'VV'), ('까요', 'EF'), ('어떤', 'MM'), ('이유', 'NNG'), ('로', 'JKB'), ('만나', 'VV+EC'), ('나와', 'VV+EC'), ('사랑', 'NNG'), ('을', 'JKO'), ('하', 'VV'), ('고', 'EC'), ('어떤', 'MM'), ('이유', 'NNG'), ('로', 'JKB'), ('내게', 'NP+JKB'), ('와', 'JKB'), ('함께', 'MAG'), ('있', 'VV'), ('어', 'EC'), ('준', 'VX+ETM'), ('당신', 'NP'), ('부디', 'MAG'), ('행복', 'NNG'), ('한', 'XSA+ETM'), ('날', 'NNG'), ('도', 'JX'), ('살', 'VV'), ('다', 'EC'), ('지치', 'VV'), ('는', 'ETM'), ('날', 'NNG'), ('도', 'JX'), ('모두', 'MAG'), ('그대', 'NP'), ('의', 'JKG'), ('곁', 'NNG'), ('에', 'JKB'), ('내', 'NP'), ('가', 'JKS'), ('있', 'VA'), ('어', 'EC'), ('줄', 'VX+ETM'), ('수', 'NNB'), ('있', 'VV'), ('길', 'ETN+JKO'), ('어떤', 'MM'), ('소식', 'NNG'), ('보다', 'JKB'), ('더', 'MAG'), ('애타', 'VV'), ('게', 'EC'), ('기다려', 'VV+EC'), ('지', 'VX'), ('는', 'ETM'), ('그대', 'NP'), ('엇갈리', 'VV'), ('지', 'EC'), ('않', 'VX'), ('게', 'EC'), ('여기', 'NP'), ('기다릴', 'VV+ETM'), ('게요', 'NNB+VCP+EC'), ('눌러', 'VV+EC'), ('적', 'VA'), ('은', 'ETM'), ('편지', 'NNG'), ('에', 'JKB'), ('수많', 'VA'), ('은', 'ETM'), ('그리움', 'NNG'), ('고이', 'MAG'), ('담', 'VV'), ('아', 'EC'), ('그대', 'NP'), ('내게로', 'NP+JKB+JKB'), ('올', 'MM'), ('때', 'NNG'), ('면', 'VCP+EC'), ('그', 'MM'), ('손', 'NNG'), ('에', 'JKB'), ('쥐', 'VV'), ('어', 'EC'), ('줄게요', 'VX+EF'), ('어떤', 'MM'), ('이유', 'NNG'), ('로', 'JKB'), ('만나', 'VV+EC'), ('나와', 'VV+EC'), ('사랑', 'NNG'), ('을', 'JKO'), ('하', 'VV'), ('고', 'EC'), ('어떤', 'MM'), ('이유', 'NNG'), ('로', 'JKB'), ('내게', 'NP+JKB'), ('와', 'JKB'), ('함께', 'MAG'), ('있', 'VV'), ('어', 'EC'), ('준', 'VX+ETM'), ('당신', 'NP'), ('부디', 'MAG'), ('행복', 'NNG'), ('한', 'XSA+ETM'), ('날', 'NNG'), ('도', 'JX'), ('살', 'VV'), ('다', 'EC'), ('지치', 'VV'), ('는', 'ETM'), ('날', 'NNG'), ('도', 'JX'), ('모두', 'MAG'), ('그대', 'NP'), ('의', 'JKG'), ('곁', 'NNG'), ('에', 'JKB'), ('내', 'NP'), ('가', 'JKS'), ('있', 'VA'), ('어', 'EC'), ('줄', 'VX+ETM'), ('수', 'NNB'), ('있', 'VV'), ('길', 'ETN+JKO'), ('네', 'MM'), ('번', 'NNBC'), ('의', 'JKG'), ('모든', 'MM'), ('계절', 'NNG'), ('들', 'XSN'), ('과', 'JKB'), ('열', 'NR'), ('두', 'MM'), ('달', 'NNG'), ('의', 'JKG'), ('시간', 'NNG'), ('을', 'JKO'), ('너', 'NP'), ('와', 'JKB'), ('숨', 'NNG'), ('이', 'JKS'), ('차', 'VV'), ('게', 'EC'), ('매일', 'MAG'), ('사랑', 'NNG'), ('하', 'XSV'), ('며', 'EC'), ('함께', 'MAG'), ('할', 'VV+ETM'), ('게', 'NNB+JKS'), ('어떤', 'MM'), ('이유', 'NNG'), ('로', 'JKB'), ('만나', 'VV+EC'), ('우리', 'NP'), ('사랑', 'NNG'), ('을', 'JKO'), ('했', 'VV+EP'), ('던', 'ETM'), ('지금', 'NNG'), ('이', 'JKS'), ('순간', 'NNG'), ('처럼', 'JKB'), ('매일', 'MAG'), ('바라보', 'VV'), ('며', 'EC'), ('애써', 'VV+EC'), ('주', 'VX'), ('기', 'ETN'), ('를', 'JKO'), ('부디', 'MAG'), ('행복', 'NNG'), ('한', 'XSA+ETM'), ('날', 'NNG'), ('도', 'JX'), ('살', 'VV'), ('다', 'EC'), ('지치', 'VV'), ('는', 'ETM'), ('날', 'NNG'), ('도', 'JX'), ('모두', 'MAG'), ('그대', 'NP'), ('의', 'JKG'), ('곁', 'NNG'), ('에', 'JKB'), ('내', 'NP'), ('가', 'JKS'), ('있', 'VA'), ('어', 'EC'), ('줄', 'VX+ETM'), ('수', 'NNB'), ('있', 'VV'), ('길', 'ETN+JKO'), ('부디', 'MAG'), ('추억', 'NNG'), ('만', 'JX'), ('남', 'VV'), ('지', 'EC'), ('않', 'VX'), ('길', 'ETN+JKO'), ('너', 'NP'), ('완', 'JKB+JX')]
각 형태소 분석기의 품사 태그에 관한 정보 즉 품사 태그의 기호와 의미는 tagset
속성을 통해 확인할 수 있습니다.
import pandas as pd
pd.set_option('display.max_rows', None)
tagsets = pd.DataFrame()
N = 67
tagsets["Kkma-기호"] = list(kkma.tagset.keys()) + list('-'*(N-len(kkma.tagset)))
tagsets["Kkma-의미"] = list(kkma.tagset.values()) + list('-'*(N-len(kkma.tagset)))
tagsets["Komoran-기호"] = list(komoran.tagset.keys()) + list('-'*(N-len(komoran.tagset)))
tagsets["Komoran-의미"] = list(komoran.tagset.values()) + list('-'*(N-len(komoran.tagset)))
tagsets["Mecab-기호"] = list(mecab.tagset.keys()) + list('-'*(N-len(mecab.tagset)))
tagsets["Mecab-의미"] = list(mecab.tagset.values()) + list('-'*(N-len(mecab.tagset)))
tagsets["OKT-기호"] = list(okt.tagset.keys()) + list('-'*(N-len(okt.tagset)))
tagsets["OKT-의미"] = list(okt.tagset.values()) + list('-'*(N-len(okt.tagset)))
tagsets
Kkma-기호 | Kkma-의미 | Komoran-기호 | Komoran-의미 | Mecab-기호 | Mecab-의미 | OKT-기호 | OKT-의미 | |
---|---|---|---|---|---|---|---|---|
0 | EC | 연결 어미 | EC | 연결 어미 | EC | 연결 어미 | Adjective | 형용사 |
1 | ECD | 의존적 연결 어미 | EF | 종결 어미 | EF | 종결 어미 | Adverb | 부사 |
2 | ECE | 대등 연결 어미 | EP | 선어말어미 | EP | 선어말어미 | Alpha | 알파벳 |
3 | ECS | 보조적 연결 어미 | ETM | 관형형 전성 어미 | ETM | 관형형 전성 어미 | Conjunction | 접속사 |
4 | EF | 종결 어미 | ETN | 명사형 전성 어미 | ETN | 명사형 전성 어미 | Determiner | 관형사 |
5 | EFA | 청유형 종결 어미 | IC | 감탄사 | IC | 감탄사 | Eomi | 어미 |
6 | EFI | 감탄형 종결 어미 | JC | 접속 조사 | JC | 접속 조사 | Exclamation | 감탄사 |
7 | EFN | 평서형 종결 어미 | JKB | 부사격 조사 | JKB | 부사격 조사 | Foreign | 외국어, 한자 및 기타기호 |
8 | EFO | 명령형 종결 어미 | JKC | 보격 조사 | JKC | 보격 조사 | Hashtag | 트위터 해쉬태그 |
9 | EFQ | 의문형 종결 어미 | JKG | 관형격 조사 | JKG | 관형격 조사 | Josa | 조사 |
10 | EFR | 존칭형 종결 어미 | JKO | 목적격 조사 | JKO | 목적격 조사 | KoreanParticle | (ex: ㅋㅋ) |
11 | EP | 선어말 어미 | JKQ | 인용격 조사 | JKQ | 인용격 조사 | Noun | 명사 |
12 | EPH | 존칭 선어말 어미 | JKS | 주격 조사 | JKS | 주격 조사 | Number | 숫자 |
13 | EPP | 공손 선어말 어미 | JKV | 호격 조사 | JKV | 호격 조사 | PreEomi | 선어말어미 |
14 | EPT | 시제 선어말 어미 | JX | 보조사 | JX | 보조사 | Punctuation | 구두점 |
15 | ET | 전성 어미 | MAG | 일반 부사 | MAG | 일반 부사 | ScreenName | 트위터 아이디 |
16 | ETD | 관형형 전성 어미 | MAJ | 접속 부사 | MAJ | 접속 부사 | Suffix | 접미사 |
17 | ETN | 명사형 전성 어미 | MM | 관형사 | MM | 관형사 | Unknown | 미등록어 |
18 | IC | 감탄사 | NA | 분석불능범주 | NNB | 의존 명사 | Verb | 동사 |
19 | JC | 접속 조사 | NF | 명사추정범주 | NNBC | 단위를 나타내는 명사 | - | - |
20 | JK | 조사 | NNB | 의존 명사 | NNG | 일반 명사 | - | - |
21 | JKC | 보격 조사 | NNG | 일반 명사 | NNP | 고유 명사 | - | - |
22 | JKG | 관형격 조사 | NNP | 고유 명사 | NP | 대명사 | - | - |
23 | JKI | 호격 조사 | NP | 대명사 | NR | 수사 | - | - |
24 | JKM | 부사격 조사 | NR | 수사 | SC | 구분자 , · / : | - | - |
25 | JKO | 목적격 조사 | NV | 용언추정범주 | SE | 줄임표 … | - | - |
26 | JKQ | 인용격 조사 | SE | 줄임표 | SF | 마침표, 물음표, 느낌표 | - | - |
27 | JKS | 주격 조사 | SF | 마침표, 물음표, 느낌표 | SH | 한자 | - | - |
28 | JX | 보조사 | SH | 한자 | SL | 외국어 | - | - |
29 | MA | 부사 | SL | 외국어 | SN | 숫자 | - | - |
30 | MAC | 접속 부사 | SN | 숫자 | SSC | 닫는 괄호 ), ] | - | - |
31 | MAG | 일반 부사 | SO | 붙임표(물결,숨김,빠짐) | SSO | 여는 괄호 (, [ | - | - |
32 | MD | 관형사 | SP | 쉼표,가운뎃점,콜론,빗금 | SY | 기타 기호 | - | - |
33 | MDN | 수 관형사 | SS | 따옴표,괄호표,줄표 | VA | 형용사 | - | - |
34 | MDT | 일반 관형사 | SW | 기타기호 (논리수학기호,화폐기호) | VCN | 부정 지정사 | - | - |
35 | NN | 명사 | VA | 형용사 | VCP | 긍정 지정사 | - | - |
36 | NNB | 일반 의존 명사 | VCN | 부정 지정사 | VV | 동사 | - | - |
37 | NNG | 보통명사 | VCP | 긍정 지정사 | VX | 보조 용언 | - | - |
38 | NNM | 단위 의존 명사 | VV | 동사 | XPN | 체언 접두사 | - | - |
39 | NNP | 고유명사 | VX | 보조 용언 | XR | 어근 | - | - |
40 | NP | 대명사 | XPN | 체언 접두사 | XSA | 형용사 파생 접미사 | - | - |
41 | NR | 수사 | XR | 어근 | XSN | 명사파생 접미사 | - | - |
42 | OH | 한자 | XSA | 형용사 파생 접미사 | XSV | 동사 파생 접미사 | - | - |
43 | OL | 외국어 | XSN | 명사파생 접미사 | - | - | - | - |
44 | ON | 숫자 | XSV | 동사 파생 접미사 | - | - | - | - |
45 | SE | 줄임표 | - | - | - | - | - | - |
46 | SF | 마침표, 물음표, 느낌표 | - | - | - | - | - | - |
47 | SO | 붙임표(물결,숨김,빠짐) | - | - | - | - | - | - |
48 | SP | 쉼표,가운뎃점,콜론,빗금 | - | - | - | - | - | - |
49 | SS | 따옴표,괄호표,줄표 | - | - | - | - | - | - |
50 | SW | 기타기호 (논리수학기호,화폐기호) | - | - | - | - | - | - |
51 | UN | 명사추정범주 | - | - | - | - | - | - |
52 | VA | 형용사 | - | - | - | - | - | - |
53 | VC | 지정사 | - | - | - | - | - | - |
54 | VCN | 부정 지정사, 형용사 '아니다' | - | - | - | - | - | - |
55 | VCP | 긍정 지정사, 서술격 조사 '이다' | - | - | - | - | - | - |
56 | VV | 동사 | - | - | - | - | - | - |
57 | VX | 보조 용언 | - | - | - | - | - | - |
58 | VXA | 보조 형용사 | - | - | - | - | - | - |
59 | VXV | 보조 동사 | - | - | - | - | - | - |
60 | XP | 접두사 | - | - | - | - | - | - |
61 | XPN | 체언 접두사 | - | - | - | - | - | - |
62 | XPV | 용언 접두사 | - | - | - | - | - | - |
63 | XR | 어근 | - | - | - | - | - | - |
64 | XSA | 형용사 파생 접미사 | - | - | - | - | - | - |
65 | XSN | 명사파생 접미사 | - | - | - | - | - | - |
66 | XSV | 동사 파생 접미사 | - | - | - | - | - | - |
댓글남기기