[텍스트 전처리] 형태소 분석

이 글은 한국어의 형태소 분석에 관한 기록입니다. 형태소 분석 속도 및 결과를 기준으로 한국어 형태소 분석기를 비교한 글은 이 곳에서 볼 수 있습니다.

형태소 분석

단어 토큰화는 토큰의 단위를 단어로 하여, 코퍼스 내 텍스트를 단어 단위로 구분하는 작업을 의미합니다. 영어의 경우 단어 토큰화를 수행할 때 띄어쓰기를 단어 구분 기준으로 하는데, 이를 어절 토큰화라고 합니다. 그런데 한국어의 경우 단어 토큰화를 수행할 때 어절 토큰화를 사용하는 것은 부적절합니다. 이는 한국어가 교착어라는 점에 기인합니다. 대신, 한국어의 경우 단어 토큰화를 수행할 때 토큰의 단위를 형태소로 하는 형태소 토큰화를 사용합니다.

교착어

한국어는 교착어입니다. 교착어란 조사, 어미 등을 붙여서 말을 만드는 언어를 의미합니다. 예를 들어, “그”라는 단어에 다양한 조사를 붙여서 “그가”, “그에게”, “그를”, “그와” 등의 말을 만들 수 있습니다. 이때 조사는 “그”라는 단어 뒤에 띄어쓰기 없이 바로 붙게 됩니다. 즉 한국어는 어절이 독립적인 단위로 구성되지 않습니다. 조사 등의 무언가가 붙어있는 경우가 많기 때문입니다. 따라서 어절 토큰화를 사용할 수 없습니다. NLP에서는 단어의 형태가 달라 같은 단어임에도 다른 단어인 것처럼 취급되는 것이 큰 문제로 작용합니다. 따라서 한국어에서는 조사, 어미 등을 분리해야 할 필요가 있습니다. 이를 위해서는 토큰의 단위를 형태소로 하는 형태소 토큰화를 사용해야 합니다.

형태소

형태소(morpheme)란 뜻을 가진 가장 작은 말의 단위를 의미합니다. 형태소는 자립 형태소와 의존 형태소로 나뉩니다.

  • 자립 형태소 : 접사, 어미, 조사와 상관없이 자립하여 사용할 수 있는 형태소 : 체언 (명사, 대명사, 수사), 수식언 (관형사, 부사), 감탄사 등 => 그 자체로 단어
  • 의존 형태소 : 다른 형태소와 결합하여 사용되는 형태소 : 조사, 접사, 어간, 어미

예를 들어 아래와 같은 문장에 대하여 형태소 분석을 하면 다음과 같습니다.

문장 : 에디가 딥러닝책을 읽었다
자립 형태소 : 에디, 딥러닝책
의존 형태소 : -가, -을, 읽-, -었, -다

형태소 분석기

한국어의 경우 KoNLPy를 활용하여 단어 토큰화가 가능합니다. KoNLPy에서 제공하는 형태소 분석기는 다음과 같습니다.

형태소 분석기를 사용하여 단어 토큰화를 수행한다는 것은 형태소 토큰화를 수행한다는 것입니다.

한국어 형태소 분석 Code

먼저 텍스트 데이터를 불러옵니다. 여기에서는 예제로 아이유의 “마음을 드려요” 가사를 가져왔습니다.

text = '당신에게 드릴 게 없어서 나의 마음을 드려요 그대에게 받은 게 많아서 표현을 다 할 수가 없어요 나지막한 인사에 수많은 내 마음 고이 담아 그대에게로 건네면 내 마음 조금 알까요 어떤 이유로 만나 나와 사랑을 하고 어떤 이유로 내게 와 함께 있어준 당신 부디 행복한 날도 살다 지치는 날도 모두 그대의 곁에 내가 있어줄 수 있길 어떤 소식 보다 더 애타게 기다려지는 그대 엇갈리지 않게 여기 기다릴게요 눌러 적은 편지에 수많은 그리움 고이 담아 그대 내게로 올 때면 그 손에 쥐어줄게요 어떤 이유로 만나 나와 사랑을 하고 어떤 이유로 내게 와 함께 있어준 당신 부디 행복한 날도 살다 지치는 날도 모두 그대의 곁에 내가 있어줄 수 있길 네 번의 모든 계절들과 열두 달의 시간을 너와 숨이 차게 매일 사랑하며 함께 할게 어떤 이유로 만나 우리 사랑을 했던 지금 이 순간처럼 매일 바라보며 애써주기를 부디 행복한 날도 살다 지치는 날도 모두 그대의 곁에 내가 있어줄 수 있길 부디 추억만 남지 않길 너완'
text
'당신에게 드릴 게 없어서 나의 마음을 드려요 그대에게 받은 게 많아서 표현을 다 할 수가 없어요 나지막한 인사에 수많은 내 마음 고이 담아 그대에게로 건네면 내 마음 조금 알까요 어떤 이유로 만나 나와 사랑을 하고 어떤 이유로 내게 와 함께 있어준 당신 부디 행복한 날도 살다 지치는 날도 모두 그대의 곁에 내가 있어줄 수 있길 어떤 소식 보다 더 애타게 기다려지는 그대 엇갈리지 않게 여기 기다릴게요 눌러 적은 편지에 수많은 그리움 고이 담아 그대 내게로 올 때면 그 손에 쥐어줄게요 어떤 이유로 만나 나와 사랑을 하고 어떤 이유로 내게 와 함께 있어준 당신 부디 행복한 날도 살다 지치는 날도 모두 그대의 곁에 내가 있어줄 수 있길 네 번의 모든 계절들과 열두 달의 시간을 너와 숨이 차게 매일 사랑하며 함께 할게 어떤 이유로 만나 우리 사랑을 했던 지금 이 순간처럼 매일 바라보며 애써주기를 부디 행복한 날도 살다 지치는 날도 모두 그대의 곁에 내가 있어줄 수 있길 부디 추억만 남지 않길 너완'

먼저 형태소 분석기를 클래스로 선언합니다.

from konlpy.tag import *

komoran = Komoran()
kkma = Kkma()
okt = Okt()
mecab = Mecab()

각 형태소 분석기 클래스는 아래와 같은 메소드를 가지고 있습니다.

  • Tagger.nouns() : 명사 반환 (품사가 명사인 형태소만을 반환)
  • Tagger.morphs() : 형태소 반환
  • Tagger.pos() : 형태소와 품사 태그 반환
  • Tagger.tagset : 품사 태그의 기호와 의미 반환

먼저 nouns() 메소드를 활용하여 텍스트 데이터로부터 명사를 추출해봅니다.

# 명사 추출
print('=====원문=====')
print(text)
print('=====Komoran=====')
print(komoran.nouns(text))
print('=====Kkma=====')
print(kkma.nouns(text))
print('=====Okt=====')
print(okt.nouns(text))
print('=====Mecab=====')
print(mecab.nouns(text))
=====원문=====
당신에게 드릴 게 없어서 나의 마음을 드려요 그대에게 받은 게 많아서 표현을 다 할 수가 없어요 나지막한 인사에 수많은 내 마음 고이 담아 그대에게로 건네면 내 마음 조금 알까요 어떤 이유로 만나 나와 사랑을 하고 어떤 이유로 내게 와 함께 있어준 당신 부디 행복한 날도 살다 지치는 날도 모두 그대의 곁에 내가 있어줄 수 있길 어떤 소식 보다 더 애타게 기다려지는 그대 엇갈리지 않게 여기 기다릴게요 눌러 적은 편지에 수많은 그리움 고이 담아 그대 내게로 올 때면 그 손에 쥐어줄게요 어떤 이유로 만나 나와 사랑을 하고 어떤 이유로 내게 와 함께 있어준 당신 부디 행복한 날도 살다 지치는 날도 모두 그대의 곁에 내가 있어줄 수 있길 네 번의 모든 계절들과 열두 달의 시간을 너와 숨이 차게 매일 사랑하며 함께 할게 어떤 이유로 만나 우리 사랑을 했던 지금 이 순간처럼 매일 바라보며 애써주기를 부디 행복한 날도 살다 지치는 날도 모두 그대의 곁에 내가 있어줄 수 있길 부디 추억만 남지 않길 너완
=====Komoran=====
['드릴', '게', '마음', '그대에게', '게', '표현', '수', '인사', '마음', '그대에게', '마음', '이유', '사랑', '이유', '행복', '날', '날', '곁', '수', '소식', '편지', '그리움', '내', '게로', '때', '손', '이유', '사랑', '이유', '행복', '날', '날', '곁', '수', '번', '계절', '달', '시간', '숨', '사랑', '이유', '사랑', '순간', '행복', '날', '날', '곁', '수', '추억', '남지']
=====Kkma=====
['당신', '나', '마음', '그대', '표현', '수', '인사', '내', '이유', '사랑', '행복', '날', '곁', '소식', '대', '여기', '편지', '그리움', '때', '손', '번', '계절', '달', '시간', '너와', '숨', '우리', '순간', '주기', '추억']
=====Okt=====
['당신', '드릴', '게', '나', '마음', '그대', '게', '표현', '수가', '인사', '내', '마음', '고이', '그대', '내', '마음', '조금', '요', '이유', '사랑', '이유', '준', '당신', '부디', '날', '날', '모두', '그대', '곁', '내', '수', '소식', '더', '애', '그대', '여기', '편지', '그리움', '고이', '그대', '내게로', '때', '그', '손', '이유', '사랑', '이유', '준', '당신', '부디', '날', '날', '모두', '그대', '곁', '내', '수', '네', '번의', '모든', '계절', '달', '시간', '너', '숨', '매일', '사랑', '이유', '우리', '사랑', '지금', '이', '순간', '매일', '주기', '부디', '날', '날', '모두', '그대', '곁', '내', '수', '부디', '추억', '남지', '너완']
=====Mecab=====
['당신', '게', '나', '마음', '그대', '게', '표현', '수', '인사', '마음', '그대', '내', '마음', '이유', '사랑', '이유', '내게', '당신', '행복', '날', '날', '그대', '곁', '내', '수', '소식', '그대', '여기', '게요', '편지', '그리움', '그대', '내게로', '때', '손', '이유', '사랑', '이유', '내게', '당신', '행복', '날', '날', '그대', '곁', '내', '수', '번', '계절', '열', '달', '시간', '너', '숨', '사랑', '게', '이유', '우리', '사랑', '지금', '순간', '행복', '날', '날', '그대', '곁', '내', '수', '추억', '너']

다음으로 morphs() 메소드를 활용하여 텍스트 데이터로부터 형태소를 추출합니다.

# 형태소 추출
print('=====원문=====')
print(text)
print('=====Komoran=====')
print(komoran.morphs(text))
print('=====Kkma=====')
print(kkma.morphs(text))
print('=====Okt=====')
print(okt.morphs(text))
print('=====Mecab=====')
print(mecab.morphs(text))
=====원문=====
당신에게 드릴 게 없어서 나의 마음을 드려요 그대에게 받은 게 많아서 표현을 다 할 수가 없어요 나지막한 인사에 수많은 내 마음 고이 담아 그대에게로 건네면 내 마음 조금 알까요 어떤 이유로 만나 나와 사랑을 하고 어떤 이유로 내게 와 함께 있어준 당신 부디 행복한 날도 살다 지치는 날도 모두 그대의 곁에 내가 있어줄 수 있길 어떤 소식 보다 더 애타게 기다려지는 그대 엇갈리지 않게 여기 기다릴게요 눌러 적은 편지에 수많은 그리움 고이 담아 그대 내게로 올 때면 그 손에 쥐어줄게요 어떤 이유로 만나 나와 사랑을 하고 어떤 이유로 내게 와 함께 있어준 당신 부디 행복한 날도 살다 지치는 날도 모두 그대의 곁에 내가 있어줄 수 있길 네 번의 모든 계절들과 열두 달의 시간을 너와 숨이 차게 매일 사랑하며 함께 할게 어떤 이유로 만나 우리 사랑을 했던 지금 이 순간처럼 매일 바라보며 애써주기를 부디 행복한 날도 살다 지치는 날도 모두 그대의 곁에 내가 있어줄 수 있길 부디 추억만 남지 않길 너완
=====Komoran=====
['당신', '에게', '드릴', '게', '없', '어서', '나', '의', '마음', '을', '드리', '어요', '그대에게', '받', '은', '게', '많', '아서', '표현', '을', '다', '하', 'ㄹ', '수', '가', '없', '어요', '나지막', '하', 'ㄴ', '인사', '에', '수많', '은', '내', '마음', '고이', '담', '아', '그대에게', '로', '건네', '면', '내', '마음', '조금', '알', 'ㄹ까요', '어떤', '이유', '로', '만나', '아', '나오', '아', '사랑', '을', '하', '고', '어떤', '이유', '로', '내', '게', '오', '아', '함께', '있', '어', '주', 'ㄴ', '당신', '부디', '행복', '하', 'ㄴ', '날', '도', '살', '다', '지치', '는', '날', '도', '모두', '그대', '의', '곁', '에', '내', '가', '있', '어', '주', 'ㄹ', '수', '있', '기', 'ㄹ', '어떤', '소식', '보다', '더', '애타', '게', '기다리', '어', '지', '는', '그대', '엇갈리', '지', '않', '게', '여기', '기다리', 'ㄹ게요', '누르', '어', '적', '은', '편지', '에', '수많', '은', '그리움', '고이', '담', '아', '그대', '내', '게로', '올', '때', '이', '면', '그', '손', '에', '쥐', '어', '주', 'ㄹ게요', '어떤', '이유', '로', '만나', '아', '나오', '아', '사랑', '을', '하', '고', '어떤', '이유', '로', '내', '게', '오', '아', '함께', '있', '어', '주', 'ㄴ', '당신', '부디', '행복', '하', 'ㄴ', '날', '도', '살', '다', '지치', '는', '날', '도', '모두', '그대', '의', '곁', '에', '내', '가', '있', '어', '주', 'ㄹ', '수', '있', '기', 'ㄹ', '네', '번', '의', '모든', '계절', '들', '과', '열두', '달', '의', '시간', '을', '너', '와', '숨', '이', '차', '게', '매일', '사랑', '하', '며', '함께', '하', 'ㄹ게', '어떤', '이유', '로', '만나', '아', '우리', '사랑', '을', '하', '았', '던', '지금', '이', '순간', '처럼', '매일', '바라보', '며', '애쓰', '어', '주', '기', '를', '부디', '행복', '하', 'ㄴ', '날', '도', '살', '다', '지치', '는', '날', '도', '모두', '그대', '의', '곁', '에', '내', '가', '있', '어', '주', 'ㄹ', '수', '있', '기', 'ㄹ', '부디', '추억', '만', '남지', '않', '기', 'ㄹ', '너', '와', 'ㄴ']
=====Kkma=====
['당신', '에게', '드리', 'ㄹ', '것', '이', '없', '어서', '나', '의', '마음', '을', '드', '려요', '그대', '에게', '받으', 'ㄴ', '것', '이', '많', '아서', '표현', '을', '다', '하', 'ㄹ', '수', '가', '없', '어요', '나지막', '하', 'ㄴ', '인사', '에', '수많', '은', '내', '마음', '고이', '담', '아', '그대', '에게', '로', '건네', '면', '내', '마음', '조금', '알', 'ㄹ까요', '어떤', '이유', '로', '만', '나', '나오', '아', '사랑', '을', '하', '고', '어떤', '이유', '로', '내', '게', '오', '아', '함께', '있', '어', '주', 'ㄴ', '당신', '부디', '행복', '하', 'ㄴ', '날', '도', '살', '다', '지치', '는', '날', '도', '모두', '그대', '의', '곁', '에', '나', '가', '있', '어', '주', 'ㄹ', '수', '있', '기', '를', '어떻', 'ㄴ', '소식', '보다', '더', '애타', '게', '기다리', '어', '지', '는', '그', '대', '엇갈리', '지', '않', '게', '여기', '기다리', 'ㄹ게요', '눌', '러', '적', '은', '편지', '에', '수많', '은', '그리움', '고이', '담', '아', '그대', '내', '게', '로', '오', 'ㄹ', '때', '이', '면', '그', '손', '에', '쥐', '어', '주', 'ㄹ게요', '어떤', '이유', '로', '만', '나', '나오', '아', '사랑', '을', '하', '고', '어떤', '이유', '로', '내', '게', '오', '아', '함께', '있', '어', '주', 'ㄴ', '당신', '부디', '행복', '하', 'ㄴ', '날', '도', '살', '다', '지치', '는', '날', '도', '모두', '그대', '의', '곁', '에', '나', '가', '있', '어', '주', 'ㄹ', '수', '있', '기', '를', '네', '번', '의', '모든', '계절', '들', '과', '열', 'ㄹ', '두', '달', '의', '시간', '을', '너와', '숨', '이', '차', '게', '매일', '사랑', '하', '며', '함께', '하', 'ㄹ', '것', '이', '어떤', '이유', '로', '만', '나', '우리', '사랑', '을', '하', '었', '던', '지금', '이', '순간', '처럼', '매일', '바라보', '며', '애써', '주기', '를', '부디', '행복', '하', 'ㄴ', '날', '도', '살', '다', '지치', '는', '날', '도', '모두', '그대', '의', '곁', '에', '나', '가', '있', '어', '주', 'ㄹ', '수', '있', '기', '를', '부디', '추억', '만', '남', '지', '않', '기', '를', '느', '어', '와', 'ㄴ']
=====Okt=====
['당신', '에게', '드릴', '게', '없어서', '나', '의', '마음', '을', '드려요', '그대', '에게', '받은', '게', '많아서', '표현', '을', '다', '할', '수가', '없어요', '나지막한', '인사', '에', '수많은', '내', '마음', '고이', '담아', '그대', '에게로', '건네면', '내', '마음', '조금', '알까', '요', '어떤', '이유', '로', '만나', '나와', '사랑', '을', '하고', '어떤', '이유', '로', '내게', '와', '함께', '있어', '준', '당신', '부디', '행복한', '날', '도', '살다', '지치는', '날', '도', '모두', '그대', '의', '곁', '에', '내', '가', '있어줄', '수', '있길', '어떤', '소식', '보다', '더', '애', '타게', '기다려지는', '그대', '엇갈리지', '않게', '여기', '기다릴게요', '눌러', '적은', '편지', '에', '수많은', '그리움', '고이', '담아', '그대', '내게로', '올', '때', '면', '그', '손', '에', '쥐어줄게요', '어떤', '이유', '로', '만나', '나와', '사랑', '을', '하고', '어떤', '이유', '로', '내게', '와', '함께', '있어', '준', '당신', '부디', '행복한', '날', '도', '살다', '지치는', '날', '도', '모두', '그대', '의', '곁', '에', '내', '가', '있어줄', '수', '있길', '네', '번의', '모든', '계절', '들', '과', '열두', '달', '의', '시간', '을', '너', '와', '숨', '이', '차게', '매일', '사랑', '하며', '함께', '할게', '어떤', '이유', '로', '만나', '우리', '사랑', '을', '했던', '지금', '이', '순간', '처럼', '매일', '바라보며', '애써', '주기', '를', '부디', '행복한', '날', '도', '살다', '지치는', '날', '도', '모두', '그대', '의', '곁', '에', '내', '가', '있어줄', '수', '있길', '부디', '추억', '만', '남지', '않길', '너완']
=====Mecab=====
['당신', '에게', '드릴', '게', '없', '어서', '나', '의', '마음', '을', '드려요', '그대', '에게', '받', '은', '게', '많', '아서', '표현', '을', '다', '할', '수', '가', '없', '어요', '나지막', '한', '인사', '에', '수많', '은', '내', '마음', '고이', '담', '아', '그대', '에게', '로', '건네', '면', '내', '마음', '조금', '알', '까요', '어떤', '이유', '로', '만나', '나와', '사랑', '을', '하', '고', '어떤', '이유', '로', '내게', '와', '함께', '있', '어', '준', '당신', '부디', '행복', '한', '날', '도', '살', '다', '지치', '는', '날', '도', '모두', '그대', '의', '곁', '에', '내', '가', '있', '어', '줄', '수', '있', '길', '어떤', '소식', '보다', '더', '애타', '게', '기다려', '지', '는', '그대', '엇갈리', '지', '않', '게', '여기', '기다릴', '게요', '눌러', '적', '은', '편지', '에', '수많', '은', '그리움', '고이', '담', '아', '그대', '내게로', '올', '때', '면', '그', '손', '에', '쥐', '어', '줄게요', '어떤', '이유', '로', '만나', '나와', '사랑', '을', '하', '고', '어떤', '이유', '로', '내게', '와', '함께', '있', '어', '준', '당신', '부디', '행복', '한', '날', '도', '살', '다', '지치', '는', '날', '도', '모두', '그대', '의', '곁', '에', '내', '가', '있', '어', '줄', '수', '있', '길', '네', '번', '의', '모든', '계절', '들', '과', '열', '두', '달', '의', '시간', '을', '너', '와', '숨', '이', '차', '게', '매일', '사랑', '하', '며', '함께', '할', '게', '어떤', '이유', '로', '만나', '우리', '사랑', '을', '했', '던', '지금', '이', '순간', '처럼', '매일', '바라보', '며', '애써', '주', '기', '를', '부디', '행복', '한', '날', '도', '살', '다', '지치', '는', '날', '도', '모두', '그대', '의', '곁', '에', '내', '가', '있', '어', '줄', '수', '있', '길', '부디', '추억', '만', '남', '지', '않', '길', '너', '완']

마지막으로 pos() 메소드를 활용하여 텍스트 데이터로부터 형태소와 품사 태그를 추출합니다.

# 형태소 & 품사 추출
print('=====원문=====')
print(text)
print('=====Komoran=====')
print(komoran.pos(text))
print('=====Kkma=====')
print(kkma.pos(text))
print('=====Okt=====')
print(okt.pos(text))
print('=====Mecab=====')
print(mecab.pos(text))
=====원문=====
당신에게 드릴 게 없어서 나의 마음을 드려요 그대에게 받은 게 많아서 표현을 다 할 수가 없어요 나지막한 인사에 수많은 내 마음 고이 담아 그대에게로 건네면 내 마음 조금 알까요 어떤 이유로 만나 나와 사랑을 하고 어떤 이유로 내게 와 함께 있어준 당신 부디 행복한 날도 살다 지치는 날도 모두 그대의 곁에 내가 있어줄 수 있길 어떤 소식 보다 더 애타게 기다려지는 그대 엇갈리지 않게 여기 기다릴게요 눌러 적은 편지에 수많은 그리움 고이 담아 그대 내게로 올 때면 그 손에 쥐어줄게요 어떤 이유로 만나 나와 사랑을 하고 어떤 이유로 내게 와 함께 있어준 당신 부디 행복한 날도 살다 지치는 날도 모두 그대의 곁에 내가 있어줄 수 있길 네 번의 모든 계절들과 열두 달의 시간을 너와 숨이 차게 매일 사랑하며 함께 할게 어떤 이유로 만나 우리 사랑을 했던 지금 이 순간처럼 매일 바라보며 애써주기를 부디 행복한 날도 살다 지치는 날도 모두 그대의 곁에 내가 있어줄 수 있길 부디 추억만 남지 않길 너완
=====Komoran=====
[('당신', 'NP'), ('에게', 'JKB'), ('드릴', 'NNP'), ('게', 'NNG'), ('없', 'VA'), ('어서', 'EC'), ('나', 'NP'), ('의', 'JKG'), ('마음', 'NNG'), ('을', 'JKO'), ('드리', 'VV'), ('어요', 'EC'), ('그대에게', 'NNP'), ('받', 'VV'), ('은', 'ETM'), ('게', 'NNG'), ('많', 'VA'), ('아서', 'EC'), ('표현', 'NNG'), ('을', 'JKO'), ('다', 'MAG'), ('하', 'VV'), ('ㄹ', 'ETM'), ('수', 'NNB'), ('가', 'JKS'), ('없', 'VA'), ('어요', 'EC'), ('나지막', 'XR'), ('하', 'XSA'), ('ㄴ', 'ETM'), ('인사', 'NNG'), ('에', 'JKB'), ('수많', 'VA'), ('은', 'ETM'), ('내', 'NP'), ('마음', 'NNG'), ('고이', 'MAG'), ('담', 'VV'), ('아', 'EC'), ('그대에게', 'NNP'), ('로', 'JKB'), ('건네', 'VV'), ('면', 'EC'), ('내', 'NP'), ('마음', 'NNG'), ('조금', 'MAG'), ('알', 'VV'), ('ㄹ까요', 'EC'), ('어떤', 'MM'), ('이유', 'NNG'), ('로', 'JKB'), ('만나', 'VV'), ('아', 'EC'), ('나오', 'VV'), ('아', 'EC'), ('사랑', 'NNG'), ('을', 'JKO'), ('하', 'VV'), ('고', 'EC'), ('어떤', 'MM'), ('이유', 'NNG'), ('로', 'JKB'), ('내', 'VV'), ('게', 'EC'), ('오', 'VV'), ('아', 'EC'), ('함께', 'MAG'), ('있', 'VV'), ('어', 'EC'), ('주', 'VX'), ('ㄴ', 'ETM'), ('당신', 'NP'), ('부디', 'MAG'), ('행복', 'NNG'), ('하', 'XSV'), ('ㄴ', 'ETM'), ('날', 'NNG'), ('도', 'JX'), ('살', 'VV'), ('다', 'EC'), ('지치', 'VV'), ('는', 'ETM'), ('날', 'NNG'), ('도', 'JX'), ('모두', 'MAG'), ('그대', 'NP'), ('의', 'JKG'), ('곁', 'NNG'), ('에', 'JKB'), ('내', 'NP'), ('가', 'JKS'), ('있', 'VV'), ('어', 'EC'), ('주', 'VX'), ('ㄹ', 'ETM'), ('수', 'NNB'), ('있', 'VV'), ('기', 'ETN'), ('ㄹ', 'JKO'), ('어떤', 'MM'), ('소식', 'NNG'), ('보다', 'MAG'), ('더', 'MAG'), ('애타', 'VV'), ('게', 'EC'), ('기다리', 'VV'), ('어', 'EC'), ('지', 'VX'), ('는', 'ETM'), ('그대', 'NP'), ('엇갈리', 'VV'), ('지', 'EC'), ('않', 'VX'), ('게', 'EC'), ('여기', 'NP'), ('기다리', 'VV'), ('ㄹ게요', 'EC'), ('누르', 'VV'), ('어', 'EC'), ('적', 'VA'), ('은', 'ETM'), ('편지', 'NNG'), ('에', 'JKB'), ('수많', 'VA'), ('은', 'ETM'), ('그리움', 'NNG'), ('고이', 'MAG'), ('담', 'VV'), ('아', 'EC'), ('그대', 'NP'), ('내', 'NNB'), ('게로', 'NNP'), ('올', 'MM'), ('때', 'NNG'), ('이', 'VCP'), ('면', 'EC'), ('그', 'MM'), ('손', 'NNG'), ('에', 'JKB'), ('쥐', 'VV'), ('어', 'EC'), ('주', 'VX'), ('ㄹ게요', 'EC'), ('어떤', 'MM'), ('이유', 'NNG'), ('로', 'JKB'), ('만나', 'VV'), ('아', 'EC'), ('나오', 'VV'), ('아', 'EC'), ('사랑', 'NNG'), ('을', 'JKO'), ('하', 'VV'), ('고', 'EC'), ('어떤', 'MM'), ('이유', 'NNG'), ('로', 'JKB'), ('내', 'VV'), ('게', 'EC'), ('오', 'VV'), ('아', 'EC'), ('함께', 'MAG'), ('있', 'VV'), ('어', 'EC'), ('주', 'VX'), ('ㄴ', 'ETM'), ('당신', 'NP'), ('부디', 'MAG'), ('행복', 'NNG'), ('하', 'XSV'), ('ㄴ', 'ETM'), ('날', 'NNG'), ('도', 'JX'), ('살', 'VV'), ('다', 'EC'), ('지치', 'VV'), ('는', 'ETM'), ('날', 'NNG'), ('도', 'JX'), ('모두', 'MAG'), ('그대', 'NP'), ('의', 'JKG'), ('곁', 'NNG'), ('에', 'JKB'), ('내', 'NP'), ('가', 'JKS'), ('있', 'VV'), ('어', 'EC'), ('주', 'VX'), ('ㄹ', 'ETM'), ('수', 'NNB'), ('있', 'VV'), ('기', 'ETN'), ('ㄹ', 'JKO'), ('네', 'MM'), ('번', 'NNB'), ('의', 'JKG'), ('모든', 'MM'), ('계절', 'NNG'), ('들', 'XSN'), ('과', 'JC'), ('열두', 'NR'), ('달', 'NNG'), ('의', 'JKG'), ('시간', 'NNG'), ('을', 'JKO'), ('너', 'NP'), ('와', 'JKB'), ('숨', 'NNG'), ('이', 'JKS'), ('차', 'VV'), ('게', 'EC'), ('매일', 'MAG'), ('사랑', 'NNG'), ('하', 'XSV'), ('며', 'EC'), ('함께', 'MAG'), ('하', 'VV'), ('ㄹ게', 'EC'), ('어떤', 'MM'), ('이유', 'NNG'), ('로', 'JKB'), ('만나', 'VV'), ('아', 'EC'), ('우리', 'NP'), ('사랑', 'NNG'), ('을', 'JKO'), ('하', 'VV'), ('았', 'EP'), ('던', 'ETM'), ('지금', 'MAG'), ('이', 'MM'), ('순간', 'NNG'), ('처럼', 'JKB'), ('매일', 'MAG'), ('바라보', 'VV'), ('며', 'EC'), ('애쓰', 'VV'), ('어', 'EC'), ('주', 'VX'), ('기', 'ETN'), ('를', 'JKO'), ('부디', 'MAG'), ('행복', 'NNG'), ('하', 'XSV'), ('ㄴ', 'ETM'), ('날', 'NNG'), ('도', 'JX'), ('살', 'VV'), ('다', 'EC'), ('지치', 'VV'), ('는', 'ETM'), ('날', 'NNG'), ('도', 'JX'), ('모두', 'MAG'), ('그대', 'NP'), ('의', 'JKG'), ('곁', 'NNG'), ('에', 'JKB'), ('내', 'NP'), ('가', 'JKS'), ('있', 'VV'), ('어', 'EC'), ('주', 'VX'), ('ㄹ', 'ETM'), ('수', 'NNB'), ('있', 'VV'), ('기', 'ETN'), ('ㄹ', 'JKO'), ('부디', 'MAG'), ('추억', 'NNP'), ('만', 'JX'), ('남지', 'NNP'), ('않', 'VX'), ('기', 'ETN'), ('ㄹ', 'JKO'), ('너', 'NP'), ('와', 'JKB'), ('ㄴ', 'JX')]
=====Kkma=====
[('당신', 'NP'), ('에게', 'JKM'), ('드리', 'VV'), ('ㄹ', 'ETD'), ('것', 'NNB'), ('이', 'JKS'), ('없', 'VA'), ('어서', 'ECD'), ('나', 'NP'), ('의', 'JKG'), ('마음', 'NNG'), ('을', 'JKO'), ('드', 'VV'), ('려요', 'ECD'), ('그대', 'NP'), ('에게', 'JKM'), ('받으', 'VV'), ('ㄴ', 'ETD'), ('것', 'NNB'), ('이', 'JKS'), ('많', 'VA'), ('아서', 'ECD'), ('표현', 'NNG'), ('을', 'JKO'), ('다', 'MAG'), ('하', 'VV'), ('ㄹ', 'ETD'), ('수', 'NNB'), ('가', 'JKS'), ('없', 'VA'), ('어요', 'EFN'), ('나지막', 'XR'), ('하', 'XSA'), ('ㄴ', 'ETD'), ('인사', 'NNG'), ('에', 'JKM'), ('수많', 'VA'), ('은', 'ETD'), ('내', 'NP'), ('마음', 'NNG'), ('고이', 'MAG'), ('담', 'VV'), ('아', 'ECD'), ('그대', 'NP'), ('에게', 'JKM'), ('로', 'JKM'), ('건네', 'VV'), ('면', 'ECE'), ('내', 'NP'), ('마음', 'NNG'), ('조금', 'MAG'), ('알', 'VV'), ('ㄹ까요', 'ECD'), ('어떤', 'MDT'), ('이유', 'NNG'), ('로', 'JKM'), ('만', 'JX'), ('나', 'NP'), ('나오', 'VV'), ('아', 'ECS'), ('사랑', 'NNG'), ('을', 'JKO'), ('하', 'VV'), ('고', 'ECE'), ('어떤', 'MDT'), ('이유', 'NNG'), ('로', 'JKM'), ('내', 'VV'), ('게', 'ECD'), ('오', 'VV'), ('아', 'ECS'), ('함께', 'MAG'), ('있', 'VV'), ('어', 'ECD'), ('주', 'VXV'), ('ㄴ', 'ETD'), ('당신', 'NP'), ('부디', 'MAG'), ('행복', 'NNG'), ('하', 'XSV'), ('ㄴ', 'ETD'), ('날', 'NNG'), ('도', 'JX'), ('살', 'VV'), ('다', 'ECS'), ('지치', 'VV'), ('는', 'ETD'), ('날', 'NNG'), ('도', 'JX'), ('모두', 'MAG'), ('그대', 'NP'), ('의', 'JKG'), ('곁', 'NNG'), ('에', 'JKM'), ('나', 'NP'), ('가', 'JKS'), ('있', 'VV'), ('어', 'ECD'), ('주', 'VXV'), ('ㄹ', 'ETD'), ('수', 'NNB'), ('있', 'VV'), ('기', 'ETN'), ('를', 'JKO'), ('어떻', 'VA'), ('ㄴ', 'ETD'), ('소식', 'NNG'), ('보다', 'JKM'), ('더', 'MAG'), ('애타', 'VV'), ('게', 'ECD'), ('기다리', 'VV'), ('어', 'ECS'), ('지', 'VXV'), ('는', 'ETD'), ('그', 'MDT'), ('대', 'NNG'), ('엇갈리', 'VV'), ('지', 'ECD'), ('않', 'VXV'), ('게', 'ECD'), ('여기', 'NP'), ('기다리', 'VV'), ('ㄹ게요', 'EFN'), ('눌', 'VV'), ('러', 'ECD'), ('적', 'VA'), ('은', 'ETD'), ('편지', 'NNG'), ('에', 'JKM'), ('수많', 'VA'), ('은', 'ETD'), ('그리움', 'NNG'), ('고이', 'MAG'), ('담', 'VV'), ('아', 'ECD'), ('그대', 'NP'), ('내', 'VV'), ('게', 'ECS'), ('로', 'JKM'), ('오', 'VV'), ('ㄹ', 'ETD'), ('때', 'NNG'), ('이', 'VCP'), ('면', 'ECE'), ('그', 'MDT'), ('손', 'NNG'), ('에', 'JKM'), ('쥐', 'VV'), ('어', 'ECD'), ('주', 'VXV'), ('ㄹ게요', 'EFN'), ('어떤', 'MDT'), ('이유', 'NNG'), ('로', 'JKM'), ('만', 'JX'), ('나', 'NP'), ('나오', 'VV'), ('아', 'ECS'), ('사랑', 'NNG'), ('을', 'JKO'), ('하', 'VV'), ('고', 'ECE'), ('어떤', 'MDT'), ('이유', 'NNG'), ('로', 'JKM'), ('내', 'VV'), ('게', 'ECD'), ('오', 'VV'), ('아', 'ECS'), ('함께', 'MAG'), ('있', 'VV'), ('어', 'ECD'), ('주', 'VXV'), ('ㄴ', 'ETD'), ('당신', 'NP'), ('부디', 'MAG'), ('행복', 'NNG'), ('하', 'XSV'), ('ㄴ', 'ETD'), ('날', 'NNG'), ('도', 'JX'), ('살', 'VV'), ('다', 'ECS'), ('지치', 'VV'), ('는', 'ETD'), ('날', 'NNG'), ('도', 'JX'), ('모두', 'MAG'), ('그대', 'NP'), ('의', 'JKG'), ('곁', 'NNG'), ('에', 'JKM'), ('나', 'NP'), ('가', 'JKS'), ('있', 'VV'), ('어', 'ECD'), ('주', 'VXV'), ('ㄹ', 'ETD'), ('수', 'NNB'), ('있', 'VV'), ('기', 'ETN'), ('를', 'JKO'), ('네', 'MDN'), ('번', 'NNB'), ('의', 'JKG'), ('모든', 'MDT'), ('계절', 'NNG'), ('들', 'XSN'), ('과', 'JKO'), ('열', 'VV'), ('ㄹ', 'ETD'), ('두', 'MDN'), ('달', 'NNG'), ('의', 'JKG'), ('시간', 'NNG'), ('을', 'JKO'), ('너와', 'NNG'), ('숨', 'NNG'), ('이', 'JKS'), ('차', 'VV'), ('게', 'ECD'), ('매일', 'MAG'), ('사랑', 'NNG'), ('하', 'XSV'), ('며', 'ECE'), ('함께', 'MAG'), ('하', 'VV'), ('ㄹ', 'ETD'), ('것', 'NNB'), ('이', 'JKS'), ('어떤', 'MDT'), ('이유', 'NNG'), ('로', 'JKM'), ('만', 'JX'), ('나', 'NP'), ('우리', 'NP'), ('사랑', 'NNG'), ('을', 'JKO'), ('하', 'VV'), ('었', 'EPT'), ('던', 'EFQ'), ('지금', 'MAG'), ('이', 'MDT'), ('순간', 'NNG'), ('처럼', 'JKM'), ('매일', 'MAG'), ('바라보', 'VV'), ('며', 'ECE'), ('애써', 'MAG'), ('주기', 'NNG'), ('를', 'JKO'), ('부디', 'MAG'), ('행복', 'NNG'), ('하', 'XSV'), ('ㄴ', 'ETD'), ('날', 'NNG'), ('도', 'JX'), ('살', 'VV'), ('다', 'ECS'), ('지치', 'VV'), ('는', 'ETD'), ('날', 'NNG'), ('도', 'JX'), ('모두', 'MAG'), ('그대', 'NP'), ('의', 'JKG'), ('곁', 'NNG'), ('에', 'JKM'), ('나', 'NP'), ('가', 'JKS'), ('있', 'VV'), ('어', 'ECD'), ('주', 'VXV'), ('ㄹ', 'ETD'), ('수', 'NNB'), ('있', 'VV'), ('기', 'ETN'), ('를', 'JKO'), ('부디', 'MAG'), ('추억', 'NNG'), ('만', 'JX'), ('남', 'VV'), ('지', 'ECD'), ('않', 'VXV'), ('기', 'ETN'), ('를', 'JKO'), ('느', 'VV'), ('어', 'ECS'), ('와', 'VV'), ('ㄴ', 'ETD')]
=====Okt=====
[('당신', 'Noun'), ('에게', 'Josa'), ('드릴', 'Noun'), ('게', 'Noun'), ('없어서', 'Adjective'), ('나', 'Noun'), ('의', 'Josa'), ('마음', 'Noun'), ('을', 'Josa'), ('드려요', 'Verb'), ('그대', 'Noun'), ('에게', 'Josa'), ('받은', 'Verb'), ('게', 'Noun'), ('많아서', 'Adjective'), ('표현', 'Noun'), ('을', 'Josa'), ('다', 'Adverb'), ('할', 'Verb'), ('수가', 'Noun'), ('없어요', 'Adjective'), ('나지막한', 'Adjective'), ('인사', 'Noun'), ('에', 'Josa'), ('수많은', 'Adjective'), ('내', 'Noun'), ('마음', 'Noun'), ('고이', 'Noun'), ('담아', 'Verb'), ('그대', 'Noun'), ('에게로', 'Josa'), ('건네면', 'Verb'), ('내', 'Noun'), ('마음', 'Noun'), ('조금', 'Noun'), ('알까', 'Verb'), ('요', 'Noun'), ('어떤', 'Adjective'), ('이유', 'Noun'), ('로', 'Josa'), ('만나', 'Verb'), ('나와', 'Verb'), ('사랑', 'Noun'), ('을', 'Josa'), ('하고', 'Verb'), ('어떤', 'Adjective'), ('이유', 'Noun'), ('로', 'Josa'), ('내게', 'Verb'), ('와', 'Verb'), ('함께', 'Adverb'), ('있어', 'Adjective'), ('준', 'Noun'), ('당신', 'Noun'), ('부디', 'Noun'), ('행복한', 'Adjective'), ('날', 'Noun'), ('도', 'Josa'), ('살다', 'Verb'), ('지치는', 'Verb'), ('날', 'Noun'), ('도', 'Josa'), ('모두', 'Noun'), ('그대', 'Noun'), ('의', 'Josa'), ('곁', 'Noun'), ('에', 'Josa'), ('내', 'Noun'), ('가', 'Josa'), ('있어줄', 'Adjective'), ('수', 'Noun'), ('있길', 'Adjective'), ('어떤', 'Adjective'), ('소식', 'Noun'), ('보다', 'Verb'), ('더', 'Noun'), ('애', 'Noun'), ('타게', 'Verb'), ('기다려지는', 'Verb'), ('그대', 'Noun'), ('엇갈리지', 'Verb'), ('않게', 'Verb'), ('여기', 'Noun'), ('기다릴게요', 'Verb'), ('눌러', 'Verb'), ('적은', 'Verb'), ('편지', 'Noun'), ('에', 'Josa'), ('수많은', 'Adjective'), ('그리움', 'Noun'), ('고이', 'Noun'), ('담아', 'Verb'), ('그대', 'Noun'), ('내게로', 'Noun'), ('올', 'Verb'), ('때', 'Noun'), ('면', 'Josa'), ('그', 'Noun'), ('손', 'Noun'), ('에', 'Josa'), ('쥐어줄게요', 'Verb'), ('어떤', 'Adjective'), ('이유', 'Noun'), ('로', 'Josa'), ('만나', 'Verb'), ('나와', 'Verb'), ('사랑', 'Noun'), ('을', 'Josa'), ('하고', 'Verb'), ('어떤', 'Adjective'), ('이유', 'Noun'), ('로', 'Josa'), ('내게', 'Verb'), ('와', 'Verb'), ('함께', 'Adverb'), ('있어', 'Adjective'), ('준', 'Noun'), ('당신', 'Noun'), ('부디', 'Noun'), ('행복한', 'Adjective'), ('날', 'Noun'), ('도', 'Josa'), ('살다', 'Verb'), ('지치는', 'Verb'), ('날', 'Noun'), ('도', 'Josa'), ('모두', 'Noun'), ('그대', 'Noun'), ('의', 'Josa'), ('곁', 'Noun'), ('에', 'Josa'), ('내', 'Noun'), ('가', 'Josa'), ('있어줄', 'Adjective'), ('수', 'Noun'), ('있길', 'Adjective'), ('네', 'Noun'), ('번의', 'Noun'), ('모든', 'Noun'), ('계절', 'Noun'), ('들', 'Suffix'), ('과', 'Josa'), ('열두', 'Modifier'), ('달', 'Noun'), ('의', 'Josa'), ('시간', 'Noun'), ('을', 'Josa'), ('너', 'Noun'), ('와', 'Josa'), ('숨', 'Noun'), ('이', 'Josa'), ('차게', 'Verb'), ('매일', 'Noun'), ('사랑', 'Noun'), ('하며', 'Verb'), ('함께', 'Adverb'), ('할게', 'Verb'), ('어떤', 'Adjective'), ('이유', 'Noun'), ('로', 'Josa'), ('만나', 'Verb'), ('우리', 'Noun'), ('사랑', 'Noun'), ('을', 'Josa'), ('했던', 'Verb'), ('지금', 'Noun'), ('이', 'Noun'), ('순간', 'Noun'), ('처럼', 'Josa'), ('매일', 'Noun'), ('바라보며', 'Verb'), ('애써', 'Verb'), ('주기', 'Noun'), ('를', 'Josa'), ('부디', 'Noun'), ('행복한', 'Adjective'), ('날', 'Noun'), ('도', 'Josa'), ('살다', 'Verb'), ('지치는', 'Verb'), ('날', 'Noun'), ('도', 'Josa'), ('모두', 'Noun'), ('그대', 'Noun'), ('의', 'Josa'), ('곁', 'Noun'), ('에', 'Josa'), ('내', 'Noun'), ('가', 'Josa'), ('있어줄', 'Adjective'), ('수', 'Noun'), ('있길', 'Adjective'), ('부디', 'Noun'), ('추억', 'Noun'), ('만', 'Josa'), ('남지', 'Noun'), ('않길', 'Verb'), ('너완', 'Noun')]
=====Mecab=====
[('당신', 'NP'), ('에게', 'JKB'), ('드릴', 'VV+ETM'), ('게', 'NNB+JKS'), ('없', 'VA'), ('어서', 'EC'), ('나', 'NP'), ('의', 'JKG'), ('마음', 'NNG'), ('을', 'JKO'), ('드려요', 'VV+EC'), ('그대', 'NP'), ('에게', 'JKB'), ('받', 'VV'), ('은', 'ETM'), ('게', 'NNB+JKS'), ('많', 'VA'), ('아서', 'EC'), ('표현', 'NNG'), ('을', 'JKO'), ('다', 'MAG'), ('할', 'VV+ETM'), ('수', 'NNB'), ('가', 'JKS'), ('없', 'VA'), ('어요', 'EF'), ('나지막', 'XR'), ('한', 'XSA+ETM'), ('인사', 'NNG'), ('에', 'JKB'), ('수많', 'VA'), ('은', 'ETM'), ('내', 'MM'), ('마음', 'NNG'), ('고이', 'MAG'), ('담', 'VV'), ('아', 'EC'), ('그대', 'NP'), ('에게', 'JKB'), ('로', 'JKB'), ('건네', 'VV'), ('면', 'EC'), ('내', 'NP+JKG'), ('마음', 'NNG'), ('조금', 'MAG'), ('알', 'VV'), ('까요', 'EF'), ('어떤', 'MM'), ('이유', 'NNG'), ('로', 'JKB'), ('만나', 'VV+EC'), ('나와', 'VV+EC'), ('사랑', 'NNG'), ('을', 'JKO'), ('하', 'VV'), ('고', 'EC'), ('어떤', 'MM'), ('이유', 'NNG'), ('로', 'JKB'), ('내게', 'NP+JKB'), ('와', 'JKB'), ('함께', 'MAG'), ('있', 'VV'), ('어', 'EC'), ('준', 'VX+ETM'), ('당신', 'NP'), ('부디', 'MAG'), ('행복', 'NNG'), ('한', 'XSA+ETM'), ('날', 'NNG'), ('도', 'JX'), ('살', 'VV'), ('다', 'EC'), ('지치', 'VV'), ('는', 'ETM'), ('날', 'NNG'), ('도', 'JX'), ('모두', 'MAG'), ('그대', 'NP'), ('의', 'JKG'), ('곁', 'NNG'), ('에', 'JKB'), ('내', 'NP'), ('가', 'JKS'), ('있', 'VA'), ('어', 'EC'), ('줄', 'VX+ETM'), ('수', 'NNB'), ('있', 'VV'), ('길', 'ETN+JKO'), ('어떤', 'MM'), ('소식', 'NNG'), ('보다', 'JKB'), ('더', 'MAG'), ('애타', 'VV'), ('게', 'EC'), ('기다려', 'VV+EC'), ('지', 'VX'), ('는', 'ETM'), ('그대', 'NP'), ('엇갈리', 'VV'), ('지', 'EC'), ('않', 'VX'), ('게', 'EC'), ('여기', 'NP'), ('기다릴', 'VV+ETM'), ('게요', 'NNB+VCP+EC'), ('눌러', 'VV+EC'), ('적', 'VA'), ('은', 'ETM'), ('편지', 'NNG'), ('에', 'JKB'), ('수많', 'VA'), ('은', 'ETM'), ('그리움', 'NNG'), ('고이', 'MAG'), ('담', 'VV'), ('아', 'EC'), ('그대', 'NP'), ('내게로', 'NP+JKB+JKB'), ('올', 'MM'), ('때', 'NNG'), ('면', 'VCP+EC'), ('그', 'MM'), ('손', 'NNG'), ('에', 'JKB'), ('쥐', 'VV'), ('어', 'EC'), ('줄게요', 'VX+EF'), ('어떤', 'MM'), ('이유', 'NNG'), ('로', 'JKB'), ('만나', 'VV+EC'), ('나와', 'VV+EC'), ('사랑', 'NNG'), ('을', 'JKO'), ('하', 'VV'), ('고', 'EC'), ('어떤', 'MM'), ('이유', 'NNG'), ('로', 'JKB'), ('내게', 'NP+JKB'), ('와', 'JKB'), ('함께', 'MAG'), ('있', 'VV'), ('어', 'EC'), ('준', 'VX+ETM'), ('당신', 'NP'), ('부디', 'MAG'), ('행복', 'NNG'), ('한', 'XSA+ETM'), ('날', 'NNG'), ('도', 'JX'), ('살', 'VV'), ('다', 'EC'), ('지치', 'VV'), ('는', 'ETM'), ('날', 'NNG'), ('도', 'JX'), ('모두', 'MAG'), ('그대', 'NP'), ('의', 'JKG'), ('곁', 'NNG'), ('에', 'JKB'), ('내', 'NP'), ('가', 'JKS'), ('있', 'VA'), ('어', 'EC'), ('줄', 'VX+ETM'), ('수', 'NNB'), ('있', 'VV'), ('길', 'ETN+JKO'), ('네', 'MM'), ('번', 'NNBC'), ('의', 'JKG'), ('모든', 'MM'), ('계절', 'NNG'), ('들', 'XSN'), ('과', 'JKB'), ('열', 'NR'), ('두', 'MM'), ('달', 'NNG'), ('의', 'JKG'), ('시간', 'NNG'), ('을', 'JKO'), ('너', 'NP'), ('와', 'JKB'), ('숨', 'NNG'), ('이', 'JKS'), ('차', 'VV'), ('게', 'EC'), ('매일', 'MAG'), ('사랑', 'NNG'), ('하', 'XSV'), ('며', 'EC'), ('함께', 'MAG'), ('할', 'VV+ETM'), ('게', 'NNB+JKS'), ('어떤', 'MM'), ('이유', 'NNG'), ('로', 'JKB'), ('만나', 'VV+EC'), ('우리', 'NP'), ('사랑', 'NNG'), ('을', 'JKO'), ('했', 'VV+EP'), ('던', 'ETM'), ('지금', 'NNG'), ('이', 'JKS'), ('순간', 'NNG'), ('처럼', 'JKB'), ('매일', 'MAG'), ('바라보', 'VV'), ('며', 'EC'), ('애써', 'VV+EC'), ('주', 'VX'), ('기', 'ETN'), ('를', 'JKO'), ('부디', 'MAG'), ('행복', 'NNG'), ('한', 'XSA+ETM'), ('날', 'NNG'), ('도', 'JX'), ('살', 'VV'), ('다', 'EC'), ('지치', 'VV'), ('는', 'ETM'), ('날', 'NNG'), ('도', 'JX'), ('모두', 'MAG'), ('그대', 'NP'), ('의', 'JKG'), ('곁', 'NNG'), ('에', 'JKB'), ('내', 'NP'), ('가', 'JKS'), ('있', 'VA'), ('어', 'EC'), ('줄', 'VX+ETM'), ('수', 'NNB'), ('있', 'VV'), ('길', 'ETN+JKO'), ('부디', 'MAG'), ('추억', 'NNG'), ('만', 'JX'), ('남', 'VV'), ('지', 'EC'), ('않', 'VX'), ('길', 'ETN+JKO'), ('너', 'NP'), ('완', 'JKB+JX')]

각 형태소 분석기의 품사 태그에 관한 정보 즉 품사 태그의 기호와 의미는 tagset 속성을 통해 확인할 수 있습니다.

import pandas as pd
pd.set_option('display.max_rows', None)

tagsets = pd.DataFrame()
N = 67
tagsets["Kkma-기호"] = list(kkma.tagset.keys()) + list('-'*(N-len(kkma.tagset)))
tagsets["Kkma-의미"] = list(kkma.tagset.values()) + list('-'*(N-len(kkma.tagset)))
tagsets["Komoran-기호"] = list(komoran.tagset.keys()) + list('-'*(N-len(komoran.tagset)))
tagsets["Komoran-의미"] = list(komoran.tagset.values()) + list('-'*(N-len(komoran.tagset)))
tagsets["Mecab-기호"] = list(mecab.tagset.keys()) + list('-'*(N-len(mecab.tagset)))
tagsets["Mecab-의미"] = list(mecab.tagset.values()) + list('-'*(N-len(mecab.tagset)))
tagsets["OKT-기호"] = list(okt.tagset.keys()) + list('-'*(N-len(okt.tagset)))
tagsets["OKT-의미"] = list(okt.tagset.values()) + list('-'*(N-len(okt.tagset)))
tagsets
Kkma-기호 Kkma-의미 Komoran-기호 Komoran-의미 Mecab-기호 Mecab-의미 OKT-기호 OKT-의미
0 EC 연결 어미 EC 연결 어미 EC 연결 어미 Adjective 형용사
1 ECD 의존적 연결 어미 EF 종결 어미 EF 종결 어미 Adverb 부사
2 ECE 대등 연결 어미 EP 선어말어미 EP 선어말어미 Alpha 알파벳
3 ECS 보조적 연결 어미 ETM 관형형 전성 어미 ETM 관형형 전성 어미 Conjunction 접속사
4 EF 종결 어미 ETN 명사형 전성 어미 ETN 명사형 전성 어미 Determiner 관형사
5 EFA 청유형 종결 어미 IC 감탄사 IC 감탄사 Eomi 어미
6 EFI 감탄형 종결 어미 JC 접속 조사 JC 접속 조사 Exclamation 감탄사
7 EFN 평서형 종결 어미 JKB 부사격 조사 JKB 부사격 조사 Foreign 외국어, 한자 및 기타기호
8 EFO 명령형 종결 어미 JKC 보격 조사 JKC 보격 조사 Hashtag 트위터 해쉬태그
9 EFQ 의문형 종결 어미 JKG 관형격 조사 JKG 관형격 조사 Josa 조사
10 EFR 존칭형 종결 어미 JKO 목적격 조사 JKO 목적격 조사 KoreanParticle (ex: ㅋㅋ)
11 EP 선어말 어미 JKQ 인용격 조사 JKQ 인용격 조사 Noun 명사
12 EPH 존칭 선어말 어미 JKS 주격 조사 JKS 주격 조사 Number 숫자
13 EPP 공손 선어말 어미 JKV 호격 조사 JKV 호격 조사 PreEomi 선어말어미
14 EPT 시제 선어말 어미 JX 보조사 JX 보조사 Punctuation 구두점
15 ET 전성 어미 MAG 일반 부사 MAG 일반 부사 ScreenName 트위터 아이디
16 ETD 관형형 전성 어미 MAJ 접속 부사 MAJ 접속 부사 Suffix 접미사
17 ETN 명사형 전성 어미 MM 관형사 MM 관형사 Unknown 미등록어
18 IC 감탄사 NA 분석불능범주 NNB 의존 명사 Verb 동사
19 JC 접속 조사 NF 명사추정범주 NNBC 단위를 나타내는 명사 - -
20 JK 조사 NNB 의존 명사 NNG 일반 명사 - -
21 JKC 보격 조사 NNG 일반 명사 NNP 고유 명사 - -
22 JKG 관형격 조사 NNP 고유 명사 NP 대명사 - -
23 JKI 호격 조사 NP 대명사 NR 수사 - -
24 JKM 부사격 조사 NR 수사 SC 구분자 , · / : - -
25 JKO 목적격 조사 NV 용언추정범주 SE 줄임표 … - -
26 JKQ 인용격 조사 SE 줄임표 SF 마침표, 물음표, 느낌표 - -
27 JKS 주격 조사 SF 마침표, 물음표, 느낌표 SH 한자 - -
28 JX 보조사 SH 한자 SL 외국어 - -
29 MA 부사 SL 외국어 SN 숫자 - -
30 MAC 접속 부사 SN 숫자 SSC 닫는 괄호 ), ] - -
31 MAG 일반 부사 SO 붙임표(물결,숨김,빠짐) SSO 여는 괄호 (, [ - -
32 MD 관형사 SP 쉼표,가운뎃점,콜론,빗금 SY 기타 기호 - -
33 MDN 수 관형사 SS 따옴표,괄호표,줄표 VA 형용사 - -
34 MDT 일반 관형사 SW 기타기호 (논리수학기호,화폐기호) VCN 부정 지정사 - -
35 NN 명사 VA 형용사 VCP 긍정 지정사 - -
36 NNB 일반 의존 명사 VCN 부정 지정사 VV 동사 - -
37 NNG 보통명사 VCP 긍정 지정사 VX 보조 용언 - -
38 NNM 단위 의존 명사 VV 동사 XPN 체언 접두사 - -
39 NNP 고유명사 VX 보조 용언 XR 어근 - -
40 NP 대명사 XPN 체언 접두사 XSA 형용사 파생 접미사 - -
41 NR 수사 XR 어근 XSN 명사파생 접미사 - -
42 OH 한자 XSA 형용사 파생 접미사 XSV 동사 파생 접미사 - -
43 OL 외국어 XSN 명사파생 접미사 - - - -
44 ON 숫자 XSV 동사 파생 접미사 - - - -
45 SE 줄임표 - - - - - -
46 SF 마침표, 물음표, 느낌표 - - - - - -
47 SO 붙임표(물결,숨김,빠짐) - - - - - -
48 SP 쉼표,가운뎃점,콜론,빗금 - - - - - -
49 SS 따옴표,괄호표,줄표 - - - - - -
50 SW 기타기호 (논리수학기호,화폐기호) - - - - - -
51 UN 명사추정범주 - - - - - -
52 VA 형용사 - - - - - -
53 VC 지정사 - - - - - -
54 VCN 부정 지정사, 형용사 '아니다' - - - - - -
55 VCP 긍정 지정사, 서술격 조사 '이다' - - - - - -
56 VV 동사 - - - - - -
57 VX 보조 용언 - - - - - -
58 VXA 보조 형용사 - - - - - -
59 VXV 보조 동사 - - - - - -
60 XP 접두사 - - - - - -
61 XPN 체언 접두사 - - - - - -
62 XPV 용언 접두사 - - - - - -
63 XR 어근 - - - - - -
64 XSA 형용사 파생 접미사 - - - - - -
65 XSN 명사파생 접미사 - - - - - -
66 XSV 동사 파생 접미사 - - - - - -

참고자료

데이터사이언스스쿨

댓글남기기