Posts by Category

Data Analysis

[텍스트 전처리] 텍스트 표현 (Text Representation)

자연어 처리에는 텍스트를 표현하는 여러가지 방법들이 있습니다. 특히 컴퓨터가 이해할 수 있도록 문자를 숫자로 바꾸는 방법들이 존재합니다. 이러한 단어 표현 방법들에 대해서 알아보고자 합니다.

[텍스트 전처리] 형태소 분석

이 글은 한국어의 형태소 분석에 관한 기록입니다. 형태소 분석 속도 및 결과를 기준으로 한국어 형태소 분석기를 비교한 글은 이 곳에서 볼 수 있습니다.

맨 위로 이동 ↑

Informatoin Retrieval

맨 위로 이동 ↑

Etc

[macOS] XGBoost 설치

이 글은 macOS Catalina에서 XGBoost를 설치하는 방법에 관한 기록입니다.

[Git] 깃을 활용하여 협업하기

깃을 활용하여 협업하는 환경을 구축하는 과정에 대한 포스팅입니다. 깃허브에 관한 기본적인 내용은 깃허브 개념 및 깃 명령어를 참고하시길 바랍니다.

맨 위로 이동 ↑

Artificial Intelligence

[NLP] 문자 단위 RNN (Character level RNN) Code

문자 단위 RNN (Char RNN)은 입출력의 단위가 문자 수준(character level)인 RNN을 말합니다. 이는 다대다(many-to-many) 구조를 갖는 RNN으로, 품사 태깅, 개체명 인식 등에 사용됩니다.

[NLP] 언어 모델 (Language Model)

언어 모델(Language Model; LM)은 언어라는 현상을 모델링 하고자 단어 시퀀스 또는 문장에 확률을 할당(assign)하는 모델입니다. 언어 모델에는 크게 통계를 이용한 방법과 인공신경망을 이용한 방법이 있습니다.

맨 위로 이동 ↑

Python

[Python] 문자열 비교하기

이 글은 문자열 완전 일치 / 부분 일치 / 전방 일치 / 후방 일치에 관한 기록입니다.

맨 위로 이동 ↑

Machine Learning

맨 위로 이동 ↑