[데이터 전처리] 데이터 스케일링 (Data Scaling)
이 글은 데이터 스케일링(Data Scaling)에 관한 기록입니다.
이 글은 데이터 스케일링(Data Scaling)에 관한 기록입니다.
이 글은 파이썬을 이용한 동적 크롤링에 관한 기록입니다.
이 글은 파이썬을 이용한 정적 크롤링에 관한 기록입니다.
이 글은 웹 크롤링에 관한 기록입니다.
이 글은 위키피디아에 존재하는 표 형태의 데이터를 전처리 하는 방법에 관한 기록입니다. 위키피디아에 존재하는 표 형태의 데이터를 크롤링 하는 방법에 관한 기록은 이 곳에서 볼 수 있습니다.
이 글은 위키피디아에 존재하는 표 형태의 데이터를 크롤링 하는 방법에 관한 기록입니다.
이 글은 파이썬에서 셀레니움(Selenium)을 사용하는 방법에 관한 기록입니다.
이 글은 수치형 데이터를 범주형 데이터로 변환하는 방법에 관한 기록입니다.
이 글은 판다스의 데이터프레임 내 중복 데이터를 확인하고 제거하는 방법에 관한 기록입니다.
이 글은 결측치의 개념, 종류, 그리고 결측치 처리 방법에 관한 기록입니다.
문서들 간의 유사도를 측정하기 위하여 유사도 척도를 사용합니다. 유사도 척도는 크게 거리 계수와 유사 계수로 구분합니다.
이 글은 정수 인코딩과 원-핫 인코딩에 관한 기록입니다.
자연어 처리에는 텍스트를 표현하는 여러가지 방법들이 있습니다. 특히 컴퓨터가 이해할 수 있도록 문자를 숫자로 바꾸는 방법들이 존재합니다. 이러한 단어 표현 방법들에 대해서 알아보고자 합니다.
이 글은 불용어를 제거하는 방법에 관한 기록입니다.
단어의 형태 변화(lexical variations of term ; term variation)에 따라 같은 단어라도 다른 단어인 것처럼 취급되는 문제를 해결하기 위해 사용되는 보편적인 방법으로 어간 추출(Stemming)과 원형 복원(Lemmatization)이 있습니다.
이 글은 품사 태깅에 관한 기록입니다.
이 글은 한국어의 형태소 분석에 관한 기록입니다. 형태소 분석 속도 및 결과를 기준으로 한국어 형태소 분석기를 비교한 글은 이 곳에서 볼 수 있습니다.
이 글은 단어 토큰화(Word Tokenization)의 개념 및 코드에 관한 기록입니다.
이 글은 문장 토큰화(Sentence Tokenization)의 개념 및 코드에 관한 기록입니다.
한국어 형태소 분석기의 형태소 분석 속도 및 결과를 비교해보고자 한다. 이에 Komoran, KokomaKorean, TwitterKorean, MeCab 총 네 가지 한글 형태소 분석기를 대상으로 삼았고, 텍스트 데이터는 ‘호텔델루나’를 질의어로 입력한 네이버 뉴스 기사 검색 결...
이 글은 정영미 교수님의 정보검색연구를 바탕으로 연세대학교 문성빈 교수님의 수업을 공부한 기록입니다.
이 글은 정영미 교수님의 정보검색연구를 바탕으로 연세대학교 문성빈 교수님의 수업을 공부한 기록입니다.
이 글은 정영미 교수님의 정보검색연구를 바탕으로 연세대학교 문성빈 교수님의 수업을 공부한 기록입니다.
이 글은 정영미 교수님의 정보검색연구를 바탕으로 연세대학교 문성빈 교수님의 수업을 공부한 기록입니다.
이 글은 정영미 교수님의 정보검색연구를 바탕으로 연세대학교 문성빈 교수님의 수업을 공부한 기록입니다.
이 글은 정영미 교수님의 정보검색연구를 바탕으로 연세대학교 문성빈 교수님의 수업을 공부한 기록입니다.
이 글은 정영미 교수님의 정보검색연구를 바탕으로 연세대학교 문성빈 교수님의 수업을 공부한 기록입니다.
이 글은 정영미 교수님의 정보검색연구를 바탕으로 연세대학교 문성빈 교수님의 수업을 공부한 기록입니다.
이 글은 정영미 교수님의 정보검색연구를 바탕으로 연세대학교 문성빈 교수님의 수업을 공부한 기록입니다.
이 글은 정영미 교수님의 정보검색연구를 바탕으로 연세대학교 문성빈 교수님의 수업을 공부한 기록입니다.
이 글은 정영미 교수님의 정보검색연구를 바탕으로 연세대학교 문성빈 교수님의 수업을 공부한 기록입니다.
이 글은 정영미 교수님의 정보검색연구를 바탕으로 연세대학교 문성빈 교수님의 수업을 공부한 기록입니다.
이 글은 정영미 교수님의 정보검색연구를 바탕으로 연세대학교 문성빈 교수님의 수업을 공부한 기록입니다.
이 글은 정영미 교수님의 정보검색연구를 바탕으로 연세대학교 문성빈 교수님의 수업을 공부한 기록입니다.
이 글은 정영미 교수님의 정보검색연구를 바탕으로 연세대학교 문성빈 교수님의 수업을 공부한 기록입니다.
이 글은 정영미 교수님의 정보검색연구를 바탕으로 연세대학교 문성빈 교수님의 수업을 공부한 기록입니다.
이 글은 정영미 교수님의 정보검색연구를 바탕으로 연세대학교 문성빈 교수님의 수업을 공부한 기록입니다.
이 글은 정영미 교수님의 정보검색연구를 바탕으로 연세대학교 문성빈 교수님의 수업을 공부한 기록입니다.
이 글은 정영미 교수님의 정보검색연구를 바탕으로 연세대학교 문성빈 교수님의 수업을 공부한 기록입니다.
이 글은 정영미 교수님의 정보검색연구를 바탕으로 연세대학교 문성빈 교수님의 수업을 공부한 기록입니다.
이 글은 정영미 교수님의 정보검색연구를 바탕으로 연세대학교 문성빈 교수님의 수업을 공부한 기록입니다.
이 글은 macOS에서 Homebrew를 이용하여 Anaconda를 설치하는 방법에 관한 기록입니다.
이 글은 깃허브 블로그를 만들고자 Homebrew와 Ruby를 설치하는 방법에 관하여 정리한 기록입니다.
이 글은 macOS에서 CUDA를 사용할 수 있도록 PyTorch를 설치하는 방법에 관한 기록입니다.
이 글은 서버와 관련된 명령어들을 정리한 기록입니다.
이 글은 아나콘다 가상환경과 관련된 명령어들을 정리한 기록입니다.
이 글은 macOS Catalina에서 XGBoost를 설치하는 방법에 관한 기록입니다.
이 글은 터미널에서 자주 사용하는 명령어들을 정리한 기록입니다.
이 글은 .gitignore의 개념 및 사용 방법에 관한 기록입니다.
Pointer
이 글은 markdown을 pdf로 변환하는 방법에 관한 기록입니다.
이 글은 jupyter notebook을 markdown으로 변환하는 방법에 관한 기록입니다. 궁극적으로는 이를 활용하여 GitHub 블로그에 jupyter notebook을 포스팅으로 업로드 하고자 합니다.
이 글은 마크다운에서 수식을 사용하기 위해 LaTex 문법에 관하여 정리한 기록입니다.
이 글은 마크다운 문법에 관하여 정리한 기록입니다.
깃을 활용하여 협업하는 환경을 구축하는 과정에 대한 포스팅입니다. 깃허브에 관한 기본적인 내용은 깃허브 개념 및 깃 명령어를 참고하시길 바랍니다.
깃허브의 기본적인 개념 및 구조, 그리고 깃을 사용하는 데에 필요한 주요 명령어에 관한 기록입니다.
이 글은 HuggingFace 내 transformers 라이브러리를 활용하여 텍스트를 생성하는 방법에 관한 기록입니다.
이 글은 CNN의 개념 및 구조에 관한 기록입니다.
이 글은 케라스(Keras)에서 제공하는 손실 함수(Loss function)에 관한 기록입니다.
이 글은 활성화 함수, 특히 비선형 활성화 함수에 관한 기록입니다.
단어 단위 RNN은 입출력의 단위가 단어 수준(word level)인 RNN을 말합니다.
문자 단위 RNN (Char RNN)은 입출력의 단위가 문자 수준(character level)인 RNN을 말합니다. 이는 다대다(many-to-many) 구조를 갖는 RNN으로, 품사 태깅, 개체명 인식 등에 사용됩니다.
이 글은 트랜스포머의 모델 아키텍처를 중점적으로 다룬 기록입니다.
이 글은 어텐션의 개념, 구조, 종류에 관한 기록입니다.
이 글은 LSTM의 개념, 구조, 순전파, 역전파, 그리고 파이토치를 활용한 LSTM 구현에 관한 기록입니다.
이 글은 RNN의 개념, 구조, 순전파, 역전파, 그리고 파이토치를 활용한 RNN 구현에 관한 기록입니다.
언어 모델(Language Model; LM)은 언어라는 현상을 모델링 하고자 단어 시퀀스 또는 문장에 확률을 할당(assign)하는 모델입니다. 언어 모델에는 크게 통계를 이용한 방법과 인공신경망을 이용한 방법이 있습니다.
이 글은 워드 임베딩 방법론 중 Word2Vec에 관한 기록입니다.
이 글은 희소 표현, 밀집 표현, 그리고 워드 임베딩(Word Embedding)에 관한 기록입니다.
이 글은 알고리즘의 시간 복잡도 및 빅오 표기법에 관한 기록입니다.
이 글은 판다스의 데이터프레임을 다루는 방법에 관한 기록입니다.
이 글은 자료구조 중 큐에 관한 기록입니다.
이 글은 자료구조 중 스택에 관한 기록입니다.
이 글은 자료구조 중 배열에 관한 기록입니다.
이 글은 자료구조의 개념 및 종류에 관한 기록입니다.
이 글은 2차원 리스트(이중 리스트)를 1차원 리스트로 변환하는 방법에 관한 기록입니다.
이 글은 리스트 메소드에 관한 기록입니다.
이 글은 문자열 완전 일치 / 부분 일치 / 전방 일치 / 후방 일치에 관한 기록입니다.
이 글은 문자열 및 데이터프레임에서 공백을 제거하는 방법에 관한 기록입니다.
이 글은 문자열 메소드에 관한 기록입니다.
이 글은 파이썬에서 정규표현식을 사용하는 방법에 관한 기록입니다.
8. Tree-Based Methods
6. Linear Model Selection and Regularization
5. Resampling Method