Conferences

자연어 처리 모델의 성능을 높이는 비결 - 임베딩

임베딩?

word2vec을 사용. 코사인 유사도.

벡터 연산 (유추 평가) 가능

아들 - 딸 + 소녀 = 소년?

전이학습 (transfer learning)

임베딩이 좋아지면? => 딥러닝 모델의 향상

임베딩으로 문서 분류하기

단어 임베딩의 합으로 문서 벡터를 표현
도형의 중심은 평균과 밀접한 관련
단어 벡터의 합 ≒ 단어 벡터의 평균 ≒ 문서 벡터의 중심

복잡한 모델을 써도 80%대
임베딩 품질이 좋으면 자연어 처리 성능을 높일 수 있음

임베딩이 어떤 의미를 가지는가

문장 수준 임베딩

임베딩 활용

https://github.com/ratsgo/embedding
https://github.com/SKTBrain/KoBERT

Q&A