word2vec을 사용. 코사인 유사도.
벡터 연산 (유추 평가) 가능
아들 - 딸 + 소녀 = 소년?
전이학습 (transfer learning)
임베딩이 좋아지면? => 딥러닝 모델의 향상
단어 임베딩의 합으로 문서 벡터를 표현
도형의 중심은 평균과 밀접한 관련
단어 벡터의 합 ≒ 단어 벡터의 평균 ≒ 문서 벡터의 중심
복잡한 모델을 써도 80%대
임베딩 품질이 좋으면 자연어 처리 성능을 높일 수 있음
https://github.com/ratsgo/embedding
https://github.com/SKTBrain/KoBERT