Conferences

BERT in Kaggle

BERT

pre-training
- Masked LM
- NSP (Next Sentence Prediction)
작은 모델 뿐만 아니라 큰 모델 역시 중요하다
evaluation에 맞는 loss를 설정해야한다.

BERT in chemistry

This site is open source. Improve this page.