Conferences
BERT in Kaggle
BERT
pre-training
Masked LM
NSP (Next Sentence Prediction)
작은 모델 뿐만 아니라 큰 모델 역시 중요하다
evaluation에 맞는 loss를 설정해야한다.
BERT in chemistry