Conferences
Papago: Engineering BERT into NMT
왜 NMT를 더 잘 돌아가기 위해서 BERT로 pre-train해야하는가?
결합 시 더 좋은 성능
전이 학습