https://arxiv.org/abs/2306.10968
BayLing: Bridging Cross-lingual Alignment and Instruction Following through Interactive Translation for Large Language Models (Shaolei Zhang, Qingkai Fang, Zhuocheng Zhang, Zhengrui Ma, Yan Zhou, Langlin Huang, Mengyu Bu, Shangtong Gui, Yunji Chen, Xilin Chen, Yang Feng)
llama의 multilingual capability를 개선하기 위해 interactive translation, 즉 번역 과제를 single turn으로 끝내는 게 아니라 여러 번 사용자와 상호작용하면서 번역문을 개선하는 형태의 multi turn 대화를 사용해 모델을 튜닝했군요. 흥미로운데 이 interactive translation 데이터를 어떻게 구축했는지에 대한 정보가 전혀 없는 것 같네요.
#llm #alignment