https://arxiv.org/abs/2307.11088

L-Eval: Instituting Standardized Evaluation for Long Context Language Models (Chenxin An, Shansan Gong, Ming Zhong, Mukai Li, Jun Zhang, Lingpeng Kong, Xipeng Qiu)

long context benchmark 셋과 테스트 결과가 하나 나왔군요.

#transformer #benchmark

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

230720 L-Eval.md

230720 L-Eval.md

Files

230720 L-Eval.md

Latest commit

History

230720 L-Eval.md

File metadata and controls