论文阅读：Making Large Language Models A Better Foundation For Dense Retrieval-Toy模板网

这篇具有很好参考价值的文章主要介绍了论文阅读：Making Large Language Models A Better Foundation For Dense Retrieval。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

论文链接

Abstract

密集检索需要学习区分性文本嵌入来表示查询和文档之间的语义关系。考虑到大型语言模型在语义理解方面的强大能力，它可能受益于大型语言模型的使用。然而，LLM是由文本生成任务预先训练的，其工作模式与将文本表示为嵌入完全不同。因此，必须研究如何正确地调整LLM，以便它们能够有效地初始化为密集检索的骨干编码器。
在本文中，我们提出了一种新的方法，称为LLaRA（适用于密集检索的LLM），它作为LLM的后验自适应，用于密集检索应用。LLaRA由两个前置任务组成：基于嵌入的自动编码（EBAE）和基于嵌入的自回归（EBAR），其中来自LLM的文本嵌入分别用于重构输入句子的标记和预测下一个句子的标记。LLaRA被证明是简单、轻便和高效的。它被应用于维基百科语料库上的LLaMA-2-7B（基础），在那里它大大提高了模型在各种密集检索基准上的微调性能，如MSMARCO和BEIR。我们的模型和代码将在BGE存储库中公开。