父文档检索器引和context precision性能指标
父文档检索器是一种搜索工具,用来从一大堆文档中找出跟你的问题最相关的答案。它的特别之处在于,它会先把文档分成小块(子片段),然后找到最相关的小块,再返回这些小块所属的完整大文档(父文档)。这样既能精准找到相关内容,又能提供完整的背景信息.
在使用父文档检索器时候,在查看context precision时会出现结果很低的情况,这并不能说是父文档检索器的性能不好,这其实是父文档检索器这个技术的本质导致的。
如上是context precision的计算公式:
- n:检索到的文档总数。
- k:文档在检索结果中的排名位置(从1开始)。
- rk:第k个文档的相关性评分(例如,1表示相关,0表示不相关)。
- Number of Relevant Nodes Up to Position:截至第k个位置的相关文档数量。
- Number of Relevan