SymTex-TBQ

评测集介绍

Introduction

SymTe-TBQ是一个用于评估大语言模型在符号非单调推理领域能力的数据集,包含540个样本。TBQ(Tri-state Boolean Querying)任务是一个分类任务,给定非单调推理程序(包含事实、规则)和查询,要求输出查询在程序中的状态,分为True、False和Maybe。

Meta Data

facts: 事实集合

rules: 规则集合

query: 查询

label: 查询标签

[输入]
facts:
    – Viverricula(“Brandi_Lucero”,“Austin_Diaz”)
    – veronica(“Austin_Diaz”,“Austin_Diaz”)
      Viverricula(“Austin_Diaz”,“Ashley_Clayton”)
      Taraxacum(“Brandi_Lucero”,“Austin_Diaz”)


rules
:
      Aplectrum(A) :       Viverricula(A,B)
      Helotiales(A,B) : Viverricula(C,B), veronica(C,A)
    – Latimeria(A) : Aplectrum(A), Helotiales(B,A), Tulostoma(A)
    – Cathartes(B,A) : Viverricula(C,B), Aplectrum(A)
    – epidendron(B,A) : Taraxacum(B,B), Helotiales(B,A), Tulostoma(A)
    : Taraxacum(B,B), epidendron(B,A)


query
: Aplectrum(“Austin_Diaz”)


[
预期输出]
label: True