WTQ

评测集介绍

Introduction

WikiTableQuestions是一个基于半结构化表格的问答数据集。它由HTML表格上的问答对组成,这些问答对是通过从维基百科中选取包含至少8行和5列的数据表构建的。 亚马逊机械土耳其工人被委托为每个表格编写关于表格的琐事问题。WikiTableQuestions包含了22,033个问题,这些问题并非由预定义的模板设计,而是由用户手工制作,显示出高度的语言多样性。 与之前的知识库数据集相比,它覆盖了近4,000个独特的列标题,包含了比封闭领域数据集和查询知识库的数据集多得多的关系。 它的问题覆盖了广泛的主题,需要执行的操作包括表格查找、聚合、比较(最大值、最小值)、算术运算、连接和并集。

Meta Data

 {

        “id”: A string representing the question id,

        “question”: A string representing the question

        “source”: A string representing the source data

        “answer”: A list of string representing the answers //The test file does not contain this

  }

Example

 {

        “id”: “nt-99”,

        “question”: “how many elections had at least a 0.2 percentage of constituency votes?”,

        “source”: “csv/203-csv/698.csv”,

        “answer”: [

                “9”

        ]

  },