WTQ
Introduction
WikiTableQuestions是一个基于半结构化表格的问答数据集。它由HTML表格上的问答对组成,这些问答对是通过从维基百科中选取包含至少8行和5列的数据表构建的。 亚马逊机械土耳其工人被委托为每个表格编写关于表格的琐事问题。WikiTableQuestions包含了22,033个问题,这些问题并非由预定义的模板设计,而是由用户手工制作,显示出高度的语言多样性。 与之前的知识库数据集相比,它覆盖了近4,000个独特的列标题,包含了比封闭领域数据集和查询知识库的数据集多得多的关系。 它的问题覆盖了广泛的主题,需要执行的操作包括表格查找、聚合、比较(最大值、最小值)、算术运算、连接和并集。
Meta Data
{
“id”: A string representing the question id,
“question”: A string representing the question
“source”: A string representing the source data
“answer”: A list of string representing the answers //The test file does not contain this
}
Example
{
“id”: “nt-99”,
“question”: “how many elections had at least a 0.2 percentage of constituency votes?”,
“source”: “csv/203-csv/698.csv”,
“answer”: [
“9”
]
},