PharmKGQA

评测集介绍

Introduction

基于PharmKG的数据集是一个专为生物医药领域设计的问答数据集,旨在通过整合药物知识图谱(PharmKG)中的结构化信息,为药物相关的多种问答任务提供支持。PharmKG是一个涵盖药物、疾病、靶点、药物作用机制等多维度信息的知识图谱,特别适用于药物发现、精准医疗和个性化治疗等研究领域。该数据集具有以下特点:

  • 涵盖药物相关的多维信息:数据集不仅包含药物的基本信息,如药物名称、化学成分、适应症、剂量、药理作用等,还涵盖药物的靶点、药物与疾病之间的关系、药物副作用等复杂知识。用户可以基于这些信息查询药物的各类性质及其与其他生物分子或疾病的关系。
  • 推理与关系查询:许多问题涉及药物、疾病与靶点之间复杂的关系推理。例如,某一疾病与多个药物的关联,或者某种药物通过与特定靶点结合而发挥作用的问题。这些问题不仅要求从PharmKG中提取相关数据,还需基于现有文献或实验数据进行进一步推理,揭示药物作用的机制和疗效。
  • 多步推理任务:一些问题涉及多步推理,需要根据药物与疾病、基因、临床试验结果等不同维度的交叉信息,来预测药物的效果或副作用。例如,查询某种药物在特定患者群体中的疗效,需要综合考虑药物的药代动力学、遗传信息以及疾病的具体特征。
  • 跨领域整合:药物科学涉及多学科知识,包括生物学、化学、医学和药学等。基于PharmKG的数据集特别强调跨学科的知识整合。问题不仅包括药物的基本药理学内容,还涉及药物与疾病、靶点之间的复杂关系、以及药物在不同人群中的不同反应等多方面内容。

基于PharmKG的数据集旨在促进生物医药科学领域模型的RAG能力。

Meta Data

本次任务对每个样本采用答案精确匹配(选择/判断),或利用生成式大语言模型评判(QA)。

  {

        “question”: “Please answer the following question: what entities are connected to 16 androstene steroid through K?”,

        “answer”: [

            “acyl lipid omega 3 desaturase”

        ]

  }