这种单组设计具有传统流行病学研究中横断面研究设计的时间框架,因此很多研究也直接将这种设计称之为横断面研究,有研究也称之为诊断性横断面研究[13-14],但其与流行病学的横断面研究并不完全相同,本文称之为单组设计。
①优点:
第一,研究对象的选择可采用连续抽样。连续抽样是一种临床研究中常用的可行性较好的非随机抽样方法,即选择一定时期内符合要求的连续性病例,与其他非随机抽样方法相比,既结合了在临床工作中入组患者的实际情况,又可以在一定程度上减少选择偏倚。
第二,因为是单组设计,研究对象的纳入符合“单门原则”,即研究对象均采用统一的纳入排除标准,而不是将患者和非患者群分别抽样[15]。当然,纳入排除标准的确定要紧密结合诊断试验的应用人群,注意结果外推性的同时也要兼顾研究的可行性[16]。例如,在一项单源双能计算机断层扫描(CT)诊断椎体压缩性骨折的骨髓水肿的准确性研究中,研究者前瞻性纳入影像检查疑为胸椎或腰椎压缩性骨折的>50岁人群,符合“单门原则”,对所有患者采用单源双能CT检查,以磁共振成像为金标准评价其诊断准确性[17]。“单门原则”加之连续抽样有利于保证纳入研究对象的流程与真实世界的情况类似,使研究对象的疾病谱和其他特征与诊断试验推广应用的目标人群类似;也有助于估计研究对象的患病率,以便进一步估算预测值[18]。
第三,根据对象招募方式或数据收集的时序性,可以采用前瞻性或回顾性设计。前瞻性设计纳入尚未被诊断的研究对象,有利于实施“盲法”,也有利于保证数据的准确性。回顾性设计收集历史资料开展研究,类似于回顾性的横断面研究,研究周期更短,成本更低,更有利于快速评估诊断试验。例如,一项BMI在沙特阿拉伯人群中肥胖的诊断准确性研究中,按照统一的纳入排除标准回顾性地收集了2005年1月至2016年3月来自多医疗中心的研究对象,将历史记录的BMI与体脂百分比(作为金标准)数据进行比较分析[19]。也有研究采用双向性设计纳入研究对象,即前瞻性和回顾性设计的组合[13,20-21]。这里的前瞻性、回顾性、双向性设计仅指研究对象纳入或资料收集的方式。
第四,单组设计具有横断面研究的时间框架,容易实现“同步”评价,即在相同时间或恰当的时间间隔对同一患者进行待评价诊断试验和金标准的检查。
②缺点:
第一,由于单组设计需要足够的研究对象同时接受2种诊断,当待评价诊断试验或金标准具有侵入性或价格昂贵时,研究对象的招募难度增加,研究可行性受限,也容易引发伦理问题。
第二,如果待评价诊断试验和金标准的诊断结果之间相互产生影响,那么单组设计的“同步”要求反而会增加偏倚的风险。
第三,单组设计中回顾性或双向性设计高度依赖历史数据的准确性,有时数据的完整性和同质性不能得到保证。
③适用条件:
是单个诊断试验准确性研究经典、常用的设计类型,适用范围较广。在诊断试验进行初步探索、验证是否可以进行鉴别诊断或推向临床应用阶段均适用。但在待评价诊断试验与金标准诊断之间相互影响时不推荐使用。
(2)诊断性病例对照研究设计:
部分诊断试验准确性研究采用了类似病例对照研究的设计,为区别于经典的病例对照研究,有研究将其称为诊断性病例对照研究[16]。这种设计针对2组人群,分别设立不同的纳入排除标准,其中一组为可疑患病人群或确诊人群,另外一组为非患者和/或健康人群,确定研究对象后,用诊断试验进行检测,并判定与患病结果的一致性。见图1。
①优点:
第一,诊断性病例对照研究常用于诊断试验准确性的初期探索性研究,可以方便、快速地确定病例组和对照组,提高研究效率。
第二,如果目标疾病是少见或罕见病,或明确诊断需要较长的周期,诊断性病例对照研究可利用以前积累的患者群作为病例组,也可以显著提高研究效率,尤其是在罕见病的诊断性研究中具有独特的优势。
②缺点:
第一,纳入研究对象时无法实现“单门原则”,研究者的纳入采用“双门设计”,即采取不同的纳入排除标准分别针对患者和非患者进行抽样,存在较大的选择性偏倚和疾病谱偏倚风险[22]。例如,在一项宽带鼓室图作为梅尼埃病诊断工具的病例对照研究中,研究者从诊断为梅尼埃病的患者中,选取52名作为患病组,又从无耳科疾病史的听力正常成年人中选取99名作为对照组。分别使用宽带鼓室图(诊断试验)和金标准方法进行听力测定,并比较分析[23]。这种设计不太符合临床的实际应用情况,临床实践中需要进行诊断的可能是与梅尼埃病类似的听力障碍患者。
第二,病例对照设计纳入的研究对象很难做到连续性,若纳入病情严重、易于诊断的病例较多,会高估准确性。只有病例组和对照组的疾病谱类似于诊断试验推广应用的目标人群时,才能有效估计敏感度和特异度,但这在病例对照设计的实际研究中很难实现,导致该设计容易错误估计诊断试验的准确性[15]。
第三,由于在纳入研究对象时已经进行明确的分组设计,病例已经被诊断,所以很容易对后续诊断试验结果的判读产生影响,不容易贯彻“盲法”的原则。
第四,一般不能使用病例对照设计所得的数据直接计算预测值和相关指标,因为预测值与患病率直接相关,该类研究设计很难确定研究对象的患病率[24]。
③适用条件:
常用于诊断试验的初期探索性研究中,例如新的诊断标志物的筛选等,因为初期主要是探究诊断试验对患者的诊断结果是否与非患者和/或健康人群不同,检验该诊断试验是否值得进一步研究。
2. 诊断试验准确性比较研究:
在临床决策中,往往需要判断1种诊断试验是否比其他诊断方法表现更好,针对这一问题研究,需要开展诊断试验准确性比较研究,涉及≥2种诊断性试验,分别与金标准进行比较,以确定哪种诊断试验的准确性更高。研究设计类型包括单组配对设计和平行组设计。
(1)单组配对设计:
①完全配对设计:
纳入具有代表性的一组研究对象,均接受全部待评价的诊断试验和金标准诊断。见图2。例如,在一项比较MR-proANP和NT-proBNP诊断心衰能力的研究中,研究者首先前瞻性、连续性招募了287名因不明原因呼吸困难为主诉而就诊于某医院急诊室的患者,研究对象均接受了待评价的试验(血清MR-proANP和NT-proBNP检测)和金标准诊断,属于典型的完全配对设计[25]。