在进行流行病学研究中,不论采用何种研究方法,都是采用样本来推断总体。有许多因素会影响其准确性使研究结果与真实情况发生偏差。引起偏差的原因包括两个方面,一是随机误差,二是系统误差。其中随机误差是由个体差异、抽样和其他未知原因引起的随机性误差,是无法避免的误差,但可以通过研究设计和统计分析方法减少和控制;系统误差一般是由人为或者测量方法不对引起的误差,即我们所说的偏倚,系统误差是可以减少甚至可以避免。减少随机误差可以提高研究的精准性,减少或避免系统误差可以提高研究的真实性。
偏倚是随机误差以外的,可导致研究结果与真实情况差异的系统误差,可发生于研究的各个环节,有方向性。偏倚主要包括三类:选择偏倚、信息偏倚和混杂偏倚。
上一期系统介绍了选择偏倚,本篇小编继续介绍信息偏倚。
信息偏倚概念
信息偏倚是在收集研究相关信息时产生的系统误差,原因可来自研究对象、调查者,也可以来自于仪器设备或者检测方法,也称为观察偏倚。可能导致的直接结果是特征错分。
信息偏倚种类
1. 回忆偏倚
回忆偏倚指研究对象在回忆研究因素的暴露信息时,由于准确性和完整性的差异而导致的系统误差。在病例对照研究中比较常见。
2.报告偏倚
报告偏倚是指在研究信息收集时,由于一些原因,研究对象有意夸大或者缩小某些信息而导致的系统误差。比如夸大职业中某些因素的作用,或者不报告自己的一些疾病状况。
3.暴露怀疑偏倚
暴露怀疑偏倚主要是来自研究者、信息收集者、信息处理者。研究者如果事先了解了研究对象患病,可能会采取与其他组不同的措施和方法探寻影响因素。如认真询问病例组,不认真询问对照组,从而导致错误结论。
4.诊断怀疑偏倚
研究者如事先了解研究对象研究因素的暴露,在主观上倾向于应该或者不应该出现的结果,比如对试验组比对照组更多的关注,从而导致错误结论。此种偏倚多来自研究者,多见于临床试验、队列研究。
5.测量偏倚
测量偏倚指研究者对研究对象进行测量时所产生的系统误差。如实验分析时,仪器没有校准,标准不统一,操作员水平参差不齐,调查员的熟练程度、认真程度、调查方式等,都可以影响信息测量准确性,产生测量偏倚。
信息偏倚的控制
1.严格信息采集标准
制定严格详细的资料收集方法。对调查内容要求有明确、客观的标准,能量化和等级化的不使用自由文本。仪器、设备统计并校正;使用的试剂要符合要求;采用统计的CRF;集中培训相关人员;做好宣传工作,争取研究对象的配合。
2. 设置盲法收集信息
收集研究信息时尽可能采用盲法。例如在临床试验当中常使用双盲法,使研究者和研究对象都不知道研究分组情况,以避免报告偏倚、暴露怀疑偏倚、诊断怀疑偏倚等。
3.采用客观指标
根据研究内容,尽可能采用客观指标作为研究信息。如调查现场实际测量身高、体重,而不是研究对象根据自我意识报告自己的身高体重。
4. 调查技术的应用
在调查敏感信息时,尽量采用敏感问题的调查技术或方法获取可靠信息,避免报告偏倚。
5. 统计学处理
应用错分分析的方法对信息偏倚进行分析和评价,并对偏倚资料的效应值予以校正。
编者简介
张尚超
百奥知 统计总监
吉林大学公共卫生学院公共卫生专业,硕士研究生
曾担任吉林大学第一医院新生儿科科研助理。
现任北京百奥知医药科技有限公司统计总监兼任智能分析产品经理。
主要研究方向:临床流行病学、分子流行病学、临床数据挖掘分析、机器学习等。
发表SCI论文8篇,其中一作1篇,影响因子IF=5.5。参与国家自然科学基金面上项目1项,其他科研项目4项。
精通SPSS、R语言、SAS、Python、Graphpad Prism等统计分析软件。近4年,主持参与50+项目统计分析工作及多项科研项目设计工作。