关于质性研究中的“抽样”和“饱和度”

引文:常常有人问,这个问题要访谈多少人合适?确实,在质性研究中,样本充足是研究效度的保证,样本量不足会影响研究的质量,样本过多又浪费了研究资源,耗时过长。如何科学抽样?多少名用户才足够?在这里抛砖引玉,希望大家一同探讨。

文章概览

本文共有 3296 字,大概需要 7 分钟阅读。

如需在有限的时间内开展一个效度足够高的质性研究,规范抽样是极其关键的一步。在前人的研究中,可以抽象出大致这几条抽样相关的准则:
1.选取合适的抽样方法(如分层抽样、偏差型抽样、滚雪球抽样等)
2.确定研究的目标人群及研究对象纳入标准
3.根据目标人群选择合适的招募方式
4.明确抽样的起止时间及停止抽样的标准
5.抽样后如遇到研究对象拒绝参与或退出,应记录人数及理由

抽样案例参考:

在我们之前的研究中,根据用户类型采取分层抽样的情况比较常见,也便于明确招募条件。

如内部某工具产品,虽然技术族同事使用较顺手,但设计族同事反馈易用性不高,所以希望建设一整套指引体系,以支持和延展业务新场景。并让设计族用户快速上手使用,所以我们在前期规划时,样本设计既要覆盖技术族新用户,了解他们能快速上手的原因,也要了解其他类型用户不好上手的具体门槛在哪里,就可以针对不同岗位类型的新老用户展开访谈,了解不同岗位的使用场景及使用问题。

关于质性研究中的“抽样”和“饱和度”

备注:(脱敏处理的用户要求部分,对业务类型及使用功能等进行细分,并控制年龄和男女比例等信息)


我们采取分层抽样的方式,可以筛选符合不同标准的用户,确保抽样的代表性,提升研究的外部效度。
了解了抽样的准则后,我们继续回到这个问题,到底选择多少个样本量才足够呢?这里就要引入“资料饱和度”这一概念了。
事实上,质性研究通常以“资料饱和度”来评估研究截点,而不是达到了足够样本量然后不管研究资料是否饱和,就认为足够了。
资料饱和即意味着目前所搜集到的数据和分析资料趋近饱和,进一步的数据搜集并不会帮助研究者对相关用户行为或心智模型产生更深入的理解,因此没有必要继续扩大样本量搜集更多的数据和资料。
参考以往的学术研究来看,大多关于样本量的建议都是一个范围,如案例研究的样本量范围在4~30之间(Sim et al.,2018)。
有学者认为,目前缺乏理论来为质性研究设置一个统一的参考样本量,不像定量研究中,为保证统计的置信度,我们通常以30组数据为定量研究中满足统计分析条件的最小样本量。
所以目前被广泛接纳的理论中,通常是将资料饱和作为质性研究中停止进一步数据采集和分析的原则。资料饱和也是质性研究中抽样满足需求的重要标志。那么这就迎来一个新的问题,我们怎么才知道资料已经饱和了呢?
Bowen(2008)在一项以扎根理论为基础的质性研究中,分析得出几项判断原则:
(1)研究中出现的相关概念在70%以上的访谈中得到反映
(2)新的受访者重复叙述与之前受访者相似的内容
(3)研究结果与之前的相关结论契合,并且受到相关参与人员的认可
比如10人的访谈记录出现的相关概念,在其中8人的访谈内容中就被全部包含了,且在继续访谈第11人时,发现内容与之前几乎重合,没有新的观点/概念出现,并且现在得出的相关结论,已经满足了研究需求并且得到需求方的认可,那这种情况就说明达到资料饱和了。
Hennink等(2017)在一项25人的深度访谈中,为了比较访谈顺序与资料饱和的关系,通过比较按实际访谈顺序进行的资料分析和随机访谈顺序的资料分析后发现,在第9人的访谈结束后,已经可以获取到90%左右的概念,并且有一半概念都会在第一次访谈中就提到。所以基于该项研究之前设定的90%的期望饱和度,在9人时即可以认为达到了资料饱和,后面的访谈内容大多是重复叙述。但如果需要捕获95%以上的信息,则需要访谈15人甚至更多。从实际的访谈顺序中看,从第16 人次的访谈开始,连续4人都不能提供任何新信息,这表示编码或主题的范围已经基本确定, 可以做出研究达到编码或主题饱和的判断。
关于质性研究中的“抽样”和“饱和度”
备注:将访谈资料的顺序重新随机排序并不符合质性研究的逻辑,此处采用这种比较方法是为了对资料饱和做进一步确认
之前介绍的俩项研究均为回顾性的实证分析,为了便于大家在研究过程中去判断饱和与否,我们还需要一项过程性指标,
所以学术界又提出S (Saturation)系数这一饱和概念:S (A,B)=| A∩B | / |B|
在给定的两个集合 A 和 B中,B 代表n+1个受访者的所有数据集, A 代表在 B 之前的n个受访者的数据集, 两组数据编码的交集与数据集 B 的比值即为 S 系数。比值越大代表新访谈用户得出的编码与之前集合的重复性越高。
在对同质性样本的访谈中, 深度访谈连续 3 次(焦点团体连续 2 次) S 系数达到 95%及以上可认定为达到编码饱和。比如我们在研究00后对某购物app的看法时,当我们访谈到第7名用户时,发觉该名用户描述的app优缺点都与之前用户所说接近,可以归为同类编码,这时7名用户的访谈编码库位B,前面6名用户的访谈编码库为A,S系数应为100%,连续三次S大于95%即为编码饱和。
回到我们最开始的关于样本量的问题,Hennink(2016)提到,关于在质性研究中,需要采集大量样本还是少量样本,可以参考下图加以考虑。
比如为了抓住相关主题,定义相关概念,获取稳定的编码库等情况时,采取小样本即可,但当需要发展相关理论,对比异质群体的差异,穷尽式地获取资料等情况时,则采取大样本进行探讨。
关于质性研究中的“抽样”和“饱和度”
事实上,我们在实践中可以发现,少量的样本适宜用于快速捕捉具体场景中的相关问题,如某app的可用性问题挖掘,我们一般抽样6~8人即可。

但是,在一些广泛性的研究课题中,如00后人群研究(16场座谈会共80人 by ieshahuang),2020年微信用户画像(33人访谈by zakkliu) ,我们则需要覆盖该群体中多类异质样本的丰富数据,来发展对不同类型用户群体特性的理解。

展望
文章介绍到这里就告一段落,引用陈向明教授的俩句话,希望和诸位一起在质性研究的路上走得更远:
质性研究是一个循环往返的过程(目的,情境,方法,研究方向,效度),它与量化研究各自代表着不同的世界观。
在量化研究中,我们通过大规模的抽样,控制相关变量,进行统计学检验,尝试用简单的数字来解释一个个复杂的问题;

开展质性研究,我们需要见微知著,抽丝剥茧地探讨现象背后复杂的原因,不仅观察用户的外显行为表现,更要通过多种渠道搜集资料,深挖行为背后的情境和感受 。比如在一些驾驶情境的研究,研究者通常就会采取跟车这种影随法的方式,去观察和探讨驾驶者在不同情境下的反应。这样尽管是只影随几名车主,也可能比分析数千份问卷数据在一些问题上有更深的理解。

名词注释:
编码(codes):研究者将收集到的原始资料进行初步整理分析,赋予概念类属 ;编码过程即是对资料进行分解、测验、比较、概念化与类属化的过程。
分层抽样: 将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本。从而保证样本的结构与总体的结构比较相近,从而提高估计的精度。如学生国际能力评价项目(PISA)就是采取分层抽样方式,按照人口比例和受教育程度来抽取学生参与调查。
偏差型抽样:研究者选择一些极客用户或被一般人认为是“不寻常”的用户进行调查。虽然这种情况比较极端,不具有代表性,但是就研究目的而言,对这种用户独特行为的解释有可能比一个典型现象更加具有说服力。

滚雪球抽样:滚雪球抽样是指先选择符合条件的被访者并对其实施访问,再请他们提供另外一些研究目标总体的调查对象,并逐步筛选此后的调查对象;滚雪球抽样往往用于对稀少群体的调查。

参考文献
[1]Hennink, Monique & Kaiser, Bonnie & Marconi, Vincent. (2016). Code Saturation Versus Meaning Saturation: How Many Interviews Are Enough? Qualitative Health Research. 27. 10.1177/1049732316665344. 
[2]Bowen, Glenn. (2008). Naturalistic Inquiry and the Saturation Concept: A Research Note. Qualitative Research – QUAL RES. 8. 137-152. 10.1177/1468794107085301.
[3]杨莉萍,亓立东,张博.(2022). 质性研究中的资料饱和及其判定. 心理科学进展(1-11)
[4]李文玉,涂文怡,郑静,黄小芳,刘庆华,徐小群(2020).样本量对质性研究主题与现象诠释的影响研究[J].护理学报,27(03).
[5]陈向明(2014),质的研究方法与社会科学研究,教育科学出版社.


关于质性研究中的“抽样”和“饱和度”




快乐工作,快乐生活

Happy work , Happy life


/


Join us


本篇文章来源于微信公众号: 腾讯CDC体验设计

UI/UX

福利 | 长鹅中秋限时回归!快来查收双重长长长祝福!

2022-8-31 17:30:20

UI/UX

2022 U 设计周|送你一块敲门砖?:体验思维下的行业数字化转型

2022-8-31 18:10:43

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索