您已经成功订阅了主题
太棒了!接下来,完成付款以获得完整的专题访问权限
欢迎回来!您已经成功登录。
成功!您的帐户已完全激活,您现在可以访问所有内容。
成功!您的账单信息已更新。
账单信息更新失败。

为定性数据编码:如何为定性研究编码

Alyona Medelyan博士-自然语言处理和机器学习

你花了多少时间坐在Excel电子表格前,试图从客户反馈中找到新的见解?

你知道,问开放式的调查问题比只问客户一个数字能给你更多可行的见解净发起人得分(NPS).但当你问开放式的、自由文本的问题时,你最终会得到数百(甚至数千)个自由文本的回答。

如何将所有这些文本转化为关于客户需求和期望的可量化的、适用的信息?通过编码定性数据。

继续阅读来学习:

  • 编码定性数据意味着什么(以及为什么它很重要)
  • 定性数据编码方法不同
  • 如何手动编码定性数据以找到数据中的重要主题

什么是定性研究中的编码?

编码是标记和组织定性数据的过程,以确定不同的主题和它们之间的关系。

当编码客户反馈,你给每个回答中代表重要(和重复)主题的单词或短语贴上标签。这些标签可以是单词、短语或数字;我们建议使用单词或短语,因为它们更容易记忆、浏览和组织。

编码定性研究,寻找共同的主题和概念的一部分专题分析专题分析从文本中提取主题通过对单词和句子结构的分析。

什么是定性数据分析?

定性数据分析是检查和解释定性数据以理解其含义的过程。

定性数据定义为任何非数值和非结构化数据;在查看客户反馈时,定性数据通常指的是任何逐字记录或基于文本的反馈,如评论,调查中的开放式回答、投诉、聊天信息、客户访谈、案例记录或社交媒体帖子

例如,NPS度量可以是严格定量的,但当你问客户为什么他们给你打分时,你就需要有定性的数据分析方法来理解客户在数字答复的同时留下的评论。

定性数据分析的类型

  1. 内容分析:对定性数据进行分类、标注和专题分析。这可以包括将分析结果与行为数据为了更深入的洞察。

  2. 叙事分析:一些定性数据,如采访或实地记录可能包含一个故事。例如,选择一个产品、使用它、评估它的质量以及决定下次是否购买这个产品的过程。叙事分析有助于理解潜在事件及其对整体结果的影响。

  3. 话语分析:这是指在社会和文化背景下对人们所说的话进行分析。当你的注意力集中在建立或加强一个品牌。

  4. 框架分析:在执行定性数据分析时,有一个框架是很有用的。代码框架(用于编码定性数据的分层主题集)就是这种框架的一个例子。

  5. 扎根理论:这种分析方法从围绕单个数据案例制定理论开始。因此,该理论是建立在实际数据基础上的。然后可以检查其他案例,看看它们是否相关,并可以添加到原始理论中。

自动编码软件

的进步自然语言处理和机器学习使定性数据的分析自动化成为可能,特别是内容和框架分析

虽然人工分析仍然很受欢迎,因为它被认为是高精度的,自动化分析正在迅速成为首选。与人工分析不同,人工分析容易产生偏差,而且不能根据今天生成的定性数据量进行调整,自动化分析不仅更一致,因此更准确,而且还可以节省大量的时间和金钱。

自动编码定性数据最常用的软件是文本分析软件主题

为什么编码定性数据很重要?

对定性数据进行编码可以更容易地解释客户反馈。为每个回答中的单词和短语分配代码有助于捕获回答的内容,进而帮助您更好地分析和总结整个调查的结果。

研究人员使用编码和其他定性数据分析过程来帮助他们根据客户反馈做出数据驱动的决策。当您使用编码来分析客户反馈时,您可以量化客户语言中的常见主题。这使得准确解读和分析客户满意度更加容易。

定性数据的自动编码与手动编码

定性数据的编码方法分为自动编码和手工编码两大类。

您可以用。自动化定性数据的编码专题分析软件.专题分析和定性数据分析软件使用机器学习,人工智能(AI),自然语言处理(NLP)编码定性数据并将文本分解为主题。

主题分析软件是自主的,这意味着…

  • 你不需要提前设置主题或类别。
  • 你不需要训练算法——它会自己学习。
  • 您可以轻松地捕捉“未知的未知”,以确定您自己可能没有发现的主题。

所有这些都将为你在分析客户反馈时节省时间(和许多不必要的头痛)。

企业也看到了使用主题分析软件的好处,这些软件能够充当单一数据源,帮助打破数据竖井,统一整个组织的数据。这现在被称为统一数据分析。

什么是专题编码?

主题编码,又称主题分析,是一种定性数据分析,通过分析词语的含义和句子结构来发现文本中的主题。

例如,当您使用主题编码来分析客户反馈时,您可以了解反馈中最常见的主题是什么。这可以帮助你准确、可操作地理解是什么驱动着客户满意度。

要了解专题分析软件如何帮助您自动化数据编码过程的更多信息,查看这篇文章

如何手动编码定性数据

在本文的其余部分,我们将重点介绍手工编码。不同的研究人员有不同的过程,但手工编码通常是这样的:

  1. 选择使用演绎编码还是归纳编码。

  2. 通读你的数据,了解它的样子。分配您的第一组代码。

  3. 逐行检查数据,尽可能多地编写代码。在这一步,您的代码应该变得更加详细。

  4. 对代码进行分类,并找出它们如何适合您的编码框架。

  5. 找出出现频率最高的主题,然后采取行动。

让我们进一步分解一下……

演绎编码与归纳编码

在开始定性数据编码之前,您需要决定将使用哪些代码。

什么是演绎编码?

演绎编码意味着从一组预定义的代码开始,然后将这些代码分配给新的定性数据。这些代码可能来自以前的研究,或者您可能已经知道您感兴趣的分析主题。演绎编码也被称为概念驱动编码。

例如,假设你正在进行一项调查客户体验.您希望了解由较长的呼叫等待时间引起的问题,因此您选择在开始查看数据之前将“等待时间”作为代码之一。

演绎方法可以节省时间,并有助于确保您感兴趣的领域得到编码。但你也需要注意偏见;当你开始使用预定义的代码时,你会对答案有偏见。确保你不会因为过于专注于证明自己的假设而错过其他重要的主题。

什么是归纳编码?

归纳编码,也称为开放编码,从头开始,基于定性数据本身创建代码。你没有固定的码本;所有的代码都直接来源于调查的回答。

以下是归纳编码的工作原理:

  1. 将定性数据集分解为更小的样本。
  2. 读取数据的示例。
  3. 创建将覆盖示例的代码。
  4. 重新阅读示例并应用代码。
  5. 读取新的数据样例,应用为第一个样例创建的代码。
  6. 注意哪些代码不匹配,哪些地方需要额外的代码。
  7. 根据第二个示例创建新代码。
  8. 回去重新编码所有的回复。
  9. 重复第5步,直到编写完所有数据。

如果您添加了新的代码,将现有的代码一分为二,或者更改了代码的描述,请确保检查此更改将如何影响所有响应的编码。否则,相同的回答在调查的不同点可能会以不同的代码结束。

听起来工作量很大,对吧?归纳编码是一个迭代过程,这意味着它比演绎编码花费更长的时间和更彻底。但它也让您对整个数据的主题有一个更完整、更公正的看法。

用编码帧对代码进行分类

一旦创建了代码,就需要将它们放入编码框架中。编码框架代表研究中主题的组织结构。有两种类型的编码框架:扁平的和分层的。

平面编码帧

一个平面编码帧为每个代码分配相同级别的专一性和重要性。虽然这可能感觉像是手工编码的一种更简单、更快的方法,但当您创建越来越多的代码时,组织和导航主题和概念可能会变得困难。这也使得人们很难确定哪些主题是最重要的,从而减慢了决策的速度。

分层编码框架

分层框架帮助您根据代码之间的关系组织代码。例如,你可以根据客户对某个主题的感受来组织代码:

分层编码框架示例
分层编码框架示例

在这个例子中:

  1. 顶层代码描述主题(客户服务)
  2. 中层代码指定情绪是积极的还是消极的
  3. 第三层详细描述与主题相关的属性或特定主题

分层框架支持更大的代码框架,并允许您根据组织结构组织代码。它还允许在代码中使用不同级别的粒度。

无论您的代码框架是分层的还是扁平的,您的代码框架都应该是灵活的。手动分析调查数据需要大量的时间和精力;确保你可以在不同的上下文中使用你的结果。

例如,如果你的调查询问客户对客户服务的看法,你可能只使用那些获取有关客户服务的答案的代码。然后你意识到同样的调查回复有很多关于你公司产品的评论。为了更多地了解人们对您的产品的评价,您可能必须从头编写所有的响应!一个灵活的编码框架涵盖了不同的主题和见解,这允许您稍后重用结果。

编码定性数据的技巧

现在,您已经了解了编码定性数据的基本知识,下面是一些如何充分利用定性研究的建议。

使用码本来跟踪您的代码

随着编码的数据越来越多,想一下子记住所有的代码是很困难的。在代码本中跟踪代码可以帮助您在整个数据分析过程中保持条理。代码本可以像Excel电子表格或文字处理器文档一样简单。在编写新数据时,向代码本中添加新代码,并根据需要重新组织类别和主题。

确保跟踪:

  • 用于每个代码的标签
  • 代码所引用的概念或主题的描述
  • 最初是谁写的
  • 最初编码或更新的日期
  • 在您的分析中,关于代码如何与其他代码关联的任何注释

如何创建高质量的代码——4个技巧

1.涵盖尽可能多的调查回应。

代码应该足够通用,可以应用于多个注释,但又足够具体,可以在分析中发挥作用。例如,“Product”是一个宽泛的代码,涵盖了各种各样的响应——但它也相当模糊。产品怎么样?另一方面,“产品在使用3小时后停止工作”是非常具体的,可能不适用于许多回答。“产品质量差”或“产品寿命短”可能是一个中庸之道。

2.避免共性。

只要它们用于不同的目的,使用相似的代码是可以的。“客户服务”和“产品”彼此之间有足够的区别,而“客户服务”和“客户支持”可能有细微的区别,但应该组合成一个代码。

3.抓住积极和消极的一面。

试着创建相互对照的代码,分别跟踪主题的积极和消极因素。例如,“有用的产品功能”和“不必要的产品功能”将是两个不同的代码来捕获两个不同的主题。

4.减少数据-到一个点。

让我们看看两个极端:有多少响应就有多少代码,或者每种代码适用于每一个响应。在这两种情况下,编码练习都是毫无意义的;你不会学到任何关于你的数据或你的客户的新东西。为了使您的分析尽可能有用,尝试在过多和过少的代码之间找到一个平衡。

根据主题进行分组,而不是措辞

确保将具有相同主题的回复分组在相同的代码下,即使它们使用的不是完全相同的措辞。例如,像“清洁度”这样的代码可以覆盖包括以下单词和短语的响应:

  • 清洁
  • 整洁
  • 尘土飞扬的
  • 看起来像个垃圾场
  • 能在地板上吃东西吗

只有少数代码和分层结构使得将不同的单词和短语分组到一个代码下更容易。如果你有太多的代码,特别是在平面框架中,你的结果可能变得模糊,主题可能重叠。手动编码还要求编码员记住或能够找到所有相关的代码;您拥有的代码越多,就越难找到所需的代码,无论您的代码本是如何组织的。

把准确性放在首位

手工编码定性数据意味着编码人员的认知偏差会影响编码过程。对于每一项研究,确保你有编码指南和培训到位保持编码的可靠性、一致性和准确性

需要注意的一件事是定义漂移,当数据集开头的数据与后面的材料编码不同时,就会发生定义漂移。检查整个数据集的定义漂移,并记录代码如何在结果中变化的描述。

如果你在一个团队中有多个程序员,让他们检查彼此的代码,以帮助消除认知偏差。

结论:定性数据编码的6个主要要点

下面是手工编码定性数据的最后6个要点:

  1. 编码是标记和组织定性数据以确定主题的过程。在对定性数据进行编码之后,您可以像分析数值数据一样分析它。

  2. 归纳编码(没有预定义的代码帧)比演绎编码更困难,但不容易产生偏差。

  3. 代码框架可以是扁平的(更容易和更快地使用),也可以是分层的(更强大和有组织)。

  4. 您的代码框架需要足够灵活,以便您能够充分利用结果并在不同的上下文中使用它们。

  5. 在创建代码时,要确保它们涵盖多个响应,相互对比,并在过多和过少的信息之间取得平衡。

  6. 一致的编码=准确性。建立编码程序和准则,并注意定性数据分析中的定义偏差。

更多细节请参考我们的下载指南

如果你已经走了这么远,你可能会对我们的免费指南感兴趣:分析开放式问题的最佳实践。

该指南包含了本文中涉及的一些主题,并深入了一些更小众的细节。

如果你有问题,你可以问请在这里联系我们。

如果您是一个希望将定性编码过程自动化的企业,那么您可以这样做尝试主题

编码快乐!

准备好从反馈中扩展客户洞察了吗?

我们的专家将向您展示theme是如何工作的,它分析什么反馈数据,以及如何使用反馈来做出以数据为导向的决策。要了解如何充分利用专题,请今天申请个人演示。

最近的帖子

如何使用专题分析软件对定性数据进行专题分析
如何使用专题分析软件对定性数据进行专题分析
成员 公共

如果您曾经分析过客户反馈,您就会知道最困难的部分是创建一个完美的代码框架。您需要理解数据集、涉及的涉众以及理想的分析结果。在确定解决方案之前,您必须进行迭代

Ai和NLP
如何超级充电您的Qualtrics设置与专题和动力BI
如何超级充电您的Qualtrics设置与专题和动力BI
成员 公共

Qualtrics是最知名和最强大的客户反馈管理平台之一。但即便如此,它也有局限性。我们最近举办了一个现场讨论会,来自两个知名品牌的数据分析师分享了他们使用Qualtrics的经验,以及他们如何扩展这个平台的功能。下面,我们来分享一下

客户体验
我们如何使用自己的平台和Chrome扩展来集中和分析反馈
我们如何使用自己的平台和Chrome扩展来集中和分析反馈
成员 公共

客户反馈并不是所有的答案。但它对战略和优先排序有重要的见解。Thematic是一家B2B SaaS公司。我们并没有沉浸在反馈中。每一条反馈都很重要。收集和分析这些反馈需要一种不同的方法。我们收到来自许多地方的反馈:*我们的产品内NPS

反馈分析