第1部分:如何建立一个文本分析的解决方案在10分钟
很长一段时间,我一直在计划写一篇澄清什么是可能的文本分析。在我的职业生涯中,我和很多人正在经历的痛苦分析文本,试图找到一个解决方案。
一些试图重新发明轮子从头开始编写自己的算法,还有人认为,谷歌和IBM api是救世主,其他人又坚持技术从90年底的,供应商“先进的文本分析。”
所以,我决定发表一系列文章,深入挖掘5最常见的文本分析方法和检查他们的优点和缺点。
介绍词发现:如何在Excel或DIY Python
让我们先从词识别。首先,这不是一个东西!
自然语言处理的学术社区不注册这种方法,理当如此。事实上,在学术界,词识别指手写识别(发现这词一个人,医生也许写了)。
也有关键字识别,重点是语音处理。
但据我所知,词定位并不是一个用于任何类型的文本分析。
但是我听说足够频繁在会议上包括综述。喜欢DIY分析师和Excel向导,是一种受欢迎的方法在许多客户的专业见解。
文本词发现背后的主要思想是:如果一个词出现在文本,我们可以假设这段文字是“关于”这个词。例如,如果这样的词“价格”或“成本”中提到的审查,这意味着这个评论是关于“价格”。
美丽的词识别方法是它的简单。
您可以实现单词定位在不到10分钟的Excel电子表格。
或者,您可以编写一个脚本在Python或r .的。
如何构建一个文本分析的解决方案在10分钟内
你可以输入一个公式,这样,在Excel中对评论进行分类成“账单”,“定价”和“易用性”:
瞧!
这是应用于净推荐值的一项调查,列B包含开放式问题的答案“你为什么给我们这个分数”:
也许我花了不到10分钟创建这个,结果是如此鼓舞人心!但是等等…
点击这里下载我们的免费自助电子表格模板编码和调查数据的分析。
每个人都喜欢简单。但在这种情况下,简单很糟糕
这种方法很容易出现的各种问题。
在这里,我已经注释给你。
当发现是好的
你可以想象一下上面的公式可以进一步调整。事实上,我已经跟公司手工大规模定制的电子表格和非常满意的结果。
如果你有一个数据集的几百反应你只需要分析一次或两次,您可以使用这种方法。如果小数据集,您可以回顾结果,确保高精度很快。
当单词定位失败
至于缺点吗?请不要使用单词定位:
- 如果你有大量的数据,超过几百反应
- 如果你不会有时间审查和纠正每一块文本的准确性
- 如果你需要可视化结果(Excel会听到你说脏话)
- 如果你需要与你的同事分享结果
- 如果你需要保持数据一致
也有许多其他缺点DIY单词定位,下一篇文章我们将讨论。我还将讨论什么实际工作,是一个很好的方法。
这就是现在,当心第2部分,即将来临!
第2部分是生活!手册规定,另一个文本分析方法。
不想做你自己吗?
文本挖掘在excel中浪费时间,如果你有大量的数据很快就变得很难处理。幸运的是,有人工智能文本分析解决方案这可以在你的文本自动找到主题!
主题其中一个解决方案,你可以开始使用一个免费试用帐户。