部分语音识别

Partial voice recognition(部分语音识别)
本文介绍了部分语音识别的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我目前正在使用微软的语音引擎进行语音识别。 它在C#中的设置和使用非常简单,并且允许使用比我最初想象的更少的代码行来实现伟大的目标。 现在的问题是,我真的不知道该如何处理: 我知道,引擎需要开始监听,然后你说一个词或一个句子,它会在词典中进行比较,看看是否能找到匹配。如果是这样,程序将执行您希望它执行的任何操作。

让我摸不着头脑的是,我想让引擎"检测"他的词典中的单词,在包含一个或所有这些单词的完整随机短语中。 例如,我们假设词典包含以下单词: -"阅读" -"新闻"

我想要编写一些代码,每当我说以下内容时都能检测到这些特定的单词: --《给我读新闻》 --"你能看新闻吗?" -"阅读新闻"...

如何实现此目标?

推荐答案

此功能称为关键字定位。通常不能使用语音识别引擎进行关键词定位,需要特定的定位包。关键问题是引擎应该不断地比较两个结果-找到单词和找不到单词。语音识别只查找语法中的单词,而不考虑其他声音。发现只需要不同的算法。

有一种解决方法可以将许多可能的音节或其他声音添加到语音识别语法中,并希望引擎将找到它们而不是关键字,但与特定的关键字识别器相比,这不是一个非常好的解决方案。

如果您与微软的引擎没有紧密联系,并且您需要一种通用语言,如美国英语或法语,您可以使用CMUSphinx之类的语音识别开源软件工具包来实现关键字识别。

这篇关于部分语音识别的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!

本站部分内容来源互联网,如果有图片或者内容侵犯您的权益请联系我们删除!

相关文档推荐

DispatcherQueue null when trying to update Ui property in ViewModel(尝试更新ViewModel中的Ui属性时DispatcherQueue为空)
Drawing over all windows on multiple monitors(在多个监视器上绘制所有窗口)
Programmatically show the desktop(以编程方式显示桌面)
c# Generic Setlt;Tgt; implementation to access objects by type(按类型访问对象的C#泛型集实现)
InvalidOperationException When using Context Injection in ASP.Net Core(在ASP.NET核心中使用上下文注入时发生InvalidOperationException)
LINQ many-to-many relationship, how to write a correct WHERE clause?(LINQ多对多关系,如何写一个正确的WHERE子句?)