如何使用WAMI和impress.js创建声控幻灯片

How could I create a voice controlled slideshow using WAMI and impress.js?

本文关键字：创建幻灯片 js impress 何使用 WAMI 更新时间：2023-09-26

我想使用麻省理工学院的WAMI API（或另一种语音识别API）和impress.js创建一个语音控制幻灯片。我想包括"下一页"或"返回"等简单命令。

有可能吗？我该怎么做？

stackoverflow中还有一篇文章问了一个非常相似的问题，但他们想使用谷歌的语音识别API。这个问题有一个很好的答案。

Chrome中还有一个新的Speech API可以使用。这个解决方案的问题是，你必须点击一个图标来告诉语音识别引擎（ASR）开始收听，而你的用户只能使用特定版本的Chrome。大多数解决方案的工作方式是，你必须点击图标才能从用户那里获得下一句话。因此，一旦ASR有了一个命令，它就会识别出你必须再次点击图标，告诉它再次收听。对于命令集非常有限的应用程序（即"下一步"answers"上一步"），这并没有太大的价值，因为用户可以很容易地单击"告诉"应用程序前进或后退的按钮。

看起来WAMI API允许您以编程方式启动识别过程，这是一个更好的选择。这是一个JavaScript API，您只需将其包含在网页中即可开始收听用户输入。此API的文档提供了有关如何开发多模式语音识别应用程序的良好示例。您需要学习如何开发语法，以便向语音引擎指定您在应用程序中要查找的话语。WAMI使用JSpeech语法格式。一旦您从ASR中识别出"下一张"或"上一张"，您只需使用JavaScript移动到下一张或上一张幻灯片。

我会在浏览器中使用SpeechRecognition API。

要想用JavaScript实现这一点的简单方法，请查看annyang，这是一个使处理语音识别变得超级容易的库。

您可以尝试使用flash和sphinx4构建的SpeechAPIhttp://cmusphinx.sourceforge.net并且允许您从browswer中的javascript进行识别。你可以在这里找到演示和东西：

http://speechapi.com/

您可以安装自己的语音识别服务器，使用语音api源锻造项目中的服务器与flash一起工作

http://sourceforge.net/projects/speechcloud/