如何使用WAMI和impress.js创建声控幻灯片

How could I create a voice controlled slideshow using WAMI and impress.js?

本文关键字:创建 幻灯片 js impress 何使用 WAMI      更新时间:2023-09-26

我想使用麻省理工学院的WAMI API(或另一种语音识别API)和impress.js创建一个语音控制幻灯片。我想包括"下一页"或"返回"等简单命令。

有可能吗?我该怎么做?

stackoverflow中还有一篇文章问了一个非常相似的问题,但他们想使用谷歌的语音识别API。这个问题有一个很好的答案。

Chrome中还有一个新的Speech API可以使用。这个解决方案的问题是,你必须点击一个图标来告诉语音识别引擎(ASR)开始收听,而你的用户只能使用特定版本的Chrome。大多数解决方案的工作方式是,你必须点击图标才能从用户那里获得下一句话。因此,一旦ASR有了一个命令,它就会识别出你必须再次点击图标,告诉它再次收听。对于命令集非常有限的应用程序(即"下一步"answers"上一步"),这并没有太大的价值,因为用户可以很容易地单击"告诉"应用程序前进或后退的按钮。

看起来WAMI API允许您以编程方式启动识别过程,这是一个更好的选择。这是一个JavaScript API,您只需将其包含在网页中即可开始收听用户输入。此API的文档提供了有关如何开发多模式语音识别应用程序的良好示例。您需要学习如何开发语法,以便向语音引擎指定您在应用程序中要查找的话语。WAMI使用JSpeech语法格式。一旦您从ASR中识别出"下一张"或"上一张",您只需使用JavaScript移动到下一张或上一张幻灯片。

我会在浏览器中使用SpeechRecognition API。

要想用JavaScript实现这一点的简单方法,请查看annyang,这是一个使处理语音识别变得超级容易的库。

您可以尝试使用flash和sphinx4构建的SpeechAPIhttp://cmusphinx.sourceforge.net并且允许您从browswer中的javascript进行识别。你可以在这里找到演示和东西:

http://speechapi.com/

您可以安装自己的语音识别服务器,使用语音api源锻造项目中的服务器与flash一起工作

http://sourceforge.net/projects/speechcloud/