语音输入工具：IBM ViaVoice（图）

【明慧网2004年10月22日】语音输入软件IBM ViaVoice专业版可以实现语音输入，这个软件语音识别正确率比较高。买一个质量好的麦克风可提高语音识别正确率。可以通过互联网搜索到下载地址。下面转载两篇说明文章。

语音输入的利器ViaVoice 8.0

在购买笔记本电脑时，得到一款IBM ViaVoice 8.0专业版软件。久闻大名，忍不住立刻试一把。在Windows系统下，长期以来，我们是通过鼠标或键盘向计算机发出各种命令。IBM ViaVoice使我们改变了传统模式，转而用语音向计算机发出命令、录入汉字、标点符号。真可谓“君子动口不动手”。

* 创建语音模型

程序安装完成后会自动转入测试并设置麦克风和音频系统。目的是测试机器的语音输入系统，就是说系统需要检测机器的声音I/O设备及识别您的口音以建立针对某一用户的语音模式。这一步非常重要，它关系到今后用户语音输入的准确率。

注意：在创建语音模式时，ViaVoice会请您选择一篇文章进行朗读，并告诉您这篇文章的语句数、朗读所需要的时间、(分析)处理所需要的时间(如图1)。如果系统认为您的朗读符合要求，则录音成功。接下来是进行语音分析处理或继续朗读。继续朗读可以使系统对更多的数据加以分析，让ViaVoice尽可能地了解您的语音以保证较高的识别率。

* 要注意以下问题:

音频设置的问题

1、您必须成功地在音频向导程序的引导下完成设置；
2、ViaVoice要求声卡的驱动程序是最新的；
3、尽可能用质量好的麦克；
4、确认声卡没有设置如full-duplex或3-D等特殊效果，否则需要关闭。

图1

语音识别率的问题
1、语速要适中，语句要流畅；
2、正确佩戴头戴式麦克风。朗读时不要将海绵套拿走，它可以起过滤作用。将麦克风置于距嘴角大约2厘米的位置。不要改变麦克风拾音头的位置也不要触摸海绵套或拾音头；
3、如果室内有不寻常的背景噪音请等待，直至噪音恢复到平常状态再对文章进行录音。在语音设置时，笔者感到ViaVoice对声音的输入/输出设备(即麦克和声卡)要求比较严格。

* 功能简介

ViaVoice的功能是在称之为“语音中心”的选项下，通过一个下拉式菜单来实现的(如图2)。

图2

1、听写输入

在程序组中，启动“IBM ViaVoice语音中心”项，激活(打开)麦克风，选择“听写到语音板”或“听写到Microsoft Word”即可进入语音板或Word进行文稿的输入。对于这种输入方法，其实我们最关心的是它的准确率。本文就是用该软件完成的，识别率约85%左右。注意：使用IBM ViaVoice输入文稿时，要习惯于读出标点符号(如图3)。

图3

2、命令导航

命令导航是ViaVoice语音系统通过声音来指挥你的计算机工作。例如：“网上冲浪”即启动Internet Explorer；“回收站”，即打开回收站的窗口等等。实际应用证明：在桌面上用中文命名的程序，更适合该软件的命令导航。

让计算机“听懂”人的语言这确是一件非常有趣的事情。然而，由于汉语中同音字等原因，这个软件还不能彻底解决全部识别的问题。尽管如此，一篇文稿有80%～90%的文字可以用语音输入来完成，解放了双手，也是一件幸事。

让IBM ViaVoice听清每一个字

语音输入软件有好多种，比如IBM ViaVoice、汉王读听写、畅言2000等，本人使用的是IBM ViaVoice。IBM ViaVoice是一个正确率很高的语音识别产品，如果ViaVoice不能识别您所说的话或者识别的正确率不高，您可以按照如下步骤找出问题所在并解决。

* 用户名要正确

用错误的用户名听写将导致很差的识别率。要选择您的用户名，单击“开始/程序/IBM ViaVoice/工具/ViaVoice选项”，弹出如图所示窗口，然后单击用户标签，在“用户为”下拉列表框中选择您的用户名，最后单击[确定]。如果是一个新用户，必须先添加，方法是单击[增加用户]，在增加用户的向导下一步一步完成添加工作。

* 麦克风不能混用

应该使用随ViaVoice软件提供的麦克风。要注意的是，麦克风不能混用，因为不同的麦克风的灵敏度及识别率都不一样。

* 设备的连接

麦克风或音频设备是否正确地连接到了计算机上？将麦克风插入“MIC IN”孔，扬声器插入“SPEAKER ”孔。正确连接好后，运行音频设置程序来确认麦克风或音频输入设备的连接是否正确。

* 麦克风的戴法

将麦克风的接收头置于嘴角（不要正对着嘴部），并留有大约一个拇指的距离。讲话时嘴角必须对着麦克风接收头带白点的那一面。不要让麦克风擦到胸的皮肤或脸部头发。

* 声音系统设置

声音系统设置正确是保证语音识别率的重要因素。如果麦克风定位正确并且音频设置完毕，在您语音输入时，语音中心的音量指示器会显示绿色。红色表示输入音量过高，黄色则表示输入音量过低。每次改变麦克风或音频设备之后，都要重新运行音频设置程序，以达到最佳的输入效果。运行音频设置程序，单击“开始/程序/IBM ViaVoice/工具/音频设置”，然后按照屏幕指示进行设置。

* 发音清晰流畅

这是决定输入正确率的一个比较重要的因素，因为ViaVoice 是根据词与词之间的联系进行识别的，如果在听写时词间或者句子中有不必要的停顿，会使听写的正确率大打折扣。

* 口音适应训练

口音适应是提高正确率的前提条件。如果您的口音不重，您可以对最小数量的语句（50句）进行口音适应；如果有很重的口音，则需要完成所有语句的录音。对所有语句进行录音后，一定要通过运行口音适应的训练阶段，让ViaVoice熟悉您的发音方式来最终完成口音适应过程。同时，要确定训练期间没有其他程序同时运行。如果口音适应过程中出现许多红色句子，在“口音适应选项”中改变“词/音匹配设置”可能会有所帮助。如果您有很多语句没有识别出，请将滑动块移至更靠近“近似处”。完成口音适应信息的训练后，重新听写一下样例文本，您会发现您的识别率得到了改进。

语音输入工具：IBM ViaVoice（图）

Advertisement

Advertisement

Advertisement

Advertisement

Advertisement

Advertisement

Advertisement

Advertisement

Advertisement