谋智基金会邀请你参与开源语音数据库项目贡献自己的声音
语音识别技术正在改变我们与机器进行交互的方式,不过目前可供使用的系统都相当昂贵并且是专有的技术。
为此谋智基金会(Mozilla)目前已经推出 Common Voice 项目,旨在让语音识别技术变得更好也能免费使用。
项目依靠全球用户捐赠的语音数据库可以让任何人或开发者快速轻松地训练出能够识别任何语音的应用程序。
此外作为配套设施谋智基金会还在构建名为 Deep Speech 的开源语音识别引擎且同样是为所有人免费使用。
为什么项目如此重要:
对于人类来说说话依然还是我们相互沟通最自然的方式,而语音技术将这种方便感带到计算机和移动设备上。
谋智基金会希望开发者能够打造效果极好的语音识别程序,比如实时翻译器和语音数字助理类应用程序等等。
但此时大多数打造这类应用所必须的语音数据都是私有且昂贵的,我们希望收集的数据能够满足开发者需求。
项目地址:
贡献语音:https://voice.mozilla.org/zh-CN/speak 判断语音:https://voice.mozilla.org/zh-CN/listen
需要你贡献中文语音集:
现在谋智基金会正在全球发起号召邀请用户参与项目构建,用户只需按示例读出屏幕上的文字进行提交即可。
目前中文语音集也在收集中,如果你觉得你的口音不标准也没关系,语音识别也需要不同的口音来加强判断。
与英语系相比国内目前参与项目的用户并不多,所以需要更多用户录制语音为项目提供足够使用的中文语音。
也可以帮助进行人工识别:
如果你不想录制自己的语音的话也可以参与项目,将其他社区成员贡献的语音进行人工识别判断是否准确等。
目前中文语音集也已经有不少语音片段,单纯靠机器识别的准确率并没有那么高,所以需要你帮助辅助判断。
只需要前往项目网站播放语音片段然后与对应的文字内容核对即可,判断完成后点击是或者否提交判断结果。