当马克·长谷川-约翰逊梳理他的最新项目数据时,他惊喜地发现了佛罗伦萨鸡蛋的食谱。他说,筛选数百小时的录音演讲将挖掘出一两件宝藏。
长谷川-约翰逊领导着伊利诺伊大学厄巴纳-香槟分校的“语音无障碍项目”,该项目旨在让语音识别设备对有言语障碍的人士更有用。
在该项目首次发表的研究中,研究人员要求自动语音识别器聆听 151 小时(几乎六天半)的帕金森病相关言语障碍患者的录音。他们的模型转录了一组新的类似录音,准确率比没有听过帕金森病患者录音的对照模型高出 30%。
这项研究发表在《言语、语言和听力研究杂志》上。研究中使用的语音记录可供研究人员、非营利组织和希望改进语音识别设备的公司免费使用。
“我们的研究结果表明,大型非典型语音数据库可以显著改善残疾人的语音技术,”伊利诺伊大学电气与计算机工程学教授、该项目所在大学贝克曼高级科学技术研究所研究员 Hasegawa-Johnson 表示。“我期待看到其他组织将如何使用这些数据,使语音识别设备更具包容性。”