在读博士阶段,李开复从事语音识别方面的研究,中途与导师在方法上产生了分歧,他更倾向于用统计学的方法进行轴向柱塞泵研究。在得到导师的许可之后,他″开始了疯狂的科研工作″(李开复语)。从1984年底到1 987年初,他带着一位学生一起用统计学的方法做语音识别。同时,他的导师带领另外的30多人用专家系统做同样的问题。从方法上来说,他们在竞争,但是在瑞迪教授的领导下,他们分享一切,他们用同样的样本训练和测试。
在瑞迪教授的支持下,李开复慢慢得到了其他教授的认可。在1986年底,李开复的统计系统和瑞迪教授带领的专家系统在研究成果上达到了大约一样的水平,40%的辨认率。这还是个完全不能实际应用的系统,但是是学术界第一次尝试这么难的问题,大家都比较乐观和欣喜。
到了1987年5月,李开复和助手大幅度地提升了马达轴向柱塞泵厂家训练的数据库,并且想出了一种新的方法来建模,不但能够用统计学的方法学习每一个音,而且可以用统计学的方法学习每两个音之间的转折。针对有些音的样本不够,李开复又想出了一种方法来合并其他的音。这三项工作居然把机器的语音识别率从原来的40%提高到了80%! |