详细文档见:ASR 语音识别接口封装与分析
这个包主要是封装,阿里、快商通、百度、字节、腾讯和讯飞6家的短语音识别
和实时流语音识别
。
之前刚好在测试各家的语音识别相关功能,但是每家的返回值都不同,调用方式都不同,所以就封装了这么一个包。主要就是用简易工厂模式封装了一下,可以用来内部做测试。
功能方面,只是单纯的返回识别结果,实时流也是,正常是要再返回时间戳的,不过各家在时间戳上更是五花八门,就之后有空再封装。
- 添加识别结果的字级和句级时间戳
- 提供一个 web server 的调用方式
- 完善文档
- 配置接口调用的账号
有什么需求也欢迎讨论,另外,接口的app,账号需要自己去生成。