语音识别除了衡量语音识别的准确度之外,另外一个重要的指标就是处理的速度和延迟。其中RTF为衡量实时语音识别处理速度的重要指标,RTX为衡量离线语音识别处理速度的重要指标。
1 RTF
RTF(Real Time Factor),为实时语音识别的处理速度评价指标,其计算公式如下
即给定1秒时长的音频,语音识别需要花多长时间,这个比例小于1才能达到实时识别语音的效果,RTF指标越小越好。
RTF为1表示用户一说完话就能出识别结果(前提是忽略假设录音实时的传给语音识别系统,时间情况很多时候是在服务器端进行解码的,因此会有网络的延迟);RTF大于1就表示话说完了,系统还得再处理一段时间;RTF小于1表示识别速度比说话速度快,这样万一有网络延迟,它还能追上来。
2 RTX
RTX(Real Time X),为离线语音识别处理速度评价指标,其计算公式如下
即在1秒时间内,语音识别模型可以处理多长时间的音频,RTX指标越大越好。
参考
本文作者:StubbornHuang
版权声明:本文为站长原创文章,如果转载请注明原文链接!
原文标题:语音识别的RTF和RTX评价指标
原文链接:https://www.stubbornhuang.com/2873/
发布于:2023年10月30日 10:57:41
修改于:2023年10月30日 10:58:14
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
评论
52