首页 > 科技快讯 > 科大讯飞申请弱监督数据生成专利,提升了预测的伪标签的质量

科大讯飞申请弱监督数据生成专利,提升了预测的伪标签的质量

本文源自:金融界

金融界2024年1月3日消息,据国家知识产权局公告,科大讯飞股份有限公司申请一项名为“弱监督数据生成方法、语音识别模型训练方法及相关设备“,公开号CN117334185A,申请日期为2023年11月。

专利摘要显示,本申请公开了一种弱监督数据生成方法、语音识别模型训练方法及相关设备,在获取到现网无监督音频数据及其现网识别结果后,利用至少两种不同类型的语音识别模型,分别对现网无监督音频数据进行识别,根据每条现网无监督音频数据的现网识别结果、各类型语音识别模型的识别结果,筛选识别结果满足设定一致性要求的音频数据,将该一致的识别结果作为筛选后的音频数据的伪标签,得到弱监督数据。本申请无需多轮迭代训练模型,能够利用多种不同类型语音识别模型对识别结果进行交叉验证,避免陷入单一模型局部最优使得模型对识别结果过度自信,提升了预测的伪标签的质量,可以快速生成具有高质量伪标签的弱监督数据,进而训练性能更优的语音识别模型。

发布于:北京

相关推荐

科大讯飞申请占据标签生成方法专利,可以生成准确度较高的占据标签
海康威视申请标签生成技术专利,可以生成无标签数据有效的标签
让科大讯飞一天蒸发120亿的“数据投毒”是啥?
科大讯飞脑智测评舱可测多模态数据科大讯飞脑智测评舱专利获授权
科大讯飞,“硬”啃 AI
最前线 | 科大讯飞智能办公本Air正式发布,售价2799元起
大模型混战:科大讯飞不能输的一战
科大讯飞财报中的几个疑惑点
遭科大讯飞“打假” ,云知声还能顺利IPO吗?
从深股通减持,看科大讯飞的“另类周期性”

网址: 科大讯飞申请弱监督数据生成专利,提升了预测的伪标签的质量 http://m.xishuta.com/newsview103978.html

所属分类:行业热点