首页 > 科技快讯 > 能实现说话人分离和内容摘要,音视频转文字软件「魔音助手」要深耕会议场景

能实现说话人分离和内容摘要,音视频转文字软件「魔音助手」要深耕会议场景

「魔音助手」是一款音视频转文字的效率工具,可以帮助企业做语音、视频会议记录,有会议内容检索,自动会议摘要和音视频编辑等功能。适合学习、会议、采访等场景。

魔音助手不止能完成对语音内容的速记。在魔音助手软件中,用户可以录制会议声音或视频,软件能自动生成文字内容并分辨不同的说话人。被提到的文字用光标显示,用户可以根据文字的时间点做简单的剪辑工作。此外,魔音助手有文本搜索功能和自动摘要功能,方便用户选取录音核心内容,进行会议复盘。

据前瞻研究院数据,2018年我国的智能语音产业市场规模为48.6亿元,之后每年市场规模增长率都超过25%,预测2021年将突破100亿元的市场规模。这一产业拥有较好的市场前景。而且,由于疫情爆发,人们逐渐适应智能办公学习。魔音助手团队认为语音、视频会议是新的市场机会,从今年2月开始开发针对工作学习场景的转录软件。

在语音识别准确率方面魔音助手搭建了云端自训练模型,训练数据大多是公开会议、学习课程、语音会议等特定场景,专门为工作和学习场景定制,识别率高。市面上的录音转文字记录工具大多使用通用模型,需要适应各种场景,缺少针对性。此外,魔音助手运用个性化语音识别引擎(PASA),能为每个账号能形成不同的语音模型结构,自适应学习用户常用的专业术语和口音,在用户校对的过程中变得更智能。随着用户的不断使用,识别准确度会越来越高。

魔音助手的转录可以实现说话人分离的功能。采用的声纹技术能将每个声音转换为固定维度的声纹向量,实现声纹比对。在行业中,人声识别是一个交叉学科,需要声纹识别、语义识别等算法共同实现,技术壁垒高,因此市场上拥有这一功能的语音转文字工具较少。魔音助手将声纹识别与语义内容结合,对说话人的识别正确率可以到达70%-80%。另外,魔音助手采用的自然语言处理模型可以理解语义并对文本纠错,自动修改病句和口误,提高文本可读性。

在辅助功能方面,魔音助手可以实现语义提取,通过分析上下文关联信息自动提取会议摘要。另外,魔音助手支持转录文本搜索功能,可以搜索文本内容定位语音位置。魔音助手还能实现视频语音转录,为视频生成字幕。用户可以根据字幕内容编辑对应视频。

目前,魔音助手的收入主要来自于企业付费。产品目前为个人用户免费。未来,魔音助手可能推出个人付费会员版本,为个人会员用户提供实时转录等专属功能。目前团队技术人员有十几人左右。创始团队成员来自于豌豆荚、快手、会小二等互联网企业,均拥有产品与企业服务经验。AI技术骨干来自于科大讯飞、中科院、百度、字节跳动等一线机构。

各大互联网公司也发现了这一市场机遇,在线上会议记录功能上发力。11月18日,飞书在“2020飞书未来无限大会”上推出了“飞书妙记”功能,能够生成会议语音文字稿、区分说话人、拥有搜索和摘要提取功能。

面对线上会议的市场热度,魔音助手表示自己是一个开放式软件,愿意与在线办公、在线学习平台成为合作伙伴。

 

相关推荐

能实现说话人分离和内容摘要,音视频转文字软件「魔音助手」要深耕会议场景
视觉语音双重验证定位会议发言人,「庄生晓梦」要以智能会议终端切入远程会议市场
从会议到会展,从线下到线上,科大讯飞的AI深耕再布局
“隔屏交流”促音视频设备销量增长,「时代拓灵」推出直播、会议、在线教育多场景智能麦克风
36氪首发 | 「庄生晓梦」完成数百万元Pre-A轮融资,投资方为浩方创投
为啥你的机器人女友说话不像斯嘉丽约翰逊?
百度在线办公软件新功能:一场会议支持520人参与
利用NLP技术提升会议效率,「Notta meeting」想提供会议全流程的SaaS产品
云会议:第四空间争夺战
36氪首发 | 面向企业的音视频智能生产云平台,OnVideo 获 1500 万元 A 轮融资

网址: 能实现说话人分离和内容摘要,音视频转文字软件「魔音助手」要深耕会议场景 http://m.xishuta.com/newsview34691.html