智明日新申请一种基于多模态大模型的ASR音频语料的生成方法和装置专利能够生成高质量、符合特定需求且经过有效筛选的音频语料

发布时间：2025-07-24

点击次数：

智明日新申请一种基于多模态大模型的ASR音频语料的生成方法和装置专利能够生成高质量、符合特定需求且经过有效筛选的音频语料(图1)

　　金融界2025年7月18日消息，国家知识产权局信息显示，智明日新（南京）人工智能科技有限公司申请一项名为“一种基于多模态大模型的ASR音频语料的生成方法和装置”的专利，公开号CN120340506A，申请日期为2025年05月。

　　专利摘要显示，一种基于多模态大模型的ASR音频语料的生成方法和装置，涉及音频语料领域。在该方法中，将语义向量和条件向量拼接成联合向量，生成第一语音；根据场景标签从预设噪声库中选择目标噪声，将目标噪声叠加到第一语音上生成带噪声语音，注入对抗性噪声生成第二语音；对第二语音进行噪声标注、文本标注、情感标注和说话人标注，进行对齐以生成多模态标注文件；根据多模态标注文件的场景标签、噪声类型及说话人信息，设定词错误率阈值与语义相似度阈值，根据词错误率阈值与语义相似度阈值从多模态标注文件中筛选目标语料。

　　天眼查资料显示，智明日新（南京）人工智能科技有限公司，成立于2025年，位于南京市，是一家以从事研究和试验发展为主的企业。企业注册资本1000万人民币。通过天眼查大数据分析，智明日新（南京）人工智能科技有限公司专利信息1条。

　　特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

　　世卫专家最新警报：可能爆发大规模疫情！此地确诊2659例，国家疾控局派出专家组！

　　公安部分管日常工作的副部长亓延军：我国是世界上命案发案率最低、刑事犯罪率最低、枪爆案件最少的国家之一，是世界公认的最安全国家之一

　　枣庄市峄城区：“石榴花开”香溢齐鲁！枣庄峄城创新家校社协同育人体系服务

　　跨越 30 年时光，MAINGEAR 基于银昕 FLP01 卧式机箱打造复古整机

　　SK 海力士将供应 24Gb GDDR7，支持英伟达 RTX 50 SUPER 显卡规划

　　《编码物候》展览开幕北京时代美术馆以科学艺术解读数字与生物交织的宇宙节律Kaiyun官网登录入口

Kaiyun·官方网站-（中国大陆）登录入口

智明日新申请一种基于多模态大模型的ASR音频语料的生成方法和装置专利能够生成高质量、符合特定需求且经过有效筛选的音频语料