钉钉与通义实验室推出行业定制语音识别大模型 Fun-ASR
8 月 22 日,钉钉与通义实验室语音团队联合发布新一代语音识别大模型 Fun-ASR。该模型可准确识别装修、畜牧等十大行业的专业术语,并支持企业专属模型的定制训练。依托深度合作,Fun-ASR 能够高效转写各类语音信号,具备多行业术语理解、多语言口音识别及上下文语义推理能力。
目前,Fun-ASR 已集成至钉钉会议字幕与同传、智能纪要、语音助手等功能模块,致力于构建稳定、高效且易扩展的语音识别基座,特别适用于对语境理解与识别准确率要求较高的企业场景。
核心技术亮点:三大能力支撑高精度识别
Fun-ASR 基于上亿小时音频数据训练,并结合钉钉在互联网、科技、装修、畜牧、汽车等多个行业的真实场景数据共建,显著提升专业术语的识别能力。
实测结果显示,保险行业识别准确率提升 18%,装修、畜牧等行业提升 15%-20%。模型还支持企业自定义热词功能,最多可导入 1000 个以上专属词汇,增强对生僻词的识别效果。
Fun-ASR 可结合企业钉钉内的通讯录、日程、知识库等内部信息进行推理优化,在获得企业授权后有效减少大模型幻觉,输出更可靠的转写结果。
基于高效的端到端架构,模型可利用企业提供的实际语音数据进一步优化算法,提升品牌名、项目代号、产品名和人名等专属内容的识别准确率。
以顾家家居为例,经专属训练后,模型能精准识别「比利时进口 Pulse 脉冲乳胶」、「独创 Sonocore 发泡工艺」等复杂表述,为后续客户需求分析提供坚实基础。
未来展望:持续深化行业适配能力
通义实验室语音团队负责人李先刚表示:「我们期待与钉钉共同推动语音识别技术在企业场景的创新应用。未来将持续扩大 Fun-ASR 的数据与模型规模,提升解决方案的可复制性,为企业带来更智能高效的体验。」
钉钉 CTO 朱鸿指出:「仅用三个月紧密协作,我们就实现了模型落地并获得头部客户认可,这是迈向行业领先的关键突破,也为更多企业定制大模型提供了可复制的范例。」
目前,Fun-ASR 的潜力仍在持续挖掘中,双方将重点推进方言识别、噪音环境鲁棒性、多语种支持以及企业深度定制等方向的升级,全面提升语音转写的精准度与实用性,助力更多企业实现智能化升级。
We dedicated to serving clients with professional DingTalk solutions. If you'd like to learn more about DingTalk platform applications, feel free to contact our online customer service or email at

简体中文
English
اللغة العربية
Bahasa Indonesia
Bahasa Melayu
ภาษาไทย
Tiếng Việt