DingTalk dan Laboratorium Tongyi Luncurkan Model Pengenalan Ucapan Khusus Industri Fun-ASR
Pada 22 Agustus, tim suara DingTalk dan Laboratorium Tongyi bersama-sama merilis model pengenalan ucapan generasi baru bernama Fun-ASR. Model ini mampu mengenali secara akurat istilah-istilah teknis dari sepuluh industri seperti konstruksi interior dan peternakan, serta mendukung pelatihan model khusus perusahaan. Berkat kerja sama mendalam tersebut, Fun-ASR dapat mengubah berbagai sinyal suara menjadi teks secara efisien, dengan kemampuan memahami istilah lintas industri, mengenali berbagai aksen bahasa, serta melakukan penalaran semantik kontekstual.
Saat ini, Fun-ASR telah terintegrasi ke dalam berbagai fitur di DingTalk seperti subtitle dan penerjemahan langsung rapat, notulen cerdas, serta asisten suara. Tujuannya adalah membangun fondasi pengenalan suara yang stabil, efisien, dan mudah dikembangkan, sangat cocok untuk skenario perusahaan yang menuntut pemahaman konteks dan tingkat akurasi tinggi.
Keunggulan Teknologi Utama: Tiga Kemampuan Pendukung Akurasi Tinggi
Fun-ASR dilatih menggunakan data audio lebih dari 100 juta jam, ditambah data aktual dari berbagai skenario nyata di sektor internet, teknologi, konstruksi interior, peternakan, otomotif, dan lainnya yang disediakan oleh DingTalk, sehingga kemampuan pengenalan istilah teknis meningkat secara signifikan.
Hasil pengujian menunjukkan bahwa tingkat akurasi pengenalan di industri asuransi meningkat hingga 18%, sedangkan di industri konstruksi interior dan peternakan meningkat 15%-20%. Model ini juga mendukung fungsi kata hangat (hotword) yang dapat disesuaikan perusahaan, dengan kemampuan mengimpor lebih dari 1.000 kosakata khusus guna meningkatkan pengenalan kata-kata yang jarang digunakan.
Fun-ASR dapat melakukan optimalisasi penalaran dengan memanfaatkan informasi internal perusahaan seperti daftar kontak, jadwal, dan repositori pengetahuan di dalam aplikasi DingTalk. Setelah mendapat otorisasi dari perusahaan, model ini mampu mengurangi ilusi (hallucination) pada model besar sehingga menghasilkan transkripsi yang lebih andal.
Berdasarkan arsitektur end-to-end yang efisien, model ini dapat memanfaatkan data suara aktual dari perusahaan untuk menyempurnakan algoritme, sehingga meningkatkan akurasi pengenalan nama merek, kode proyek, nama produk, dan nama orang.
Sebagai contoh, setelah dilatih khusus untuk perusahaan furnitur Gujia, model ini mampu mengenali secara tepat ekspresi kompleks seperti "lateks Pulse impor Belgia" dan "proses foaming Sonocore inovatif", memberikan dasar kuat bagi analisis kebutuhan pelanggan selanjutnya.
Prospek Masa Depan: Terus Memperdalam Kemampuan Adaptasi Industri
Kepala tim suara Laboratorium Tongyi, Li Xiangang, menyatakan: "Kami berharap dapat terus mendorong inovasi penerapan teknologi pengenalan suara di skenario bisnis bersama DingTalk. Ke depan, kami akan terus memperluas skala data dan model Fun-ASR, meningkatkan kemampuan replikasi solusi, serta memberikan pengalaman yang lebih cerdas dan efisien bagi perusahaan."
CTO DingTalk, Zhu Hong, menambahkan: "Hanya dalam tiga bulan kolaborasi erat, kami berhasil mewujudkan implementasi model dan mendapatkan pengakuan dari pelanggan utama. Ini merupakan terobosan penting menuju kepemimpinan industri, sekaligus menjadi contoh yang bisa direplikasi bagi perusahaan lain dalam membuat model khusus."
Saat ini, potensi Fun-ASR masih terus dieksplorasi. Kedua belah pihak akan fokus memajukan peningkatan dalam pengenalan dialek, ketahanan terhadap lingkungan bising, dukungan multibahasa, serta kemampuan kustomisasi mendalam untuk perusahaan, guna meningkatkan secara keseluruhan keakuratan dan kegunaan transkripsi suara, membantu lebih banyak perusahaan mewujudkan transformasi kecerdasan buatan.
We dedicated to serving clients with professional DingTalk solutions. If you'd like to learn more about DingTalk platform applications, feel free to contact our online customer service or email at

Bahasa Indonesia
English
اللغة العربية
Bahasa Melayu
ภาษาไทย
Tiếng Việt
简体中文