إطلاق دينغ تك ومختبر تونغي موديل التعرف الصوتي المخصص للقطاعات Fun-ASR

في 22 أغسطس، أعلنت دينغ تك (DingTalk) وفريق الصوتيات في مختبر تونغي (Tongyi) إطلاق الجيل الجديد من النموذج الكبير للتعرف الصوتي Fun-ASR. يمكن لهذا النموذج التعرف بدقة على المصطلحات المتخصصة في عشرة قطاعات رئيسية مثل الديكور الداخلي وتربية المواشي، كما يدعم التدريب المخصص لنماذج الشركات الخاصة. وبفضل التعاون العميق، يستطيع Fun-ASR تحويل إشارات صوتية متنوعة بكفاءة عالية، ويتمتع بقدرات متقدمة تشمل فهم مصطلحات متعددة القطاعات، والتعرف على لهجات لغوية متعددة، والاستنتاج السياقي.

تم حاليًا دمج Fun-ASR ضمن وظائف دينغ تك مثل الترجمة الفورية في الاجتماعات، والمحاضر الذكية، والمساعد الصوتي، بهدف بناء قاعدة تعرف صوتي مستقرة وفعالة وقابلة للتوسع، وهي مناسبة بشكل خاص للمشاهد المؤسسية التي تتطلب دقة عالية في فهم السياق.

الميزات التقنية الأساسية: ثلاث قدرات رئيسية تضمن دقة عالية في التعرف

تم تدريب نموذج Fun-ASR باستخدام بيانات صوتية تمتد لأكثر من مليار ساعة، مع دمج بيانات فعلية من سيناريوهات حقيقية في قطاعات متعددة مثل الإنترنت، والتكنولوجيا، والديكور الداخلي، وتربية المواشي، والسيارات من خلال شراكة مع دينغ تك، مما عزز بشكل كبير قدرته على التعرف على المصطلحات المتخصصة.

أظهرت الاختبارات العملية تحسناً بنسبة 18٪ في دقة التعرف في قطاع التأمين، وتحسناً يتراوح بين 15٪ و20٪ في قطاعات مثل الديكور الداخلي وتربية المواشي. كما يدعم النموذج وظيفة الكلمات الساخنة المخصصة للشركات، حيث يمكن استيراد أكثر من 1000 مصطلح خاص لتعزيز دقة التعرف على الكلمات النادرة أو المعقدة.

يمكن لـ Fun-ASR استخدام المعلومات الداخلية داخل منصة دينغ تك مثل دليل الموظفين، والجداول الزمنية، وقواعد المعرفة لتحسين الاستنتاجات. وبعد الحصول على إذن من الشركة، يمكن تقليل ظاهرة "الهلوسة" في النماذج الكبيرة بشكل فعّال، مما يؤدي إلى نتائج تحويل نصي أكثر موثوقية.

وبفضل هيكله الفعال من طرف إلى طرف، يمكن للنموذج استخدام البيانات الصوتية الفعلية التي توفرها الشركات لتحسين الخوارزميات، وبالتالي رفع دقة التعرف على العناصر الخاصة مثل أسماء العلامات التجارية، وأرقام المشاريع، وأسماء المنتجات، وأسماء الأشخاص.

على سبيل المثال، بعد التدريب الخاص لشركة顧家家居 (Gujia Home)، أصبح النموذج قادرًا على التعرف بدقة على عبارات معقدة مثل "مطاط اللاتكس المستورد من بلجيكا Pulse"، و"تقنية Sonocore الفريدة للرغوة"، مما يوفر أساسًا قويًا لتحليل احتياجات العملاء لاحقًا.

التطلعات المستقبلية: تعزيز قدرات التكيف مع القطاعات المختلفة

أكد لي شيغانغ، رئيس فريق الصوتيات في مختبر تونغي: "نتطلع إلى مواصلة التعاون مع دينغ تك لدفع الابتكار في تطبيقات التعرف الصوتي ضمن البيئات المؤسسية. سنستمر في توسيع حجم بيانات ونموذج Fun-ASR، وتحسين قابلية إعادة إنتاج الحلول، لتوفير تجربة أكثر ذكاءً وكفاءة للشركات."

وأشار تشو هونغ، كبير المهندسين التقنيين في دينغ تك: "خلال ثلاثة أشهر فقط من التعاون الوثيق، تمكنا من تنفيذ النموذج وحصلنا على اعتراف من عملاء كبار، وهو اختراق مهم نحو التميز في هذا المجال، ويُعد أيضًا نموذجًا قابلاً للتكرار لتطوير نماذج كبيرة مخصصة لشركات أخرى."

حاليًا، لا يزال يتم استكشاف الإمكانات الكاملة لـ Fun-ASR، وستركز الجهود المشتركة على تطوير قدرات التعرف على اللهجات المحلية، وتحسين الأداء في البيئات الصاخبة، ودعم اللغات المتعددة، بالإضافة إلى التخصيص المتقدم للشركات، بهدف رفع دقة وفائدة تحويل الكلام إلى نص بشكل شامل، ومساعدة المزيد من الشركات على تحقيق التحوّل الذكي.

We dedicated to serving clients with professional DingTalk solutions. If you'd like to learn more about DingTalk platform applications, feel free to contact our online customer service or email at عنوان البريد الإلكتروني هذا محمي من روبوتات السبام. يجب عليك تفعيل الجافاسكربت لرؤيته.. With a skilled development and operations team and extensive market experience, we’re ready to deliver expert DingTalk services and solutions tailored to your needs!