Đinh Đinh và Phòng thí nghiệm Tongyi ra mắt mô hình nhận dạng giọng nói chuyên ngành tùy chỉnh Fun-ASR

Ngày 22 tháng 8, Đinh Đinh và nhóm语音 của Phòng thí nghiệm Tongyi đã cùng công bố thế hệ mới của mô hình lớn nhận dạng giọng nói Fun-ASR. Mô hình này có thể nhận diện chính xác các thuật ngữ chuyên môn trong mười lĩnh vực như trang trí nội thất, chăn nuôi gia súc,... đồng thời hỗ trợ đào tạo mô hình riêng biệt theo yêu cầu doanh nghiệp. Nhờ hợp tác sâu rộng, Fun-ASR có khả năng chuyển đổi hiệu quả mọi loại tín hiệu âm thanh, sở hữu năng lực hiểu thuật ngữ đa ngành, nhận diện khẩu âm đa ngôn ngữ và suy luận ngữ nghĩa theo ngữ cảnh.

Hiện tại, Fun-ASR đã được tích hợp vào các chức năng của Đinh Đinh như phụ đề họp, thông dịch trực tiếp, biên bản thông minh, trợ lý giọng nói,... nhằm xây dựng nền tảng nhận dạng giọng nói ổn định, hiệu quả và dễ mở rộng, đặc biệt phù hợp với các tình huống doanh nghiệp yêu cầu cao về độ chính xác và hiểu ngữ cảnh.

Các điểm nổi bật công nghệ chính: Ba khả năng then chốt đảm bảo độ chính xác cao

Fun-ASR được huấn luyện dựa trên dữ liệu âm thanh lên tới hàng trăm triệu giờ, kết hợp với dữ liệu thực tế từ các lĩnh vực internet, công nghệ, trang trí nội thất, chăn nuôi, ô tô... của Đinh Đinh, nhờ đó cải thiện đáng kể khả năng nhận diện thuật ngữ chuyên ngành.

Kết quả thử nghiệm thực tế cho thấy, tỷ lệ chính xác nhận diện trong ngành bảo hiểm tăng 18%, các ngành như trang trí nội thất, chăn nuôi tăng 15%-20%. Mô hình còn hỗ trợ chức năng từ khóa tùy chỉnh cho doanh nghiệp, cho phép nhập hơn 1.000 từ vựng chuyên biệt để nâng cao hiệu quả nhận diện các từ hiếm gặp.

Fun-ASR có thể tận dụng danh bạ, lịch làm việc, kho kiến thức nội bộ trong hệ thống Đinh Đinh của doanh nghiệp để tối ưu hóa quá trình suy luận, sau khi được doanh nghiệp cấp quyền, giúp giảm hiệu quả hiện tượng "ảo giác" ở mô hình lớn, mang lại kết quả chuyển đổi tin cậy hơn.

Với kiến trúc end-to-end hiệu quả cao, mô hình có thể sử dụng dữ liệu giọng nói thực tế do doanh nghiệp cung cấp để tiếp tục tối ưu hóa thuật toán, nâng cao độ chính xác nhận diện tên thương hiệu, mã dự án, tên sản phẩm và tên người.

Lấy ví dụ Công ty nội thất Gujia, sau khi được huấn luyện riêng biệt, mô hình có thể nhận diện chính xác các cụm từ phức tạp như "cao su Latex Pulse nhập khẩu từ Bỉ", "công nghệ tạo bọt Sonocore độc quyền", tạo nền tảng vững chắc cho việc phân tích nhu cầu khách hàng sau này.

Dự báo tương lai: Tiếp tục nâng cao khả năng thích ứng chuyên ngành

Lý Tiên Cương, người đứng đầu nhóm语音 Phòng thí nghiệm Tongyi cho biết: "Chúng tôi mong muốn cùng Đinh Đinh thúc đẩy ứng dụng sáng tạo của công nghệ nhận dạng giọng nói trong môi trường doanh nghiệp. Trong tương lai, chúng tôi sẽ tiếp tục mở rộng quy mô dữ liệu và mô hình của Fun-ASR, nâng cao khả năng nhân rộng giải pháp, mang lại trải nghiệm thông minh và hiệu quả hơn cho doanh nghiệp."

Chu Hồng, CTO của Đinh Đinh cho biết thêm: "Chỉ trong ba tháng hợp tác chặt chẽ, chúng tôi đã triển khai thành công mô hình và nhận được sự công nhận từ những khách hàng hàng đầu. Đây là bước đột phá quan trọng tiến tới dẫn đầu ngành, đồng thời cũng tạo ra một mẫu hình có thể nhân rộng cho nhiều doanh nghiệp khác trong việc tùy chỉnh mô hình lớn."

Hiện tại, tiềm năng của Fun-ASR vẫn đang được tiếp tục khai thác. Hai bên sẽ tập trung phát triển các hướng nâng cấp như nhận diện phương ngữ, tính ổn định trong môi trường ồn ào, hỗ trợ đa ngôn ngữ và tùy chỉnh sâu cho doanh nghiệp, nhằm nâng cao toàn diện độ chính xác và tính thực tiễn của chuyển đổi giọng nói, hỗ trợ nhiều doanh nghiệp hơn trong hành trình chuyển đổi thông minh.

We dedicated to serving clients with professional DingTalk solutions. If you'd like to learn more about DingTalk platform applications, feel free to contact our online customer service or email at This email address is being protected from spambots. You need JavaScript enabled to view it.. With a skilled development and operations team and extensive market experience, we’re ready to deliver expert DingTalk services and solutions tailored to your needs!