Data berkualitas tinggi adalah dasar bagi pelatihan dan penerapan model AI skala besar, serta menjadi "bahan bakar" bagi transformasi dan peningkatan perusahaan menuju AI. Namun, banyak perusahaan mengalami kesulitan saat mengembangkan aplikasi AI karena model besar sulit memahami data tidak terstruktur.
Apakah lebih banyak pengguna perusahaan dapat memiliki alat data yang andal untuk mewujudkan kemerdekaan data siap-AI (AI-Ready)?
Baru-baru ini, OpenDataLab dan DingTalk meluncurkan alat pemrosesan dokumen DLU (Document Language Understanding) berbasis MinerU yang ditujukan bagi pengguna perusahaan, bertujuan membantu perusahaan mengatasi tantangan data siap-AI, menurunkan hambatan pengembangan aplikasi AI, serta mempercepat penerapan teknologi AI dalam berbagai industri secara luas.
MinerU adalah mesin analisis dokumen cerdas yang diluncurkan oleh OpenDataLab, Laboratorium Kecerdasan Buatan Shanghai (Shanghai AI Lab), yang sangat populer di kalangan pengguna berkat akurasi analisisnya yang tinggi dan kompatibilitas luas, dengan jumlah bintang GitHub lebih dari 40 ribu.
Sebagai lembaga penelitian kecerdasan buatan tingkat internasional, Shanghai AI Lab memiliki akumulasi teknologi mendalam di bidang model besar dan kecerdasan data. Platform OpenDataLab yang dikembangkan secara mandiri merupakan platform data model AI terkemuka di Tiongkok, mengumpulkan lebih dari 7.700 dataset sumber terbuka berkualitas tinggi, telah menyediakan lebih dari 2 juta layanan data bagi lebih dari 100 ribu pengguna. Versi terbaru MinerU 2.0 mencatat peningkatan signifikan dalam kecepatan dan ketepatan analisis, mencapai kinerja setara dengan model besar utama berparameter 72B hanya dengan parameter sebesar 0,98B.
DingTalk, sebagai platform kerja kolaboratif seluler cerdas tingkat perusahaan milik Alibaba Group, memiliki produk dokumen perusahaan yang lengkap dan basis pengguna yang besar. Produk seperti Dokumen DingTalk dan Spreadsheet AI telah terintegrasi secara mendalam dengan kemampuan MinerU, serta menyediakan fungsi analisis dokumen bagi pengembang ekosistem melalui platform terbuka, sehingga meletakkan dasar teknis dan skenario yang kuat bagi pengembangan bersama DLU.
DLU berbasis MinerU akan segera dibuka sumbernya (open source), memiliki kompatibilitas format file yang sangat baik, kemampuan pemahaman konten mendalam, serta output terstruktur yang akurat. DLU tidak hanya mendukung format dokumen Office umum, PDF, Markdown, dan file kode, tetapi juga mencakup format dokumen, spreadsheet, dan spreadsheet AI eksklusif DingTalk; sekaligus mampu mengekstraksi konten teks biasa, menganalisis secara akurat elemen visual kompleks seperti grafik, rumus matematis, ilustrasi, bahkan rumus molekul kimia, lalu mengubahnya secara efisien menjadi korpus berkualitas tinggi yang cocok untuk pelatihan model besar.
DLU akan terintegrasi secara mendalam dengan ekosistem kolaborasi kantor DingTalk guna mewujudkan siklus tertutup proses aplikasi AI
Ke depan, DLU akan memanfaatkan keunggulan DingTalk dalam skenario layanan perusahaan, terintegrasi secara mendalam ke dalam ekosistem kerja kolaboratif, serta mendukung pengguna untuk menyelesaikan seluruh alur kerja—mulai dari pembuatan dokumen, ekstraksi analisis, manajemen basis pengetahuan, anotasi data, hingga pelatihan model khusus—dalam satu platform tunggal, meningkatkan secara menyeluruh efisiensi pengembangan aplikasi AI maupun pekerjaan kantor harian.
He Conghui, ilmuwan muda Laboratorium Kecerdasan Buatan Shanghai dan pendiri proyek open source OpenDataLab/MinerU, mengatakan: "MinerU memiliki basis pengguna yang luas. Kami berharap dapat memperluas penerapannya lebih jauh dalam skenario perusahaan, memaksimalkan nilai platform OpenDataLab, serta bekerja sama dengan mitra untuk menciptakan 'PyTorch-nya alat data', membantu lebih banyak perusahaan mewujudkan kemerdekaan data siap-AI."
Zhu Hong, CTO DingTalk, mengatakan: "Dengan membuka sumber DLU, kita dapat secara efektif mengatasi tantangan persiapan data perusahaan di era AI, memperkuat fondasi transformasi cerdas. Saat ini DingTalk sedang aktif membangun ekosistem AI baru, kami berharap bisa bekerja sama dengan lebih banyak mitra teknologi dan kekuatan industri untuk memberikan dukungan kuat bagi digitalisasi dan peningkatan kecerdasan di berbagai sektor."
We dedicated to serving clients with professional DingTalk solutions. If you'd like to learn more about DingTalk platform applications, feel free to contact our online customer service or email at

Bahasa Indonesia
English
اللغة العربية
Bahasa Melayu
ภาษาไทย
Tiếng Việt
简体中文