MOMSMONEY.ID - Alibaba meluncurkan Qwen3, generasi terbaru dari seri large language model (LLM) open-source miliknya, yang menetapkan standar baru dalam inovasi kecerdasan buatan atau AI.
Dalam keterangan tertulis, Sabtu (3/5), Seri Qwen3 terdiri atas enam dense model dan dua model Mixture-of-Experts (MoE), yang memberikan fleksibilitas bagi para developer mengaplikasikan generasi berikutnya di berbagai perangkat seperti ponsel, kacamata pintar, kendaraan otonom, hingga robotika serta perangkat lainnya.
Seluruh model Qwen3, termasuk dense model (dengan parameter 0.6B, 1.7B, 4B, 8B, 14B, dan 32B) serta model MoE (30B dengan 3B aktif, dan 235B dengan 22B aktif), kini telah dirilis secara open-source dan tersedia secara global.
Qwen3 menandai debut Alibaba dalam model hybrid reasoning, yang menggabungkan kemampuan tradisional LLM dengan penalaran dinamis tingkat lanjut.
Model Qwen3 dapat dengan mulus beralih dari mode berpikir untuk tugas-tugas yanng kompleks, dan memerlukan beberapa langkah seperti matematika, pengkodean, dan deduksi logis, ke mode tanpa berpikir untuk respons yang cepat dan umum.
Bagi para developer yang mengakses Qwen3 melalui API, model ini menawarkan kontrol yang terperinci terhadap durasi berpikir (hingga 38.000 token), memungkinkan keseimbangan optimal antara kinerja cerdas dan efisiensi komputasi.
Baca Juga: Alibaba Cloud Perkuat Fungsi AI dengan Inovasi Terbaru bagi Pelanggan Internasional
Selain itu, model MoE Qwen3-235B-A22B mampu mengurangi biaya penerapan secara signifikan dibandingkan dengan model mutakhir lainnya, sekaligus memperkuat komitmen Alibaba terhadap pengembangan AI berkinerja tinggi yang tetap mudah diakses.
Qwen3 memiliki terobosan baru dalam keterampilan multibahasa, kemampuan agen, penalaran dan penyesuaian manusia. Dilatih dengan dataset masif berisi 36 triliun token-yang dua kali lipat dari pendahulunya Qwen2.5. Qwen3 menghadirkan kemajuan signifikan dalam penalaran, pemahaman instruksi, penggunaan alat atau aplikasi, dan tugas multibahasa.
Berikut kemampuan utama Qwen3,
- Penguasaan Multibahasa: Mendukung 119 bahasa dan dialek, dengan performa terdepan dalam penerjemahan dan mengikuti instruksi multibahasa.
- Integrasi Agen yang canggih: Mendukung secara native Model Context Protocol (MCP) dan pemanggilan fungsi yang andal, menjadikan Qwen 3 pemimpin di antara model open-source untuk tugas berbasis agen AI yang kompleks.
- Penalaran Unggul: Melampaui model Qwen sebelumnya (QwQ dalam mode berpikir dan Qwen2.5 dalam mode non-berpikir) dalam tolok ukur matematika, pengkodean, dan penalaran logis.
- Penyelarasan AI dengan preferensi manusia yang lebih baik: Menghasilkan pengalaman menulis kreatif, bermain peran, dan dialog bergilir yang terasa lebih alami dan menarik.
Model Qwen3 Meraih Peringkat Tertinggi di Berbagai Tolok Ukur Industri
Berkat kemajuan dalam arsitektur model, peningkatan volume data pelatihan, dan metode pelatihan yang lebih efektif, model Qwen3 berhasil meraih hasil unggulan di berbagai tolok ukur industri seperti AIME25 (penalaran matematika), LiveCodeBench (kemampuan pengkodean), BFCL (kemampuan penggunaan alat dan pemrosesan fungsi), dan Arena-Hard (tolok ukur untuk LLM yang dilatih mengikuti instruksi). Selain itu, untuk mengembangkan model hybrid reasoning ini, Alibaba menerapkan proses pelatihan empat tahap yang mencakup long chain-of-thought (CoT) cold start, reinforcement learning (RL) berbasis penalaran, thinking mode fusion, dan reinforcement learning secara umum.
Model Qwen3 kini tersedia secara gratis untuk diunduh melalui Hugging Face, GitHub, dan ModelScope, serta dapat diakses langsung melalui chat.qwen.ai. Akses API akan segera tersedia melalui platform pengembangan model AI Alibaba, Model Studio. Qwen3 juga menjadi teknologi inti di balik Quark, aplikasi asisten super AI unggulan Alibaba.
Sejak diluncurkan, seri model Qwen telah menarik lebih dari 300 juta unduhan secara global. Para developer telah menciptakan lebih dari 100.000 model turunan berbasis Qwen di Hugging Face, menjadikan Qwen salah satu seri model AI open-source yang paling banyak diadopsi di dunia.
Selanjutnya: Begini Kesiapan ASDP Antisipasi Kepadatan Saat Long Weekend Hari Waisak
Cek Berita dan Artikel yang lain di Google News