KaltimExpose.com –Alibaba resmi meluncurkan model kecerdasan buatan (AI) terbarunya bernama Qwen3-Next, yang diklaim lebih cepat, efisien, dan murah untuk dilatih. Menariknya, model ini juga disebut mampu berjalan di perangkat konsumen dan bahkan mengungguli Gemini 2.5 Flash milik Google di sejumlah tolok ukur.

Dilansir dari CyberNews, Alibaba memperkenalkan Qwen3-Next sebagai generasi terbaru model fondasional. Versi pertama yang dirilis adalah Qwen3-Next-80B-A3B, dengan kapasitas 80 miliar parameter dan hadir dalam dua varian: thinking (pemikiran) dan instruct (memberikan jawaban langsung).

Perusahaan asal Tiongkok itu mengklaim Qwen3-Next-80B setara dengan model unggulannya sebelumnya, Qwen3-235B, yang ukurannya tiga kali lebih besar. Lebih jauh, model ini juga disebut melampaui performa Gemini-2.5-Flash-Thinking di berbagai pengujian.

Arsitektur Lebih Efisien

Alih-alih sekadar menambah jumlah parameter, Alibaba menekankan efisiensi arsitektur. Qwen3-Next dirancang dengan 512 modul “ahli” (expert modules), namun hanya 10 yang aktif untuk setiap tugas. Dengan begitu, GPU hanya memproses sekitar 3 miliar parameter dari total 80 miliar, sehingga mengurangi beban komputasi tanpa mengorbankan kapasitas model.

Alibaba Cloud menyebut pendekatan ini mampu menurunkan jumlah operasi komputasi (FLOPs) per token secara drastis, sekaligus mempertahankan kualitas model. Tak hanya itu, Qwen3-Next juga dioptimalkan agar dapat berjalan di perangkat keras kelas konsumen.

Model ini mendukung konteks hingga 256 ribu token, dan bisa diperluas sampai 1 juta token. Dalam pengujian internal, Qwen3-Next-80B terbukti 10 kali lebih cepat dibandingkan Qwen3-32B saat memproses konteks panjang.

Hasil Uji dan Benchmark

Qwen3-Next-80B dilatih menggunakan 15 triliun token dari total dataset 36 triliun token milik Qwen3. Dalam benchmark SuperGPQA, varian thinking mencatat akurasi 60,8%, yang menilai pengetahuan tingkat pascasarjana di 285 disiplin ilmu.

Alibaba mengklaim model ini mengungguli Gemini 2.5 Flash Thinking di semua lima tolok ukur internal yang dipilih perusahaan. Padahal, Gemini 2.5 Flash selama ini dikenal sebagai model Google terbaik dari segi harga dan performa.

Tersedia Gratis

Model Qwen3-Next sudah bisa diakses gratis di berbagai platform besar, seperti Hugging Face, Kaggle, dan ModelScope Alibaba Cloud.

Selain Qwen3-Next, Alibaba juga merilis Qwen3-ASR-Flash, alat transkripsi suara berbasis AI yang diklaim memiliki akurasi tinggi di 11 bahasa utama. Perusahaan menyebut performanya melampaui model pengenalan suara otomatis (ASR) terkemuka lainnya.

Tak hanya itu, Alibaba turut memperkenalkan pratinjau Qwen3-Max, model dengan lebih dari 1 triliun parameter yang kini menempati peringkat keenam di LMArena.


Update Berita Kaltim gak harus ribet! Yuk Gabung Channel WhatsApp Kaltim Expose Whatsapp Kaltim Expose untuk dapetin informasi terbaru dengan cara yang mudah dan menyenangkan.

Iklan