Gak Cuma Chatbot! Kemampuan Ai Agent Ini Bikin Pengacara Ketar-ketir

3 minggu yang lalu

Pernahkah Anda merasa begitu percaya bahwa pekerjaan tertentu tidak bakal pernah bisa disentuh oleh kepintaran buatan? Sebulan nan lalu, rasa kondusif itu mungkin tetap menyelimuti para ahli di bagian hukum. Banyak nan beranggapan bahwa nuansa, logika kompleks, dan interpretasi norma adalah tembok terakhir nan mustahil ditembus oleh mesin. Namun, dalam hitungan minggu, peta kekuatan teknologi kembali berubah drastis, memaksa kita untuk meninjau ulang prediksi tersebut.

Bulan lalu, sebuah tolok ukur (benchmark) baru dari Mercor dirilis untuk mengukur keahlian pemasok AI dalam tugas-tugas ahli tingkat tinggi, seperti norma dan kajian korporat. Hasil awalnya bisa dibilang mengecewakan bagi para developer AI, namun menenangkan bagi manusia. Saat itu, setiap laboratorium AI besar mencatatkan skor di bawah 25%. Kesimpulan sementaranya sangat jelas: pengacara tetap kondusif dari ancaman perpindahan tugas ke AI, setidaknya untuk saat itu.

Namun, di bumi teknologi nan bergerak secepat kilat, kata “aman” seringkali berkarakter sementara. Pekan ini, lanskap tersebut terguncang dahsyat dengan rilisnya model terbaru dari Anthropic, ialah Opus 4.6. Model ini tidak hanya sekadar pembaruan minor, melainkan sebuah lompatan kapabilitas nan mengubah papan skor secara signifikan. Apa nan sebelumnya dianggap mustahil dilakukan oleh mesin dalam waktu dekat, sekarang mulai terlihat di depan mata.

Lonjakan Skor nan “Gila”

Perubahan drastis ini terlihat nyata pada papan ranking Mercor. Model terbaru Anthropic, Opus 4.6, sukses mencetak skor nyaris menyentuh nomor 30% dalam uji coba one-shot (satu kali percobaan). Angka ini apalagi melonjak lebih tinggi hingga rata-rata 45% ketika AI diberikan kesempatan beberapa kali untuk memecahkan masalah nan sama. Kenaikan ini bukan sekadar statistik angka, melainkan indikasi bahwa pemahaman konteks pada kemampuan AI agent telah meningkat pesat.

CEO Mercor, Brendan Foody, tidak dapat menyembunyikan kekagumannya terhadap perkembangan ini. Ia secara spesifik menyoroti sungguh cepatnya progres nan terjadi dalam waktu singkat. Menurutnya, lonjakan skor dari 18,4% menjadi 29,8% hanya dalam kurun waktu beberapa bulan adalah sesuatu nan “gila”. Hal ini menegaskan bahwa kemajuan pada model dasar (foundation models) sama sekali tidak melambat, melainkan justru berakselerasi.

Peningkatan performa ini tentu memicu obrolan hangat mengenai masa depan pekerjaan kerah putih. Meskipun CEO Nvidia pernah menyebut bahwa AI hanya mengambil alih Tugas Rutin, info terbaru ini menunjukkan bahwa AI mulai merambah ke ranah kajian nan lebih kompleks.

Peran Fitur Agent Swarms

Apa rahasia di kembali lonjakan performa nan tiba-tiba ini? Salah satu aspek kunci nan disorot dalam rilis Anthropic kali ini adalah penyertaan sejumlah fitur agenik baru, termasuk apa nan disebut sebagai “agent swarms” alias kawanan agen. Fitur ini memungkinkan kerjasama antar-sistem AI untuk menyelesaikan masalah nan bertingkat dan rumit.

Dalam konteks penyelesaian masalah norma alias korporat nan seringkali memerlukan pemikiran multistep, kehadiran agent swarms ini tampaknya memberikan akibat signifikan. Kemampuan untuk memecah masalah besar menjadi bagian-bagian mini nan dikerjakan secara simultan alias berurutan oleh “kawanan” pemasok ini, membikin Agentic AI menjadi jauh lebih efektif dibandingkan model tunggal sebelumnya.

Teknologi ini mirip dengan gimana sebuah tim norma bekerja, di mana beragam aspek kasus ditangani oleh perseorangan nan berbeda namun terkoordinasi. Jika tren ini berlanjut, bukan tidak mungkin kita bakal memandang penerapan nan lebih luas, apalagi mungkin dalam penyusunan Aturan Pemerintah di masa depan nan menuntut ketelitian tinggi.

Apakah Pengacara Harus Mulai Panik?

Melihat info di atas, pertanyaan besarnya adalah: apakah para pengacara kudu mulai cemas bakal digantikan oleh mesin minggu depan? Jawabannya, untuk saat ini, adalah tidak. Skor 30% alias apalagi 45% tetap sangat jauh dari kesempurnaan 100%. Masih ada celah besar nan kudu ditutup oleh teknologi sebelum betul-betul bisa menyamai kompetensi manusia sepenuhnya dalam ranah norma profesional.

Namun, rasa percaya diri nan berlebihan nan mungkin dirasakan bulan lampau sebaiknya mulai dikurangi. Progres dari nomor belasan persen menuju nyaris separuh jalan (45%) dalam waktu singkat adalah sinyal peringatan nan nyata. Ini bukan lagi soal “apakah” AI bisa melakukan tugas tersebut, melainkan “kapan” AI bakal mencapai tingkat kecermatan nan dapat diandalkan secara komersial.

Perkembangan Opus 4.6 membuktikan bahwa batas teknologi terus didorong lebih jauh setiap harinya. Bagi para profesional, ini adalah momen untuk tidak lagi memandang sebelah mata pada Jutaan AI nan sedang dikembangkan. Meskipun manusia tetap memegang kendali saat ini, kecepatan penemuan menuntut kita untuk terus beradaptasi agar tidak tergilas oleh gelombang perubahan nan tak terelakkan ini.

Selengkapnya