Google Rilis Medgemma 1.5, Ai Medis Canggih Bisa Baca Ct Scan

Sedang Trending 21 jam yang lalu

Telset.id – Google kembali menunjukkan taringnya di sektor kesehatan digital dengan meluncurkan model kepintaran buatan (AI) terbaru mereka, MedGemma 1.5 4B. Raksasa teknologi ini secara resmi merilis model tersebut berbarengan dengan model pengenalan bunyi unik medis berjulukan MedASR. Langkah ini mempertegas ambisi Google untuk mendominasi pasar AI medis nan kian kompetitif, di mana kecermatan dan privasi info menjadi taruhan utama.

Peluncuran ini membawa angin segar bagi organisasi developer dan praktisi medis. Pasalnya, MedGemma 1.5 4B dirancang sebagai model lightweight alias ringan nan bisa beraksi secara lokal (on-device). Kemampuan ini memungkinkan rumah sakit alias lembaga kesehatan untuk menjalankan kajian info sensitif tanpa kudu selalu berjuntai pada cloud, sebuah fitur krusial demi menjaga keamanan info pasien di tengah maraknya rumor privasi nan juga melanda platform lain seperti ChatGPT Health.

Google menyatakan bahwa model terbaru ini tidak hanya sekadar pembaruan minor, melainkan membawa peningkatan signifikan dalam perihal kecermatan dan kapabilitas pemrosesan info multimodal dibandingkan pendahulunya.

Kemampuan Analisis CT Scan dan MRI

Salah satu nilai jual utama dari MedGemma 1.5 4B adalah kemampuannya dalam menangani info visual nan kompleks. Jika generasi sebelumnya, MedGemma 1, sudah bisa memproses teks, sinar-X dada (X-ray), dan gambaran patologi, jenis 1.5 ini melangkah lebih jauh. Google telah meningkatkan kapabilitasnya untuk kompatibel dengan info tiga dimensi, termasuk pemindaian Computerized Tomography (CT Scan) dan Magnetic Resonance Imaging (MRI).

Berdasarkan info nan dirilis, MedGemma 1.5 4B (ditandai dengan warna biru dalam diagram benchmark Google) menunjukkan skor kecermatan pemrosesan teks nan lebih tinggi dibandingkan MedGemma 1 4B. nan cukup mengejutkan, dalam beberapa pengetesan benchmark tertentu, model “kecil” dengan parameter 4 miliar ini apalagi bisa mengungguli performa model pendahulunya nan mempunyai parameter jauh lebih besar, ialah MedGemma 1 27B.

Peningkatan ini membuktikan bahwa efisiensi model AI sekarang tidak melulu soal ukuran parameter, tetapi gimana arsitektur model tersebut dioptimalkan untuk tugas spesifik. Hal ini tentu menjadi peringatan bagi pesaing nan tetap berkompetisi membesarkan ukuran model tanpa memperhatikan efisiensi, serta mengingatkan kita pada obrolan mengenai Bahaya AI jika tidak dikembangkan dengan presisi.

MedASR: Menantang Dominasi Whisper OpenAI

Selain model visual dan teks, Google juga memperkenalkan MedASR, sebuah model pengenalan bunyi (speech recognition) nan dikhususkan untuk terminologi medis. Dalam bumi medis, kesalahan transkripsi satu kata saja bisa berakibat fatal, sehingga kecermatan adalah nilai mati.

Google dengan percaya diri membandingkan performa MedASR melawan model terkenal milik OpenAI, Whisper large-v3. Dalam pengetesan transkripsi percakapan mengenai sinar-X dada, Google menyatakan MedASR mencatatkan tingkat kesalahan alias Word Error Rate (WER) hanya sebesar 5,2%. Angka ini jauh lebih rendah—dan artinya lebih akurat—dibandingkan Whisper large-v3 nan mempunyai tingkat kesalahan 12,5% pada skenario nan sama.

Keunggulan MedASR tidak berakhir di situ. Hasil transkripsi dari model bunyi ini dirancang untuk dapat langsung digunakan sebagai prompt alias input bagi seri model MedGemma. Integrasi mulus antara bunyi dan kajian teks/gambar ini menciptakan ekosistem AI medis nan komprehensif, berbeda dengan pendekatan parsial nan mungkin kita temui pada Fitur Baru AI generik lainnya.

Dukungan Open Source dan Komunitas

Google tampaknya menyadari bahwa mengambil teknologi medis memerlukan kerjasama luas. Oleh lantaran itu, seri MedGemma, termasuk jenis 1.5 4B, telah dibuka aksesnya (open source) bagi para pengembang. Sifatnya nan terbuka memudahkan developer untuk melakukan fine-tuning alias penyesuaian model agar lebih relevan dengan kebutuhan spesifik di lapangan.

Hingga saat ini, tercatat sudah ada lebih dari 500 model turunan nan dikembangkan dari pedoman MedGemma. Dengan hadirnya jenis 1.5 4B nan lebih powerful namun ringan, nomor ini diprediksi bakal terus bertambah seiring kontribusi organisasi developer global. Google berambisi ekosistem ini bakal melahirkan beragam jenis model nan dioptimalkan untuk tugas-tugas medis nan sangat spesifik (niche).

Langkah Google merilis model nan bisa melangkah lokal ini juga bisa dilihat sebagai strategi untuk memitigasi rumor latensi dan ketergantungan internet, masalah nan sering dihadapi akomodasi kesehatan di wilayah terpencil. Dengan keahlian memproses info CT dan MRI secara lokal, pemeriksaan awal bisa dilakukan lebih sigap tanpa kudu menunggu proses unggah info ke server pusat nan menyantap waktu.

Selengkapnya