
Bergabunglah dengan buletin harian dan mingguan kami untuk mendapatkan pembaruan terkini dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari Lebih Lanjut
AI generatif telah menjadi bagian penting dari infrastruktur di banyak industri, tidak terkecuali layanan kesehatan. Namun, ketika organisasi seperti GSK berusaha mencapai batasan yang dapat dicapai oleh AI generatif, mereka menghadapi tantangan yang signifikan — terutama dalam hal keandalan. Halusinasi, atau ketika model AI menghasilkan informasi yang salah atau dibuat-buat, merupakan masalah yang terus-menerus terjadi dalam aplikasi berisiko tinggi seperti penemuan obat dan layanan kesehatan. Bagi GSK, mengatasi tantangan ini memerlukan pemanfaatan penskalaan komputasi waktu pengujian untuk meningkatkan sistem gen AI. Begini cara mereka melakukannya.
Masalah halusinasi dalam pelayanan kesehatan generatif
Aplikasi layanan kesehatan menuntut tingkat akurasi dan keandalan yang sangat tinggi. Kesalahan bukan hanya menimbulkan ketidaknyamanan; mereka dapat memiliki konsekuensi yang mengubah hidup. Hal ini menjadikan halusinasi dalam model bahasa besar (LLM) menjadi masalah penting bagi perusahaan seperti GSK, di mana gen AI diterapkan pada tugas-tugas seperti tinjauan literatur ilmiah, analisis genom, dan penemuan obat.
Untuk mengurangi halusinasi, GSK menggunakan strategi komputasi waktu inferensi tingkat lanjut, termasuk mekanisme refleksi diri, pengambilan sampel multi-model, dan evaluasi keluaran berulang. Menurut Kim Branson, SvP AI dan pembelajaran mesin (ML) di GSK, teknik ini membantu memastikan bahwa agen “kuat dan dapat diandalkan”, sekaligus memungkinkan para ilmuwan menghasilkan wawasan yang dapat ditindaklanjuti dengan lebih cepat.
Memanfaatkan penskalaan komputasi waktu pengujian
Penskalaan komputasi waktu pengujian mengacu pada kemampuan untuk meningkatkan sumber daya komputasi selama fase inferensi sistem AI. Hal ini memungkinkan operasi yang lebih kompleks, seperti penyempurnaan keluaran berulang atau agregasi multi-model, yang sangat penting untuk mengurangi halusinasi dan meningkatkan performa model.
Branson menekankan peran transformatif penskalaan dalam upaya AI GSK, dengan menyatakan bahwa “kita semua ingin meningkatkan siklus iterasi di GSK — cara kita berpikir lebih cepat.” Dengan menggunakan strategi seperti refleksi diri dan pemodelan ansambel, GSK dapat memanfaatkan siklus komputasi tambahan ini untuk menghasilkan hasil yang akurat dan andal.
Branson juga menyinggung tren industri yang lebih luas, dengan mengatakan, “Anda melihat perang ini terjadi terkait seberapa banyak saya dapat melayani, biaya per token, dan waktu per token. Hal ini memungkinkan orang untuk menerapkan berbagai strategi algoritmik yang sebelumnya tidak memungkinkan secara teknis, dan hal ini juga akan mendorong penerapan dan adopsi agen.”
Strategi untuk mengurangi halusinasi
GSK telah mengidentifikasi halusinasi sebagai tantangan penting dalam gen AI untuk perawatan kesehatan. Perusahaan menerapkan dua strategi utama yang memerlukan sumber daya komputasi tambahan selama inferensi. Menerapkan langkah-langkah pemrosesan yang lebih menyeluruh memastikan bahwa setiap jawaban diperiksa keakuratan dan konsistensinya sebelum disampaikan dalam pengaturan klinis atau penelitian, di mana keandalan adalah yang terpenting.
Refleksi diri dan tinjauan keluaran berulang
Salah satu teknik inti adalah refleksi diri, di mana LLM mengkritik atau mengedit tanggapan mereka sendiri untuk meningkatkan kualitas. Model ini “berpikir langkah demi langkah,” menganalisis keluaran awalnya, menunjukkan kelemahan dan merevisi jawaban sesuai kebutuhan. Alat pencarian literatur GSK mencontohkan hal ini: Alat ini mengumpulkan data dari repositori internal dan memori LLM, kemudian mengevaluasi kembali temuannya melalui kritik diri untuk mengungkap inkonsistensi.
Proses berulang ini menghasilkan jawaban akhir yang lebih jelas dan rinci. Branson menggarisbawahi pentingnya kritik diri, dengan mengatakan: “Jika Anda hanya mampu melakukan satu hal, lakukanlah.” Menyempurnakan logikanya sendiri sebelum memberikan hasil memungkinkan sistem menghasilkan wawasan yang selaras dengan standar ketat layanan kesehatan.
Pengambilan sampel multi-model
Strategi kedua GSK mengandalkan beberapa LLM atau konfigurasi berbeda dari satu model untuk melakukan verifikasi silang keluaran. Dalam praktiknya, sistem mungkin menjalankan kueri yang sama pada pengaturan suhu yang berbeda untuk menghasilkan jawaban yang beragam, menggunakan versi model yang sama yang telah disesuaikan dan mengkhususkan diri pada domain tertentu, atau memanggil model terpisah yang dilatih pada kumpulan data berbeda.
Membandingkan dan membedakan keluaran-keluaran ini membantu memastikan kesimpulan yang paling konsisten atau konvergen. “Anda bisa mendapatkan efek ini dengan menggunakan cara ortogonal yang berbeda untuk mencapai kesimpulan yang sama,” kata Branson. Meskipun pendekatan ini memerlukan daya komputasi yang lebih besar, pendekatan ini mengurangi halusinasi dan meningkatkan kepercayaan diri terhadap jawaban akhir – sebuah manfaat penting dalam lingkungan layanan kesehatan dengan risiko tinggi.
Perang inferensi
Strategi GSK bergantung pada infrastruktur yang dapat menangani beban komputasi yang jauh lebih berat. Dalam apa yang disebut Branson sebagai “perang inferensi,” perusahaan infrastruktur AI – seperti Cerebras, Groq, dan SambaNova – bersaing untuk memberikan terobosan perangkat keras yang meningkatkan throughput token, menurunkan latensi, dan mengurangi biaya per token.
Chip dan arsitektur khusus memungkinkan rutinitas inferensi yang kompleks, termasuk pengambilan sampel multi-model dan refleksi mandiri berulang, dalam skala besar. Teknologi Cerebras, misalnya, memproses ribuan token per detik, memungkinkan teknik-teknik canggih bekerja dalam skenario dunia nyata. “Anda melihat hasil dari inovasi ini berdampak langsung pada cara kita menerapkan model generatif secara efektif dalam layanan kesehatan,” kata Branson.
Ketika perangkat keras mengimbangi tuntutan perangkat lunak, solusi muncul untuk menjaga akurasi dan efisiensi.
Tantangan masih ada
Bahkan dengan kemajuan ini, penskalaan sumber daya komputasi masih menimbulkan kendala. Waktu inferensi yang lebih lama dapat memperlambat alur kerja, terutama jika dokter atau peneliti memerlukan hasil yang cepat. Penggunaan komputasi yang lebih tinggi juga meningkatkan biaya, sehingga memerlukan pengelolaan sumber daya yang cermat. Meskipun demikian, GSK menganggap pertukaran ini diperlukan untuk keandalan yang lebih kuat dan fungsionalitas yang lebih kaya.
“Saat kami mengaktifkan lebih banyak alat di ekosistem agen, sistem menjadi lebih berguna bagi manusia, dan Anda akan mendapatkan peningkatan penggunaan komputasi,” kata Branson. Menyeimbangkan kinerja, biaya, dan kemampuan sistem memungkinkan GSK mempertahankan strategi yang praktis namun berwawasan ke depan.
Apa selanjutnya?
GSK berencana untuk terus menyempurnakan solusi layanan kesehatan berbasis AI dengan penskalaan komputasi waktu pengujian sebagai prioritas utama. Kombinasi refleksi diri, pengambilan sampel multi-model, dan infrastruktur yang kuat membantu memastikan bahwa model generatif memenuhi tuntutan lingkungan klinis yang ketat.
Pendekatan ini juga berfungsi sebagai peta jalan bagi organisasi lain, yang menggambarkan cara menyelaraskan akurasi, efisiensi, dan skalabilitas. Mempertahankan keunggulan dalam inovasi komputasi dan teknik inferensi canggih tidak hanya mengatasi tantangan saat ini, namun juga meletakkan dasar bagi terobosan dalam penemuan obat, perawatan pasien, dan lainnya.