
Bergabunglah dengan buletin harian dan mingguan kami untuk mendapatkan pembaruan terkini dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari Lebih Lanjut
Dua tahun setelah ChatGPT dirilis ke publik, perbincangan tentang AI tidak dapat dihindari karena perusahaan di setiap industri berupaya memanfaatkan model bahasa besar (LLM) untuk mengubah proses bisnis mereka. Namun, meskipun LLM kuat dan menjanjikan, banyak pemimpin bisnis dan TI yang terlalu bergantung pada LLM dan mengabaikan keterbatasannya. Inilah sebabnya saya mengantisipasi masa depan di mana model bahasa khusus, atau SLM, akan memainkan peran yang lebih besar dan saling melengkapi dalam TI perusahaan.
SLM biasanya disebut sebagai “model bahasa kecil” karena memerlukan lebih sedikit data dan waktu pelatihan serta merupakan “versi LLM yang lebih efisien.” Namun saya lebih memilih kata “khusus” karena kata ini lebih mencerminkan kemampuan solusi yang dibuat khusus untuk melakukan pekerjaan yang sangat terspesialisasi dengan akurasi, konsistensi, dan transparansi yang lebih tinggi dibandingkan LLM. Dengan melengkapi LLM dengan SLM, organisasi dapat menciptakan solusi yang memanfaatkan kekuatan masing-masing model.
Kepercayaan dan masalah 'kotak hitam' LLM
LLM sangat kuat, namun terkadang mereka juga dikenal “kehilangan alur”, atau menawarkan keluaran yang menyimpang dari jalur karena pelatihan generalis dan kumpulan data yang sangat besar. Kecenderungan tersebut menjadi lebih bermasalah karena fakta bahwa ChatGPT OpenAI dan LLM lainnya pada dasarnya adalah “kotak hitam” yang tidak mengungkapkan bagaimana mereka sampai pada suatu jawaban.
Masalah kotak hitam ini akan menjadi masalah yang lebih besar di masa depan, terutama bagi perusahaan dan aplikasi bisnis penting yang mengutamakan akurasi, konsistensi, dan kepatuhan. Anggaplah layanan kesehatan, jasa keuangan, dan hukum sebagai contoh utama profesi di mana jawaban yang tidak akurat dapat menimbulkan konsekuensi finansial yang besar dan bahkan dampak hidup atau mati. Badan pengatur sudah memperhatikan dan kemungkinan akan mulai menuntut solusi AI yang dapat dijelaskan, terutama di industri yang mengandalkan privasi dan akurasi data.
Meskipun bisnis sering kali menerapkan pendekatan “human-in-the-loop” untuk memitigasi masalah ini, ketergantungan yang berlebihan pada LLM dapat menimbulkan rasa aman yang salah. Seiring berjalannya waktu, rasa puas diri bisa muncul dan kesalahan bisa lolos tanpa terdeteksi.
SLM = kemampuan menjelaskan yang lebih baik
Untungnya, SLM lebih cocok untuk mengatasi banyak keterbatasan LLM. Daripada dirancang untuk tugas tujuan umum, SLM dikembangkan dengan fokus yang lebih sempit dan dilatih pada data khusus domain. Kekhususan ini memungkinkan mereka menangani persyaratan bahasa yang berbeda-beda di bidang yang mengutamakan presisi. Daripada mengandalkan kumpulan data yang luas dan heterogen, SLM dilatih berdasarkan informasi yang ditargetkan, sehingga memberikan mereka kecerdasan kontekstual untuk memberikan respons yang lebih konsisten, dapat diprediksi, dan relevan.
Hal ini menawarkan beberapa keuntungan. Pertama, hal-hal tersebut lebih mudah dijelaskan, sehingga lebih mudah untuk memahami sumber dan alasan di balik keluarannya. Hal ini penting dalam industri yang diatur dimana keputusan perlu ditelusuri kembali ke sumbernya.
Kedua, ukurannya yang lebih kecil berarti mereka sering kali dapat bekerja lebih cepat dibandingkan LLM, yang dapat menjadi faktor penting untuk aplikasi real-time. Ketiga, SLM menawarkan kontrol lebih besar kepada bisnis atas privasi dan keamanan data, terutama jika SLM diterapkan secara internal atau dibuat khusus untuk perusahaan.
Selain itu, meskipun SLM pada awalnya memerlukan pelatihan khusus, SLM mengurangi risiko yang terkait dengan penggunaan LLM pihak ketiga yang dikendalikan oleh penyedia eksternal. Kontrol ini sangat berharga dalam aplikasi yang menuntut penanganan dan kepatuhan data yang ketat.
Fokus pada pengembangan keahlian (dan waspada terhadap vendor yang memberikan janji berlebihan)
Saya ingin memperjelas bahwa LLM dan SLM tidak saling eksklusif. Dalam praktiknya, SLM dapat meningkatkan LLM, menciptakan solusi hibrid di mana LLM memberikan konteks yang lebih luas dan SLM memastikan pelaksanaan yang tepat. Ini juga masih tahap awal dalam hal LLM, jadi saya selalu menyarankan para pemimpin teknologi untuk terus mengeksplorasi banyak kemungkinan dan manfaat LLM.
Selain itu, meskipun LLM dapat diskalakan dengan baik untuk berbagai masalah, SLM mungkin tidak dapat diterapkan dengan baik pada kasus penggunaan tertentu. Oleh karena itu, penting untuk memiliki pemahaman yang jelas tentang kasus penggunaan apa yang harus ditangani.
Penting juga bagi para pemimpin bisnis dan TI untuk mencurahkan lebih banyak waktu dan perhatian untuk membangun keterampilan khusus yang diperlukan untuk pelatihan, penyesuaian, dan pengujian SLM. Untungnya, ada banyak informasi dan pelatihan gratis yang tersedia melalui sumber umum seperti Coursera, YouTube, dan Huggingface.co. Para pemimpin harus memastikan pengembang mereka memiliki waktu yang cukup untuk belajar dan bereksperimen dengan SLM seiring dengan semakin intensifnya persaingan untuk mendapatkan keahlian AI.
Saya juga menyarankan para pemimpin untuk memeriksa mitranya dengan hati-hati. Saya baru-baru ini berbicara dengan sebuah perusahaan yang meminta pendapat saya tentang klaim penyedia teknologi tertentu. Menurut saya, mereka melebih-lebihkan klaim mereka atau terlalu berlebihan dalam memahami kemampuan teknologi.
Perusahaan dengan bijak mengambil langkah mundur dan menerapkan bukti konsep yang terkendali untuk menguji klaim vendor. Seperti yang saya duga, solusinya belum siap untuk ditayangkan, dan perusahaan dapat menyelesaikannya dengan investasi waktu dan uang yang relatif sedikit.
Baik sebuah perusahaan memulai dengan pembuktian konsep atau penerapan langsung, saya menyarankan mereka untuk memulai dari yang kecil, sering melakukan pengujian, dan membangun kesuksesan awal. Saya pribadi pernah mengalami bekerja dengan sekumpulan kecil instruksi dan informasi, hanya untuk menemukan hasil yang menyimpang ketika saya kemudian memberikan lebih banyak informasi kepada model tersebut. Itu sebabnya pendekatan perlahan dan mantap adalah pendekatan yang bijaksana.
Singkatnya, meskipun LLM akan terus memberikan kemampuan yang semakin berharga, keterbatasannya menjadi semakin jelas seiring dengan semakin meningkatnya ketergantungan perusahaan pada AI. Melengkapi SLM menawarkan jalan ke depan, terutama di bidang berisiko tinggi yang menuntut akurasi dan penjelasan. Dengan berinvestasi pada SLM, perusahaan dapat membuktikan strategi AI mereka di masa depan, memastikan bahwa alat mereka tidak hanya mendorong inovasi namun juga memenuhi tuntutan kepercayaan, keandalan, dan kontrol.
AJ Sunder adalah salah satu pendiri, CIO dan CPO di Responsive.
Pengambil Keputusan Data
Selamat datang di komunitas VentureBeat!
DataDecisionMakers adalah tempat para ahli, termasuk orang-orang teknis yang melakukan pekerjaan data, dapat berbagi wawasan dan inovasi terkait data.
Jika Anda ingin membaca tentang ide-ide mutakhir dan informasi terkini, praktik terbaik, serta masa depan data dan teknologi data, bergabunglah dengan kami di DataDecisionMakers.
Anda bahkan mungkin mempertimbangkan untuk menyumbangkan artikel Anda sendiri!
Baca Lebih Lanjut Dari DataDecisionMakers