Anthropic Tambahkan Fitur Claude untuk Mengakhiri Percakapan Guna Cegah Penyalahgunaan
17 Agustus 2025 – Anthropic mengumumkan peningkatan besar pada Claude, model AI andalannya, dengan menambahkan fitur yang memungkinkan sistem secara otomatis mengakhiri percakapan jika terdeteksi potensi penyalahgunaan. Langkah ini dirancang untuk meningkatkan keamanan sekaligus mencegah model digunakan dalam skenario berbahaya.
Fitur baru ini bekerja dengan memantau konteks dialog secara real-time. Jika Claude menemukan bahwa interaksi mengarah pada percobaan manipulasi, aktivitas ilegal, atau permintaan yang berpotensi membahayakan, AI dapat menghentikan percakapan secara sepihak. Dengan begitu, risiko eksploitasi terhadap model menjadi lebih kecil.

Anthropic menjelaskan bahwa fitur ini merupakan bagian dari filosofi “Constitutional AI” yang mereka kembangkan, yaitu pendekatan yang menekankan prinsip keamanan, etika, dan transparansi dalam setiap interaksi AI. Dengan kemampuan ini, Claude tidak hanya pasif menolak permintaan, tetapi juga proaktif menjaga batasan penggunaan.
Pembaruan ini juga memperlihatkan perbedaan pendekatan Anthropic dibandingkan kompetitornya. Di saat perusahaan AI lain berfokus pada penambahan fitur produktivitas dan perluasan model multimodal, Anthropic menonjolkan keamanan dan mitigasi risiko sebagai nilai jual utama.
Bagi pengguna bisnis dan institusi, hal ini bisa menjadi nilai tambah penting karena memberikan jaminan bahwa AI tidak hanya pintar, tetapi juga lebih aman digunakan di lingkungan sensitif.
Sumber: BleepingComputer








