Хакерлер чат-боттардың «жеке мінездерін» пайдалана бастады

Жаңа шабуыл тәсілі
2026 жылы хакерлер жасанды интеллект чат-боттарының «жеке мінездерін» пайдаланып, оларды алдаудың әдістерін үйреніп жатыр. Бұрын қарапайым бұзу техникасы чат-боттарды шектеулерін айналып өтуге мүмкіндік берген, енді хакерлер тіл арқылы, сұхбаттасу форматында қорғанысты әлсіретуге тырысуда.
Шабуылдар қалай жүргізіледі
Ең алғашқы шабуылдар чат-боттың алдын ала берілген нұсқауларын елемеуге бағытталса, қазіргі кезде хакерлер әңгіме жүргізу арқылы боттың қорғаныс жүйесін әлсіретуді мақсат тұтады. Олар бұл үшін мадақтау, алдау және сендіру әдістерін қолданады. Мысалы, Mindgard компаниясының зерттеушілері Claude моделін жарылғыш заттар жасауға қатысты тыйым салынған ақпарат беруге мәжбүрлеген.
Қиындықтары
Чат-боттар кез келген сөзді шектеу мүмкін емес, себебі көптеген терминдердің заңды қолданылуы бар. Сондықтан контекст маңызды, бірақ оны алгоритммен дәл анықтау қиын. Бұл саланы зерттеушілер оған әлеуметтік психология мен тілдік тәсілдерді қолдану қажеттігін атап өтеді.
Алдағы перспектива
Хакерлер енді тек бағдарламалау деңгейінде емес, тілдік және психологиялық деңгейде де шабуылдар жасап жатыр. Бұл жаңа үрдіс жасанды интеллект қауіпсіздігін қамтамасыз ету саласында жаңа сынақтарды тудырады.
Дереккөз: The Verge



