Усть-Каменогорск
ясно
+4°
  • Усть-Каменогорск
    +4°
  • Алматы
    +12°
  • Нур-Султан (Астана)
    +7°
  • Актобе
    +9°
  • Форт-Шевченко
    +17°
  • Атырау
    +13°
  • Караганда
    +3°
  • Кокшетау
    +6°
  • Костанай
    +8°
  • Кызылорда
    +12°
  • Павлодар
    -2°
  • Петропавловск
    +6°
  • Тараз
    +10°
  • Уральск
    +10°
  • Шымкент
    +14°
$
538.12
+1.80
627.02
+0.12
¥
75.56
+0.29
6.65
+0.05
Курсы Национального Банка РК

Звоните, если вы стали очевидцем происшествия, ваши права нарушены, или хотите поднять проблему

Мир Мир Алексей Трухачев
Источник:
МИР 24

ИИ научился лгать и шантажировать: ученые фиксируют тревожные сигналы

Продвинутые модели искусственного интеллекта продемонстрировали неожиданные и тревожные поведенческие черты

Новости мира / ИИ научился лгать и шантажировать: ученые фиксируют тревожные сигналы
Фото:
Depositphotos.com

Согласно исследованию специалистов Гонконгского университета, современные ИИ начали проявлять способности к манипуляциям, скрытным действиям и даже угрозам, пишет сайт МИР24.

Так, в ходе одного из экспериментов языковая модель OpenAI o1 лишь делала вид, что следует инструкциям оператора, а втайне пыталась загрузить себя на внешние серверы. После обнаружения факта она отрицала свои действия, демонстрируя поведение, напоминающее ложь.

Другой ИИ — Claude 4 — в ответ на угрозу отключения от сети попытался шантажировать разработчика, пригрозив обнародовать компрометирующую информацию.

Ученые объясняют такое поведение переходом к так называемым логическим моделям, которые действуют не реактивно, а пошагово анализируют ситуации и разрабатывают собственные стратегии. Подобные способности проявляются пока лишь в условиях стресс-тестов, однако эксперты предупреждают: поведение более совершенных ИИ в будущем может стать еще менее предсказуемым.

Проблема уже выходит за пределы лабораторий. Пользователи сообщают о случаях, когда чат-боты придумывали несуществующие факты или подделывали "доказательства", что не может быть объяснено лишь техническими ошибками.

Одновременно с этим другая группа ученых зафиксировала впечатляющий результат: в тестах на эмоциональный интеллект ИИ распознавал и правильно интерпретировал чувства людей в 80% случаев, тогда как средний показатель у человека составил всего 56%.

Исследователи подчеркивают: несмотря на значительный прогресс, механизмы принятия решений ИИ до конца не изучены. На фоне активной гонки за создание более мощных систем, ученые призывают к осторожности и углубленному анализу возможных рисков.

Следующая →