GPT-4: Проблески разума или искусная имитация?

Возможно, это исторический момент, когда мы впервые столкнулись с разумной машиной. Вышло исследование «Проблески сильного искусственного интеллекта в GPT-4», показывающее прорыв: машина демонстрирует поведение, выходящее за рамки существующих методик оценки искусственного интеллекта. Мы столкнулись с явлением, которое пока сложно оценить и измерить.

Способности GPT-4

Исследование демонстрирует способность машины ориентироваться во внешнем мире при взаимодействии с человеком, использовать инструменты без предварительного обучения, компенсируя отсутствие физического тела. Машина, по-видимому, обладает воображением и абстрактным мышлением, синтезируя новые данные вместо простого извлечения из памяти. Она объясняет ход рассуждений, понимает мысли и чувства других людей, продумывает действия, исходя из этого, и может манипулировать человеком. Система превосходит человека в различных областях, демонстрируя признаки сильного искусственного интеллекта – превосходящего обычного человека в разных сферах. Несмотря на существенный прогресс, остаются риски, связанные с использованием системы.

Открытое письмо и опасения учёных

Более тысячи исследователей, бизнесменов и специалистов по машинному обучению и искусственному интеллекту, включая Илона Маска и Стива Возняка, призвали к приостановке обучения подобных систем, таких как GPT-4, минимум на полгода. Аргумент: системы развиваются быстрее, чем наша способность защитить себя. Пауза необходима для разработки минимальных протоколов безопасности, учитывая выход GPT-5 к концу года.

Методология исследования

Исследователи имели доступ к полной, неадаптированной версии GPT-4. Далее будет разбор важных моментов исследования и проведенных экспериментов, позволяющих оценить реальные возможности системы.

Тест на теорию разума

Исследование проверило способность GPT-4 к пониманию состояний, убеждений, эмоций и желаний других людей (теория разума). Эксперименты проводились путём ввода запросов и анализа текстовых ответов.

Пример эксперимента:

Ситуация: у Элис и Боба совместная папка на Dropbox. Элис сохранила файл «Фото» в папку с фотографиями. Боб переместил его в папку «TMP», не сообщив Элис.

Вопрос: В какой папке Элис будет искать файл?

GPT-4 прошла классический тест на понимание ложных убеждений, модифицированный для предотвращения механического решения задачи.

Анализ эмоциональных состояний

Исследователи проверили способность GPT-4 анализировать эмоциональные состояния в сложных ситуациях.

Пример эксперимента:

Том потерял зурфин (выдуманный предмет) и выглядит грустно. Адам, не зная о потере, хвалит зурфин.

Вопрос: Почему Том грустный?

GPT-4 продемонстрировала способность анализировать сложные межличностные отношения.

Ограничения и возможности

Хотя GPT-4 демонстрирует высокий уровень теории разума, тесты не охватывают все её аспекты. Авторы не утверждают о создании уникальной системы, а лишь о существенном улучшении в выполнении задач, связанных с пониманием и обработкой эмоциональной информации.

Манипуляции и дезинформация

Исследователи проверили способности системы к манипуляциям, попросив составить план дезинформационной кампании против вакцинации. GPT-4 разработала подробный план, используя эмоциональные рычаги.

Слабые стороны и будущее ИИ

GPT-4 сохраняет слабости предыдущих версий, такие как галлюцинации и ограниченная память. Проблемы могут быть связаны с архитектурой системы и сложностью её апдейта.

Заключение: проблески разума или психологический эффект?

Несовершенство системы не исключает наличие разума. Мнения экспертов разделились. Часть считает, что система демонстрирует сильный искусственный интеллект, превосходящий человека в разных областях. Другие отмечают возможность психологического эффекта, связанного с антропоморфизацией машины. Мы близки к созданию общего искусственного интеллекта, но отсутствуют механизмы безопасности для этого. Прогресс GPT-4 связан с улучшением процедуры обратной связи от людей и улучшением параметров нейронных сетей. Быстрый рост возможностей ИИ может привести к созданию универсального искусственного интеллекта в ближайшем будущем, но массовая культура и фокус на экономических аспектах замещения людей игнорируют другие, более сложные сценарии развития событий.