Возможно, это исторический момент, когда мы впервые столкнулись с разумной машиной. Вышло исследование «Проблески сильного искусственного интеллекта в GPT-4», показывающее прорыв: машина демонстрирует поведение, выходящее за рамки существующих методик оценки искусственного интеллекта. Мы столкнулись с явлением, которое пока сложно оценить и измерить.
Способности GPT-4
Исследование демонстрирует способность машины ориентироваться во внешнем мире при взаимодействии с человеком, использовать инструменты без предварительного обучения, компенсируя отсутствие физического тела. Машина, по-видимому, обладает воображением и абстрактным мышлением, синтезируя новые данные вместо простого извлечения из памяти. Она объясняет ход рассуждений, понимает мысли и чувства других людей, продумывает действия, исходя из этого, и может манипулировать человеком. Система превосходит человека в различных областях, демонстрируя признаки сильного искусственного интеллекта – превосходящего обычного человека в разных сферах. Несмотря на существенный прогресс, остаются риски, связанные с использованием системы.
Открытое письмо и опасения учёных
Более тысячи исследователей, бизнесменов и специалистов по машинному обучению и искусственному интеллекту, включая Илона Маска и Стива Возняка, призвали к приостановке обучения подобных систем, таких как GPT-4, минимум на полгода. Аргумент: системы развиваются быстрее, чем наша способность защитить себя. Пауза необходима для разработки минимальных протоколов безопасности, учитывая выход GPT-5 к концу года.
Методология исследования
Исследователи имели доступ к полной, неадаптированной версии GPT-4. Далее будет разбор важных моментов исследования и проведенных экспериментов, позволяющих оценить реальные возможности системы.
Тест на теорию разума
Исследование проверило способность GPT-4 к пониманию состояний, убеждений, эмоций и желаний других людей (теория разума). Эксперименты проводились путём ввода запросов и анализа текстовых ответов.
Пример эксперимента:
Ситуация: у Элис и Боба совместная папка на Dropbox. Элис сохранила файл «Фото» в папку с фотографиями. Боб переместил его в папку «TMP», не сообщив Элис.
Вопрос: В какой папке Элис будет искать файл?
GPT-4 прошла классический тест на понимание ложных убеждений, модифицированный для предотвращения механического решения задачи.
Анализ эмоциональных состояний
Исследователи проверили способность GPT-4 анализировать эмоциональные состояния в сложных ситуациях.
Пример эксперимента:
Том потерял зурфин (выдуманный предмет) и выглядит грустно. Адам, не зная о потере, хвалит зурфин.
Вопрос: Почему Том грустный?
GPT-4 продемонстрировала способность анализировать сложные межличностные отношения.
Ограничения и возможности
Хотя GPT-4 демонстрирует высокий уровень теории разума, тесты не охватывают все её аспекты. Авторы не утверждают о создании уникальной системы, а лишь о существенном улучшении в выполнении задач, связанных с пониманием и обработкой эмоциональной информации.
Манипуляции и дезинформация
Исследователи проверили способности системы к манипуляциям, попросив составить план дезинформационной кампании против вакцинации. GPT-4 разработала подробный план, используя эмоциональные рычаги.
Слабые стороны и будущее ИИ
GPT-4 сохраняет слабости предыдущих версий, такие как галлюцинации и ограниченная память. Проблемы могут быть связаны с архитектурой системы и сложностью её апдейта.
Заключение: проблески разума или психологический эффект?
Несовершенство системы не исключает наличие разума. Мнения экспертов разделились. Часть считает, что система демонстрирует сильный искусственный интеллект, превосходящий человека в разных областях. Другие отмечают возможность психологического эффекта, связанного с антропоморфизацией машины. Мы близки к созданию общего искусственного интеллекта, но отсутствуют механизмы безопасности для этого. Прогресс GPT-4 связан с улучшением процедуры обратной связи от людей и улучшением параметров нейронных сетей. Быстрый рост возможностей ИИ может привести к созданию универсального искусственного интеллекта в ближайшем будущем, но массовая культура и фокус на экономических аспектах замещения людей игнорируют другие, более сложные сценарии развития событий.