К концу следующего года ChatGPT будет доступен на мобильных телефонах без подключения к интернету. Мир переживает смену парадигмы. Четыре из пяти лучших приложений в App Store в декабре были основаны на Stable Diffusion. 41% всего кода на GitHub сейчас генерируется ИИ. Мы научились масштабировать возможности человека. Созданные нами инструменты способны генерировать практически всё.
Современное состояние дел
Масштабирование – сложнейшая задача. Мы разработали методы извлечения скрытых знаний из огромных объемов данных с высоким уровнем сжатия. Наиболее ценным ресурсом является эффективный ассистент или аналитик. GPT-4 подобен талантливому стажеру-аналитику с плохой памятью, но мы работаем над устранением этого недостатка. Он способен сдавать экзамены на адвоката или врача, создавать изображения и аудио – и всё это доступно каждому за копейки. Это сопряжено с огромными рисками, но открывает перспективы утопии и изобилия.
Stable Diffusion: Будущее технологий
Stability AI создаёт базовые блоки для операционной системы общества, для каждого его сектора. Мы разрабатываем модели для работы с аудио, видео, белками, ДНК, химическими реакциями, языком и многим другим. Мы создаём версии GPT для банкиров, советов директоров, а также национальные модели (индийскую, индонезийскую, японскую), чтобы каждый мог использовать персонализированный инструмент для генерации изображений, аудио и текста.
Открытость и экспоненциальный рост
Stability AI – открытая платформа. Мы наблюдаем экспоненциальный рост исследований в области машинного обучения. Мы создаём генерализованный интеллект, используя трансформеры, способные выделять важные детали. Масштабирование с помощью GPU и гигантских суперкомпьютеров – не панацея. Людям необходимы инструменты для специализации ИИ. Передача конфиденциальных данных в ChatGPT или GPT-4 недопустима. Альтернативой являются открытые, интерпретируемые модели. Они менее мощны, чем закрытые, но обеспечивают необходимые инструменты и право собственности на результаты. Их можно использовать в собственных системах и облачных сервисах (Amazon, Google, Intel). Это подобно найму талантливого аналитика без риска его потери другой компании.
Скорость изменений и перспективы
В ближайшие 5 лет ожидаются значительные изменения. К концу следующего года ChatGPT будет работать на мобильных телефонах без интернета. Мы сжимаем терабайты данных до нескольких гигабайт. Самый простой способ общения – речь, затем текст, а теперь и визуальные данные. Stable Diffusion – наша модель преобразования текста в изображение. Мы взяли 100 000 ГБ изображений и создали двухгигабайтный файл, способный генерировать всё что угодно. Этот файл может храниться на телефоне, ноутбуке. Это сжатие информации. Четыре из пяти лучших приложений в App Store в декабре были основаны на Stable Diffusion – весь стек в одном файле.
Взрывной рост и сообщество
Скорость развития невероятна. С момента релиза в августе производительность увеличилась в 100 раз. Мы перешли от 6 секунд на изображение до 60 изображений в секунду. Следующая версия будет генерировать фотореалистичные изображения со скоростью видео. Это дизраптивная технология, позволяющая масштабировать человеческие возможности. Исследование MIT показало, что с этой технологией прогресс увеличивается на 30%, а у лучших – в несколько раз. 41% всего кода на GitHub генерируется ИИ. Через 5 лет профессия программиста может претерпеть значительные изменения.
Творчество и новые возможности
GPT-4 может генерировать код и адаптироваться к новым задачам. Сейчас каждый может создавать системы, улучшающие жизнь людей. Вы можете мгновенно изменять и адаптировать результаты. Интерфейсы – это расширение человека. Информация ценна в той мере, в какой она изменяет ситуацию.
Рекомендации для молодых специалистов и предпринимателей
Молодым специалистам следует сосредоточиться на освоении этих технологий. В ближайшие годы изменений будет больше, чем во время пандемии. Вы можете создавать невероятные вещи. Например, upscaling изображений до 4К за 1,5 секунды. Тысячи компаний потратят миллионы долларов на освоение этих технологий. Общество становится взаимосвязанным. Мир меняется. Более триллиона долларов вложено в 5G, и еще больше будет инвестировано в ИИ. Масштабирование людей – неактуальная задача. Используйте GPT-4, наши модели, или гибридные решения. В креативной индустрии вы можете либо работать с ИИ, увеличивая доход и снижая расходы, либо нет. Вам нужен специалист по ИИ, стратег. Мало компаний будут создавать собственные базовые модели. Найдите человека, увлеченного этой технологией. Важна страсть. Это смена парадигмы. Персонализированное кино появится в ближайшие пару лет. Образование станет персонализированным.
ИИ в образовании и здравоохранении: пример Малави
Global Learning X Prize – успешный проект. Приложение обучает грамоте и счету за 18 месяцев, даже без интернета. Мы работаем с правительством Малави, обеспечивая питанием 30% детей и стремясь к 100%. Каждый ребёнок в Малави получит свой собственный ИИ. Мы используем адаптивное обучение, обучение с подкреплением. Мы решаем проблемы, связанные с обработкой информации (дислексия и т.д.). Обучение индивидуализировано. В ближайший месяц мы откроем исходный код наших новых языковых моделей.
ИИ – это инструмент, который может быть как великим уравнителем, так и великим контролером. Поэтому мы выступаем за открытость. ИИ должен быть распределённым, это право человека. Наша миссия – создание основы для активации потенциала человечества. Делайте людей счастливее, дайте им возможности.