Трудно поверить, что ChatGPT был запущен всего чуть больше года назад. За такой короткий промежуток времени он полностью изменил то, как мы учимся, работаем и даже в какой-то степени живем. Независимо от того, использовали ли вы лично разговорный искусственный интеллект или просто слышали о нем, его влияние на мир неоспоримо.
Взаимодействуя с ChatGPT, легко забыть, что вы разговариваете с тщательно разработанным программным обеспечением, а не с чрезвычайно осведомленным другом. Непринужденный и гуманистический тон искусственного интеллекта в сочетании с плавной интеграцией языковых нюансов и пониманием контекста стирает грань между искусственно созданным инструментом и подлинным собеседником.
Однако, среди всех этих беспроблемных бесед, задумывались ли вы когда-нибудь о том, как на самом деле работает ChatGPT? Что скрывается под поверхностью чат-бота, с которым мы так хорошо знакомы? Откуда берется его разумность и насколько она разумна?
***
В области искусственного интеллекта существует хорошо известная концепция ‘черного ящика’, которая относится к отсутствию прозрачности и понимания системы искусственного интеллекта. В то время как ИИ может предоставлять полезные результаты по мере необходимости, фактические механизмы и процессы, которые определяют, как именно он производит такие результаты, могут оставаться непрозрачными и неясными для пользователей. Многие ученые предостерегали от “черного ящика”. Системы искусственного интеллекта, поскольку недостаточное понимание рассуждений ИИ и процесса принятия решений может привести к опасениям относительно контроля, подотчетности и предвзятости. Таким образом, предпринимаются новые меры предосторожности и прилагаются усилия для снижения вероятности появления “черного ящика”. ИИ разрабатываются по мере того, как ученые стремятся лучше понять системы, которые они производят.
Исходя из аналогичной логики, для нас, как ответственных пользователей ChatGPT и других систем искусственного интеллекта, важно иметь фундаментальное понимание того, как эти системы работают. Хотя вам не нужно иметь подробных знаний о программном обеспечении, полезно иметь базовое представление об этой умной технологии, а не просто рассматривать ее как вышеупомянутый таинственный ‘черный ящик’.
***
ChatGPT был разработан OpenAI, исследовательской лабораторией искусственного интеллекта, основанной в декабре 2015 года Илоном Маском, Сэмом Альтманом, Грегом Брокманом, Ильей Суцкевером, Войцехом Зарембой и Джоном Шульманом. Как приложение, ChatGPT работает на базовой языковой модели, которая обеспечивает ему интеллектуальность. ‘GPT’ в ChatGPT расшифровывается как Генеративный Предварительно обученный трансформатор, который и является названием этой модели.
Модель постоянно обновляется и совершенствуется, но текущими версиями являются GPT-3.5 Turbo и GPT-4. Интересно, что эти модели существуют уже некоторое время, используя другие инструменты, такие как функции искусственного интеллекта Bing, Jasper и чат-боты со всего Интернета. Однако ChatGPT действительно представила эти модели широкой публике, позволив каждому взаимодействовать с текстовым генератором искусственного интеллекта и использовать его.
***
Итак, как работают эти языковые модели? Во-первых, важно понимать, что машинное обучение — это данные, обучение и — как вы уже догадались – обучение. Проще говоря, модель обучается путем передачи данных и использования математических алгоритмов для “извлечения уроков” из них, а затем тонкой настройки самой себя, чтобы сделать ее более эффективной. В Интернете доступно почти непостижимое количество информации и данных. Огромное количество этих данных было передано в GPT для ее обучения, и благодаря программированию и тщательно разработанным математическим алгоритмам модель смогла обучаться, а затем совершенствовать себя.
Интересно, что до GPT лучшие модели искусственного интеллекта использовали “контролируемое обучение’, когда модель обучается на основе данных, которые классифицированы и помечены описаниями. Поскольку предоставляемые наборы данных помечены, эти модели могут использовать их для обучения своих алгоритмов распознаванию закономерностей и прогнозированию результатов путем сравнения данных, которые они сами пометили, с предоставленными ‘истинными’ метками.
Однако GPT использует метод, называемый генеративным предварительным обучением, который заключается в том, что модели задаются некоторые основные правила, а затем передаются немаркированные данные. Затем неконтролируемой модели разрешается самостоятельно просматривать данные, разрабатывая свои собственные шаблоны и взаимосвязи в наборах данных.
***
Все это обучение создает нейронную сеть с глубоким обучением, которая представляет собой многоуровневый и сложный алгоритм. Нейронная сеть напоминает мозг, позволяя GPT развивать интеллект и имитировать реакции человека.
Сеть GPT использует трансформаторную архитектуру, которая представляет собой особый тип сети. Основная концепция, отличающая transformers от других типов сетей, – это процесс, называемый “самонаблюдением”, который относится к способности transformers читать каждое слово в предложении сразу, вместо того чтобы просто читать слева направо, как в старых сетях. Преобразователи обладают такой способностью, поскольку они могут выполнять несколько вычислений параллельно. Это позволяет GPT сосредоточиться на наиболее релевантных словах и формировать более сложные и тонкие связи между различными словами в предложении, что приводит к лучшему пониманию. Кроме того, эта способность значительно сокращает время обучения, делая модели с искусственным интеллектом как более быстрыми, так и дешевыми.
***
Но как текст может быть понят моделью искусственного интеллекта? Ответ заключается в чем-то, называемом “токенами”.
Токены – это просто фрагменты текста, закодированные в числовой форме, точнее, в виде векторов. Чем ближе два вектора, тем более связанным является текст. Сама модель отображает токены в векторном пространстве, что позволяет ей присваивать токенам значение и предсказывать последующий текст. Таким образом, токены позволяют моделям принимать текст и преобразовывать его в форму, удобную для них.
***
Прежде чем GPT был признан подходящим для публичного выпуска, он подвергся дополнительной доработке. Для улучшения диалоговых способностей ChatGPT использовалась техника, называемая RLHF (обучение с подкреплением с помощью обратной связи с человеком). Были созданы демонстрационные данные с ожидаемыми ответами для различных ситуаций и переданы в модель, чтобы помочь ей изучить наилучший ответ на различные сценарии. Этот более контролируемый подход был необходим для точной настройки и оптимизации.
***
Теперь, когда мы лучше понимаем, как работают ChatGPT и другие большие языковые модели, мы можем начать теоретизировать о том, что может ждать эти мощные инструменты в будущем. Хотя ChatGPT и другие языковые модели далеки от совершенства, нельзя отрицать, что они будут продолжать совершенствоваться и оказывать все более влиятельное влияние на мир. В настоящее время разрабатываются новые модели с более высокой точностью и более быстрым временем адаптации, что позволяет им обеспечивать лучшие реакции и идти в ногу с быстро меняющимися языковыми моделями людей. По мере развития языковых моделей в их диалоговых системах они, вероятно, будут включены в более широкий спектр приложений.
Например, некоторые ученые считают, что ChatGPT обладает потенциалом революционизировать образование, поскольку может обеспечить более персонализированный и интерактивный опыт, соответствующий конкретным потребностям. В будущем языковые модели можно было бы использовать в качестве виртуальных репетиторов для обеспечения мгновенной обратной связи и индивидуального обучения. Кроме того, ChatGPT может помочь повысить доступность образования, предоставляя учащимся в отдаленных и региональных населенных пунктах такой же доступ к экспертным знаниям, как и учащимся в мегаполисах.
Кроме того, ChatGPT также может использоваться для повышения личной продуктивности за счет предоставления услуг виртуального помощника и выполнения жизненно важных ролей в управлении проектами. Некоторые эксперты даже предложили использовать ChatGPT в качестве виртуального терапевта или консультанта при лечении психических заболеваний, чтобы оказывать более доступную и экономичную помощь.
***
Однако, как и в случае со всеми новыми и захватывающими технологиями, жизненно важно, чтобы мы не забывали об этических последствиях ChatGPT и новых моделях искусственного интеллекта. Я не имею в виду риск того, что ChatGPT и искусственный интеллект захватят мир, хотя у меня есть друг, который начинает каждый разговор в ChatGPT словами ‘Привет, детка’, поскольку он хочет, чтобы ChatGPT пощадила его, если однажды все-таки решит покончить с человечеством. Вместо этого я имею в виду проблемы, связанные с предвзятостью и потенциальным неправильным использованием этих мощных технологических инструментов.
По мере того, как ChatGPT и другие ИИ становятся более совершенными, возможности для неправильного использования также растут. При отсутствии надлежащего мониторинга эти модели с открытым исходным кодом могут использоваться для распространения дезинформации или выражения определенных мнений. Что касается проблемы смещения, выходные данные ChatGPT зависят от его входных данных. Итак, если входные данные для ChatGPT содержат определенные смещения, то выходные данные будут отражать их. Таким образом, важно обеспечить, чтобы модели с открытым исходным кодом оставались объективными и заслуживающими доверия источниками информации, поскольку они потенциально могут формировать общественное мнение. Другие вопросы, такие как конфиденциальность и этические соображения, связанные с заменой сотрудников-людей на ChatGPT, также должны быть тщательно оценены.
Жизненно важно гарантировать, что по мере развития технологий и языковых моделей, таких как ChatGPT, наши законы и нормативные акты не будут отставать. В конечном счете, эти новые законы и нормативные акты должны основываться на понимании, вот почему так важно не позволить новым технологиям искусственного интеллекта просто превратиться в черный ящик. Нам нужно нырнуть под поверхность, чтобы правильно предсказать, что должно произойти.
Полезные ресурсы: