Появление GPT-4o в Project Astra – агенте Google “Искусственный интеллект для всего” – и новые обновления на рабочем месте, “меняющие правила игры”, то есть Microsoft Copilot, этим летом открыли новые рубежи в корпоративном искусственном интеллекте.
Big Tech стремится представить ультрасовременные интеллектуальные системы, которые изменят работу в будущем, будь то индивидуальный агент, способный выполнить заказ клиента, не дожидаясь инструкций от человека, или личный ассистент, который взаимодействует голосом / текстом / кодом в режиме реального времени.
Ключом к этим разработкам является появление ”мультимодальной” функциональности: генеративных моделей искусственного интеллекта, которые могут комбинировать данные из различных источников, включая текст, изображения, видео, голос и код. Результат стал переломным моментом, мало чем отличающимся от того, когда Mosaic запустила первый в мире удобный для потребителя веб-браузер в 1993 году.
Как и на заре Интернета, нам еще предстоит увидеть, как именно эти новообретенные возможности, такие как способность интерпретировать окружающую среду, создавать видео из текста или вести прямые разговоры, будут формироваться в ближайшие годы. Но в атмосфере интенсивного соперничества искусственного интеллекта, в котором даже опытные пионеры SaaS, такие как Salesforce, изо всех сил пытаются не отставать, их влияние на корпоративные инструменты нового поколения, несомненно, будет глубоким.
Какие практические варианты использования существуют в этом дивном новом мире мультимодального ИИ и интеллектуальных интерфейсов? Как компании могут использовать стремительную эволюцию для преобразования абстрактного потенциала в реальную ценность? Вот три основных урока.:
1. Персонализированная разработка и ускоренное принятие решений
Интеллектуальные интерфейсы быстро создают новый класс помощников с искусственным интеллектом и цифровых сотрудников. Прирожденные коммуникаторы со встроенной осведомленностью о контексте, эти все более способные помощники вскоре могут быть встроены в архитектуру всех крупномасштабных систем CX, HR и управления проектами.
Воспользуйтесь наставничеством – областью роста предприятия, эффективное управление которой может быть сложным и отнимать много времени. Интеллектуальная платформа искусственного интеллекта, такая как Chronus, может создавать персонализированные пути обучения, учитывающие уникальные потребности и предпочтения каждого подопечного, помогая людям на всех уровнях получить индивидуальную поддержку.
В более широком смысле недавний выпуск помощника Amazon Q на базе искусственного интеллекта призван помочь сотрудникам стать на 80% более продуктивными на своей работе за счет сложного делегирования задач, анализа данных и поддержки принятия решений. Компания также недавно представила две новые возможности для своих агентов ИИ в Amazon Bedrock, своей более широкой корпоративной платформе. Сохранение памяти позволяет агентам собирать информацию из предыдущих взаимодействий с пользователем. Между тем, генерация кода позволяет агентам генерировать код, помогающий решать уравнения и оптимизировать решения на основе изменяющихся данных.
2. Интеллектуальные системы в стандартной комплектации
Поскольку целью этой новой волны корпоративного искусственного интеллекта является “избавление от рутинной работы”, это может быстро стать более обычным делом, чем мы ожидаем. В конце концов, прошло менее двух лет с момента революционного появления ChatGPT, а мы уже обсуждаем способы сделать его менее “медленным” и “ленивым”.
Аналогичным образом, мультимодальные интерфейсы расширят возможности, подобные человеческим, во многих областях цифрового рабочего места, став такими же интуитивно понятными для офисной жизни, как вызов Zoom или Slack huddle. Их основное применение будет в бэк-офисе, как в бьющемся сердце бесчисленных операций.
Однако творческий потенциал ИИ таков, что эта сверхдержава не обязательно должна создаваться за счет человеческих рабочих мест. Американский поставщик медицинских технологий Empara недавно запустила настраиваемого виртуального помощника с искусственным интеллектом под названием “Em”. Разработанные для ответов на вопросы пользователей о преимуществах для здоровья, политике, страховом покрытии и многом другом, Em могут значительно снизить нагрузку на колл-центр. Конечная цель – дать медицинским работникам больше времени, чтобы сосредоточиться на сложных вопросах оказания помощи, требующих вмешательства.
Новая эра искусственного интеллекта также может привести к появлению совершенно новых предприятий. Mindtrip, например, является одной из нескольких персонализированных туристических платформ на базе искусственного интеллекта, которые обрабатывают ответы в чате на естественном языке, а также фотографии, карты, данные бронирования и многое другое. По словам генерального директора Энди Мосса, концепция инструмента заключается в том, “как вы используете естественный язык ChatGPT, но со встроенным убийственным интерфейсом, ориентированным на потребителя, который действительно привязывает карты, карточки данных и расписания рейсов и использует их на протяжении всего процесса бронирования”.
3. Структурное творчество: большое переосмысление
Если мультимодальность перестраивает то, как мы взаимодействуем с машинами, это означает, что мы можем переопределить то, как выполняется человеческая работа. Одно из самых больших преимуществ этой последней главы в области технологий проектирования, ориентированных на человека, заключается в том, что она позволяет перестроить повседневные рабочие процессы и организационные структуры.
Например, Security startup Command Zero использует большие языковые модели для поддержки киберисследователей после крупного нарушения безопасности. Специалисты по реагированию на инциденты участвуют в своеобразном “выбери свое собственное приключение”, которое направлено на радикальное сокращение времени разрешения с часов до минут – при этом выявляя подсказки, которые в противном случае могли быть упущены.
JAX assistant от бухгалтерской технологической компании Xero может предоставлять малым предприятиям персонализированную информацию, устранять проблемы клиентов и предлагать прогнозы для поддержки человеческих решений. Он предвосхищает и упрощает взаимодействие с пользователями таким образом, что дополняет, а не заменяет их.
Рост мультимодального искусственного интеллекта сигнализирует о грядущих захватывающих временах для предприятий всех видов. Повышая производительность и вовлеченность, компании могут значительно повысить ценность своего рыночного предложения.
В то же время это не упражнение в тщеславии: руководители должны уделять пристальное внимание тому, какие инструменты оказывают ощутимое влияние на повседневную производительность, чтобы ИИ выполнил свои обещания по преобразовательным изменениям.