Полный вперед: ландшафт 2024 года (машинное обучение, искусственный интеллект и данные)

Источник
Это наш десятый ежегодный ландшафт и “состояние союза” данных, аналитики, машинного обучения и экосистемы искусственного интеллекта.

За более чем 10 лет работы в этой сфере все никогда не было таким захватывающим и многообещающим, как сегодня. Все тенденции и подтренды, которые мы описывали на протяжении многих лет, объединяются: данные оцифрованы в огромных количествах; их можно хранить, обрабатывать и анализировать быстро и дешево с помощью современных инструментов; и самое главное, их можно передавать во все более эффективные модели ML / AI, которые могут понимать их, распознавать закономерности, делать прогнозы на их основе и теперь генерировать текст, код, изображения, звуки и видео.

Безумная экосистема (ML, ИИ и данные) превратилась из нишевой и технической в мейнстрим. Похоже, что смена парадигмы ускоряется с последствиями, которые выходят далеко за рамки технических или даже деловых вопросов и влияют на общество, геополитику и, возможно, на условия жизни человека.

Однако в этом десятилетнем мегатренде еще предстоит написать много глав. Как и каждый год, этот пост представляет собой попытку понять, где мы находимся в настоящее время, по продуктам, компаниям и отраслевым тенденциям.

Вот предыдущие версии: 2012, 2014, 2016, 2017, 2018, 2019 (Часть I и часть II), 2020, 2021 и 2023 (часть I, часть II, часть III, часть IV).

В этом году нашей командой были Аман Кабир и Кэти Миллс (FirstMark), Джонатан Грана (Go Fractional) и Паоло Кампос, большое спасибо всем. А также большое спасибо CB Insights за предоставление данных карты, отображаемых в интерактивной версии.

Этот ежегодный пост о положении в союзе состоит из трех частей:

Часть I: Ландшафт (PDF, интерактивная версия)
Часть II: 24 темы, о которых мы думаем в 2024 году
Часть III: Финансирование, слияния и поглощения и IPO

mad2024 Скачать

ЧАСТЬ I: ЛАНДШАФТ

Ссылки

Чтобы увидеть PDF ландшафт 2024 года в полном разрешении (пожалуйста, увеличьте масштаб!), пожалуйста, НАЖМИТЕ ЗДЕСЬ

Чтобы получить доступ к интерактивной версии БЕЗУМНОГО ландшафта 2024 года, пожалуйста, НАЖМИТЕ ЗДЕСЬ

Количество компаний

Безумный ландшафт 2024 года включает в себя 2 011 логотипов в общей сложности.

Это число увеличилось с 1416 в прошлом году, и на карте появилось 578 новых участников.

Для справки, в самой первой версии 2012 года было всего 139 логотипов.

Интенсивная (безумная?) перенаселенность ландшафта в первую очередь являетсярезультатом двух последовательных массовых волн создания и финансирования компаний.

Первой волной был 10-летний цикл создания инфраструктуры данных, который начался с больших данных и закончился современным стеком данных. Долгожданная консолидация в этой сфере еще не совсем произошла, и подавляющее большинство компаний все еще существуют.

Вторая волна — это цикл ML / AI, который всерьез начался с генеративного ИИ. Поскольку мы находимся на ранней стадии этого цикла, а большинство компаний очень молоды, мы проявили щедрость, включив в этот ландшафт молодые стартапы (многие из которых все еще находятся на стадии посева).

Примечание: эти две волны тесно связаны. Основная идея БЕЗУМНОГО ландшафта каждого года заключалась в том, чтобы показать симбиотические отношения между инфраструктурой данных (слева); аналитикой / BI и ML / AI (посередине) и приложениями (справа).

Хотя с каждым годом становится все труднее соответствовать постоянно растущему числу компаний в этом ландшафте, но, в конечном счете, лучший способ представить БЕЗУМНОЕ пространство как сборочную линию – полный жизненный цикл данных от сбора до хранения, обработки и получения ценности с помощью аналитики или приложений.

Две большие волны + ограниченная консолидация = множество компаний на ландшафте.

Основные изменения в “Инфраструктуре” и “Аналитике“

Мы внесли очень мало изменений в общую структуру левой части ландшафта – как мы увидим ниже (Современный стек данных мертв?), в этой части БЕЗУМНОГО ландшафта в последнее время стало намного меньше шума.

Некоторые заслуживающие внимания изменения: мы переименовали “Абстракцию базы данных” в “Многомодельные базы данных и абстракции”, чтобы уловить растущую волну вокруг универсальной группы “многомодельных” баз данных (SurrealDB *, EdgeDB); убрали раздел “Крипто / веб-аналитика 3”, который мы экспериментально создали в прошлом году, который казался неуместным в этом ландшафте; и удалили раздел «Механизм запросов», который больше походил на часть раздела, чем на отдельный раздел (все компании в этом разделе по-прежнему отображаются в ландшафте — Dremio, Starburst, PrestoDB и т.д.).

Основные изменения в “Машинном обучении и искусственном интеллекте”

С резким ростом числа компаний, занимающихся искусственным интеллектом, в 2023 году именно здесь мы обнаружили, что вносим наибольшее количество структурных изменений.

Учитывая огромную активность на уровне ‘Поддержка искусственного интеллекта’ в прошлом году, мы добавили 3 новые категории рядом с MLOps:
- “Наблюдаемость за искусственным интеллектом” — новая категория в этом году, в которой представлены стартапы, помогающие тестировать, оценивать и отслеживать LLM-приложения
- “Платформы для разработчиков ИИ” близки по концепции к MLOps, но мы хотели отметить волну платформ, которые полностью сосредоточены на разработке приложений ИИ, в частности, на обучении LLM, развертывании и логическом выводе
- “Безопасность ИИ” включает компании, решающие проблемы, присущие LLM, от галлюцинаций до этики, соблюдения нормативных требований и т. Д
Если публичная ссора между Сэмом Альтманом и Илоном Маском о чем-то нам и сказала, так это о том, что различие между коммерческими и некоммерческими организациями является критическим, когда речь заходит о разработчиках базовых моделей. Таким образом, мы разделили то, что ранее называлось “Горизонтальным ИИ / AGI”, на две категории: “Коммерческие исследования в области ИИ” и “Некоммерческие исследования в области ИИ”
Последнее внесенное нами изменение касалось еще одной номенклатуры, где мы изменили “Облако GPU”, чтобы отразить добавление наборов функций базовой инфраструктуры, созданных многими поставщиками облачных технологий GPU: “Облако GPU / ML Infra”

Основные изменения в разделе “Приложения”

Самое большое обновление здесь that…to абсолютно никого не удивляет … каждая компания прикладного уровня теперь является самопровозглашенной “компанией искусственного интеллекта”, что, как бы мы ни пытались отфильтровать, привело к взрыву новых логотипов, которые вы видите справа от БЕЗУМНОГО ландшафта в этом году.
Некоторые незначительные изменения в структуре:
- В разделе “Горизонтальные приложения” мы добавили категорию “Презентации и дизайн”
- Мы переименовали “Поиск” в “Поиск / Разговорный искусственный интеллект”, чтобы отразить рост чата на базе LLM, такого как Perplexity.
- В разделе “Промышленность” мы переименовали “Правительство и разведка” в “Аэрокосмическая промышленность, оборона и правительство”

Основные изменения в “Инфраструктуре с открытым исходным кодом”

Мы объединили категории, которые всегда были близки, создав единую категорию “Управление данными”, которая охватывает как “Доступ к данным”, так и “Операции с данными”
Мы добавили важную новую категорию, “Локальный искусственный интеллект”, поскольку разработчики стремились предоставить инфраструктурный инструментарий для внедрения искусственного интеллекта и LLM в эпоху локального развития

ЧАСТЬ II: 24 ТЕМЫ, О КОТОРЫХ МЫ ДУМАЕМ В 2024 ГОДУ

События в области искусственного интеллекта развиваются так быстро и получают такое широкое освещение, что практически невозможно представить полностью “состояние союза” в БЕЗУМНОМ пространстве, как мы делали в предыдущие годы.

Итак, для другого формата: вот 24 темы, которые не выходят из головы и / или часто всплывают в разговорах, в произвольном порядке. Некоторые из них представляют собой довольно развернутые мысли, некоторые в основном просто вопросы или мысленные эксперименты.

Структурированные данные против неструктурированных

Отчасти это тема, отчасти то, что мы часто упоминаем в разговорах, чтобы помочь объяснить текущие тенденции.

Итак, возможно, в качестве введения к этой дискуссии 2024 года, приведу одно важное напоминание, объясняющее некоторые ключевые тенденции отрасли. Не все данные одинаковы. Рискуя сильно упростить, отметим, что существует два основных семейства данных, и для каждого семейства разработан набор инструментов и вариантов использования.

Структурированные конвейеры данных: это данные, которые могут помещаться в строки и столбцы.
- В аналитических целях данные извлекаются из транзакционных баз данных и инструментов SaaS, хранятся в облачных хранилищах данных (таких как Snowflake), преобразуются, анализируются и визуализируются с помощью инструментов бизнес-аналитики (BI), в основном для понимания настоящего и прошлого (так называемая “описательная аналитика”). Эта сборочная линия часто поддерживается современным стеком данных, описанным ниже, с аналитикой в качестве основного варианта использования.
- Кроме того, структурированные данные также могут использоваться в “традиционных” моделях ML / AI для прогнозирования будущего (прогнозная аналитика) – например, какие клиенты с наибольшей вероятностью отторгнутся
Конвейеры неструктурированных данных: это мир данных, которые обычно не помещаются в строки и столбцы, такие как текст, изображения, аудио и видео. Неструктурированные данные — это в значительной степени то, что используется в генеративных моделях искусственного интеллекта (LLM и т.д.) Как для обучения, так и для их использования (вывода).

Эти два семейства данных (и связанные с ними инструменты и компании) испытывают сейчас совершенно разную судьбу и уровень внимания.

Неструктурированные данные (ML / AI) востребованы; структурированные данные (современный стек данных и т.д.) — нет.

Современный стек данных мертв?

Не так давно (назовем это 2019-2021 годами) в мире программного обеспечения не было ничего более сексуального, чем Современный стек данных (MDS). Наряду с “Большими данными” это была одна из редких инфраструктурных концепций, которая перешла от инженеров по обработке данных к более широкой аудитории (руководителям, журналистам, банкирам).

Современный стек данных в основном охватывает тот тип структурированного конвейера данных, который упоминался выше. Ит-индустрия тяготела к быстрорастущим облачным хранилищам данных, а поставщики располагались выше по течению от него (например, Fivetran и Airbyte), поверх него (DBT) и ниже по течению от него (Looker, Mode).

Когда Snowflake стала крупнейшим в истории IPO программного обеспечения, интерес к MDS резко возрос благодаря созданию бешеной ZIRP-компании и венчурному финансированию. В течение года или двух целые категории стали переполненными – каталоги данных, наблюдаемость данных, ETL, обратный ETL, и это лишь некоторые из них.

Современный стек данных был также маркетинговой концепцией и фактическим альянсом ряда стартапов по всей цепочке создания стоимости данных.

Перенесемся в сегодняшний день, ситуация совсем иная. В 2023 году мы предварительно просмотрели, что MDS находится “под давлением”, и это давление будет только усиливаться в 2024 году.

MDS сталкивается с двумя ключевыми проблемами:

Создание современного стека данных требует объединения различных лучших в своем классе решений от нескольких независимых поставщиков. В результате это дорого с точки зрения денег, времени и ресурсов. Офис финансового директора не одобряет это в эпоху сокращения бюджета после ZIRP
MDS больше не самый крутой парень в квартале. Генеративный ИИ завладел всем вниманием руководителей, венчурных капиталистов и прессы – и для этого требуются неструктурированные конвейеры данных, о которых мы упоминали выше.

Смотрите: БЕЗУМНЫЙ подкаст с Тристаном Хэнди, генеральным директором dbt Labs (Apple, Spotify)

Консолидация инфраструктуры данных и масштабное развитие

Учитывая вышесказанное, что будет дальше с инфраструктурой данных и аналитикой в 2024 году?

Это может выглядеть примерно так:

Многие стартапы в современном стеке данных и вокруг него будут настойчиво позиционироваться как “стартапы в области инфраструктуры искусственного интеллекта” и пытаться найти место в современном стеке искусственного интеллекта (см. Ниже). В некоторых случаях это сработает, но переход от структурированных данных к неструктурированным может потребовать фундаментальной эволюции продукта в большинстве случаев.
В индустрии информационной инфраструктуры наконец-то произойдет некоторая консолидация. На сегодняшний день количество слияний и поглощений было довольно ограниченным, но в 2023 году действительно произошли некоторые приобретения, будь то мелкие или среднего размера, включая Stemma (приобретена Teradata), Manta (приобретена IBM), Mode (приобретена Thoughtspot) и т.д. (см. ЧАСТЬ III ниже)
Будет гораздо больше неудачных стартапов – по мере того, как финансирование венчурных капиталистов иссякало, ситуация становилась все сложнее. Многие стартапы резко сократили расходы, но в какой-то момент их денежный поток закончится. Не ожидайте увидеть кричащие заголовки, но это (к сожалению) произойдет.
Крупные компании в этой сфере, будь то масштабируемые или публичные компании, удвоят свои возможности на платформе и приложат все усилия, чтобы охватить еще больше функциональных возможностей. Частично это будет достигнуто за счет приобретений (отсюда и консолидация), но многое также будет достигнуто за счет собственных разработок.

Проверка данных против Snowflake

Говоря о крупных компаниях в космосе, давайте посмотрим на “титанический шок” (см. Наш пост в блоге MAD 2021) между двумя ключевыми игроками в области инфраструктуры данных, Snowflake и Databricks.

Snowflake (которая исторически происходит из мира конвейеров структурированных данных) остается невероятной компанией и одной из самых ценных публичных технологических компаний (доход 14,8 x EV / NTM на момент написания статьи). Однако, как и во многих других отраслях индустрии программного обеспечения, ее рост резко замедлился – 2024 финансовый год компания завершила с ростом выручки от продукции на 38% по сравнению с аналогичным периодом прошлого года, составив 2,67 миллиарда долларов, прогнозируя рост выручки NTM на 22% на момент написания статьи). Возможно, самое главное, Snowflake производит впечатление компании, испытывающей давление в области продуктов – она медленнее осваивала искусственный интеллект и сравнительно менее склонна к приобретениям. Недавняя и несколько резкая смена генерального директора — еще один интересный момент.

Databricks (которая исторически происходит из неструктурированного конвейера данных и мира машинного обучения) набирает обороты, как сообщается (поскольку это все еще частная компания), закрыв 24 финансовый год с доходом в 1,6 миллиарда долларов при росте более чем на 50%. Важно отметить, что Databricks становится ключевым игроком в области генеративного ИИ как за счет приобретений (в первую очередь MosaicML за 1,3 миллиарда долларов), так и за счет разработки собственных продуктов – в первую очередь как ключевого хранилища неструктурированных данных, которые используются в LLM, но также и как создатель моделей, от Dolly до DBRX, новой модели генеративного ИИ, которую компания только что анонсировала на момент написания статьи.

Новая важная эволюция в соперничестве Snowflake и Databricks — это запуск Microsoft Fabric. Анонсированная в мае 2023 года, это комплексная облачная SaaS-платформа для обработки данных и аналитики. Он объединяет множество продуктов Microsoft, включая OneLake (open lakehouse), PowerBI и Synapse Data Science, и охватывает практически все рабочие процессы обработки данных и аналитики, от интеграции данных и проектирования до науки о данных. Как всегда при запуске продуктов крупных компаний, существует разрыв между анонсом и реальностью продукта, но в сочетании с масштабным продвижением Microsoft в области генеративного искусственного интеллекта это может стать серьезной угрозой (в качестве дополнительного поворота истории Databricks в значительной степени размещается поверх Azure).

BI в 2024 году, и собирается ли генеративный ИИ трансформировать аналитику данных?

Из всех сфер современного мира стеков данных и структурированных конвейеров данных категория, которая наиболее созрела для переосмысления, — это бизнес-аналитика. В MAD 2019 мы рассказали о том, как индустрия BI почти полностью консолидировалась, и рассказали о появлении хранилищ показателей в MAD 2021.

Трансформация BI / аналитики происходила медленнее, чем мы ожидали. В отрасли по-прежнему преобладают более старые продукты, такие как PowerBI от Microsoft, Tableau от Salesforce и Google Looker, которые иногда включаются бесплатно в более широкие контракты на продажу. Произошла еще некоторая консолидация (Thoughtspot приобрел режим; Sisu был незаметно приобретен Snowflake). Некоторые молодые компании используют инновационные подходы, будь то масштабирование (см. dbt и их семантический слой / MetricFlow) или стартапы (см. Trace * и их дерево показателей), но, как правило, они находятся на ранней стадии пути.

Помимо потенциально важной роли в извлечении и преобразовании данных, генеративный ИИ может оказать глубокое влияние с точки зрения расширения возможностей и демократизации анализа данных.

Определенно, было много активности. OpenAI запустила интерпретатор кода, позже переименованный в Advanced Data Analysis. Microsoft запустила чат-бота с искусственным интеллектом для финансовых работников в Excel. Среди поставщиков облачных технологий, Databricks, Snowflake, open source и значительной группы стартапов многие люди работают или выпустили продукты “text to SQL”, помогающие запускать запросы к базам данных на естественном языке.

Перспектива одновременно захватывающая и потенциально разрушительная. Святым граалем анализа данных стала его демократизация. Естественный язык, если бы он стал интерфейсом для ноутбуков, баз данных и инструментов BI, позволил бы гораздо более широкой группе людей проводить анализ.

Однако многие люди в индустрии BI настроены скептически. Точность SQL и нюансы понимания бизнес-контекста, стоящего за запросом, считаются серьезными препятствиями на пути автоматизации.

Расцвет современного стека искусственного интеллекта

Многое из того, что мы обсуждали до сих пор, имело отношение к миру структурированных конвейеров данных.

Как уже упоминалось, мир неструктурированной инфраструктуры данных переживает совсем другой момент. Неструктурированные данные — это то, что питает LLM, и на них существует бешеный спрос. Каждая компания, экспериментирующая или внедряющая генеративный ИИ, заново открывает для себя старое клише: “данные — это новое масло”. Все хотят власти LLM, но обучены работать со своими (корпоративными) данными.

Большие и малые компании спешат воспользоваться возможностью предоставить инфраструктуру генеративного искусственного интеллекта.

Несколько компаний по масштабированию искусственного интеллекта активно развивают свои предложения, чтобы извлечь выгоду из динамики рынка – от Databricks (см. Выше) до Scale AI (которые развили свою инфраструктуру маркировки, изначально разработанную для рынка самоуправляемых автомобилей, до партнерства в качестве корпоративного конвейера данных с OpenAI и другими) до Dataiku * (которая запустила свою LLM Mesh, чтобы позволить компаниям Global 2000 беспрепятственно работать с несколькими поставщиками и моделями LLM).

Тем временем появляется новое поколение стартапов в области инфраструктуры искусственного интеллекта в ряде областей, включая:

Векторные базы данных, которые хранят данные в формате (векторные вложения), который могут использовать генеративные модели искусственного интеллекта. У специализированных поставщиков (Pinecone, Weaviate, Chroma, Qudrant и др.) был неудачный год, но некоторые действующие игроки в базах данных (MongoDB) также быстро отреагировали и добавили возможности векторного поиска. Также продолжаются дебаты о том, избавят ли более длинные контекстные окна от необходимости в векторных базах данных в целом, и по этому поводу есть сильные мнения с обеих сторон.
Фреймворки (LlamaIndex, Langchain и т.д.), которые соединяют и управляют всеми движущимися частями
Ограждения, которые отделяют магистра права от пользователей и гарантируют, что модель обеспечивает результаты, соответствующие правилам организации.
Оценщики, которые помогают тестировать, анализировать и отслеживать производительность генеративной модели ИИ, что является сложной проблемой, о чем свидетельствует общее недоверие к публичным тестам
Маршрутизаторы, которые помогают направлять запросы пользователей к различным моделям в режиме реального времени для оптимизации производительности, стоимости и взаимодействия с пользователем
Средства контроля затрат, которые помогают контролировать затраты на использование LLM
Конечные точки, эффективные API, которые абстрагируются от сложностей базовой инфраструктуры (например, моделей)

Мы сопротивлялись использованию термина “Современный стек искусственного интеллекта”, учитывая историю современного стека данных.

Но это выражение отражает множество параллелей: многие из этих стартапов являются “горячими компаниями” современности, точно так же, как компании MDS до них, они склонны путешествовать группами, создавая маркетинговые альянсы и продуктовые партнерства.

И это новое поколение стартапов в области инфраструктуры искусственного интеллекта столкнется с некоторыми из тех же проблем, что и компании MDS до них: достаточно ли велика какая-либо из этих категорий, чтобы построить многомиллиардную компанию? Какую часть в конечном итоге создадут крупные компании (в основном облачные провайдеры, но также Databricks и Snowflake)?

СМОТРИТЕ – в подкасте MAD мы представили множество новых современных стартапов с использованием стека искусственного интеллекта:

Векторные базы данных:
- БЕЗУМНЫЙ подкаст с Эдо Либерти, генеральным директором Pinecone (Apple, Spotify)
- БЕЗУМНЫЙ подкаст с Джеффом Хубером, генеральным директором Chroma (Apple, Spotify)
- БЕЗУМНЫЙ подкаст с Бобом ван Луйтом, Weaviate (Apple, Spotify)
БЕЗУМНЫЙ подкаст с Шрейей Раджпал, генеральным директором Guardrails AI (Apple, Spotify)
БЕЗУМНЫЙ подкаст с Джерри Лью, генеральным директором Llama Index (Apple, Spotify)
БЕЗУМНЫЙ подкаст с Шэрон Чжоу, генеральным директором Lamini (Apple, Spotify)
БЕЗУМНЫЙ подкаст с Диланом Фоксом, генеральным директором Assembly AI (Apple, Spotify)

Где мы находимся в цикле шумихи вокруг искусственного интеллекта?

У искусственного интеллекта многолетняя история летних и зимних периодов. Всего за последние 10-12 лет это третий цикл ажиотажа вокруг ИИ, который мы пережили: один был в 2013-2015 годах, после того как глубокое обучение оказалось в центре внимания после ImageNet 2012; еще один примерно в 2017-2018 годах, во время бума чат-ботов и появления TensorFlow; и теперь, с ноября 2022 года, с генеративным ИИ.

Этот цикл шумихи был особенно интенсивным, вплоть до ощущения пузыря искусственного интеллекта, по ряду причин: технология невероятно впечатляет; она очень интуитивна и распространилась на широкую аудиторию за пределами технических кругов; и для венчурных капиталистов, сидящих на сухом остатке, это была единственная игра в городе, поскольку практически все остальные технологии были подавлены.

Шумиха принесла все обычные преимущества (“ничто великое никогда не достигалось без иррационального изобилия», фаза “пусть расцветет 1000 цветов”, когда много денег доступно для амбициозных проектов) и шумиху (каждый в одночасье становится экспертом в области искусственного интеллекта, каждый стартап становится стартапом в области искусственного интеллекта, слишком много конференций по искусственному интеллекту / подкастов / информационных бюллетеней … и, осмелимся ли мы сказать, слишком много карт рынка искусственного интеллекта ???).

Главная проблема любого цикла шумихи — это неизбежный откат.

В этот этап развития рынка заложено изрядное количество “причуд” и рисков: компания-образец для подражания имеет очень необычную правовую структуру и систему управления; происходит множество сделок “вычисления в обмен на акционерный капитал” (с потенциальным повторным запуском), которые до конца не поняты или не раскрыты; многими ведущими стартапами управляют команды исследователей искусственного интеллекта; и многие сделки с венчурными капиталистами напоминают времена ZIRP: “захваты земель”, крупные раунды и впечатляющие оценки для очень молодых компаний.

В шумихе вокруг искусственного интеллекта, безусловно, были трещины (см. Ниже), но мы все еще находимся в фазе, когда каждую неделю что-то новое поражает воображение всех. И такие новости, как сообщение о фонде искусственного интеллекта Саудовской Аравии стоимостью 40 миллиардов долларов, похоже, указывают на то, что денежные потоки в космос в ближайшее время не прекратятся.

Эксперименты против реальности: был ли 2023 год фейком?

В связи с вышесказанным – учитывая шумиху, насколько многое было реальным до сих пор, а не просто экспериментальным?

2023 год был насыщенным событиями: а) каждый поставщик технологий поспешил включить генеративный искусственный интеллект в свои продуктовые предложения, б) каждое правление Global 2000 поручило своим командам “заниматься искусственным интеллектом”, и некоторые корпоративные развертывания произошли рекордно быстро, в том числе в компаниях регулируемых отраслей, таких как Morgan Stanley и Citibank, и в) конечно, потребители проявили бешеный интерес к приложениям с генеративным искусственным интеллектом.

В результате 2023 год стал годом больших побед: годовой объем продаж OpenAI достиг $ 2 млрд; Anthropic рос такими темпами, что позволил ему прогнозировать доход в $ 850 млн на 2024 год; доход Midjourney вырос до $ 200 млн без инвестиций и с командой из 40 человек; количество активных пользователей Perplexity AI увеличилось с 0 до 10 млн в месяц и т.д.

Должны ли мы быть циничными? Некоторые опасения:

На предприятиях большая часть затрат была направлена на подтверждение концепций или легкие победы, которые часто приходились на инновационные бюджеты.
Насколько желание руководителей не выглядеть косноязычными повлияло на решение реальных бизнес-задач?
Среди потребителей приложения с искусственным интеллектом демонстрируют высокий отток. Насколько это было простое любопытство?
Как в личной, так и в профессиональной жизни многие сообщают, что не совсем уверены, что делать с приложениями и продуктами с генеративным искусственным интеллектом
Не все генеративные продукты искусственного интеллекта, даже созданные лучшими умами в области искусственного интеллекта, будут волшебными: должны ли мы рассматривать решение Inflection AI быстро свернуться после сбора 1,3 миллиарда долларов как признание того, что миру не нужен еще один чат-бот с искусственным интеллектом или даже LLM-провайдер?

Компании-магистры права: может быть, все-таки не так уж и коммерциализированы?

Миллиарды венчурного капитала и корпоративных денег инвестируются в компании-фундаменты.

Отсюда любимый вопрос каждого за последние 18 месяцев: являемся ли мы свидетелями феноменального сжигания капитала в конечном итоге превращенных в товар продуктов? Или эти LLM-провайдеры — новые AWS, Azure и GCP?

Тревожным фактом (для вовлеченных компаний) является то, что ни один магистр права, похоже, не обеспечивает долговременного преимущества в производительности. На момент написания статьи Claude 3 Sonnet и Gemini Pro 1.5 работают лучше, чем GPT-4, который работает лучше, чем Gemini 1.0 Ultra, и так далее, и тому подобное – но это, кажется, меняется каждые несколько недель. Производительность также может колебаться – ChatGPT в какой-то момент “сошел с ума” и временно “обленился”.

Кроме того, модели с открытым исходным кодом (Llama 3, Mistral и другие, такие как DBRX) быстро догоняют нас по производительности.

Отдельно – на рынке намного больше поставщиков LLM, чем могло показаться на первый взгляд. Пару лет назад преобладало мнение, что может быть только одна или две компании LLM с динамикой «победитель получает все» — отчасти потому, что во всем мире было небольшое количество людей, обладающих необходимым опытом для масштабирования трансформаторов.

Оказывается, есть более способные команды, чем предполагалось вначале. Помимо OpenAI и Anthropic, есть ряд стартапов, занимающихся фундаментальной работой в области искусственного интеллекта – Mistral, Cohere, Adept, AI21, Imbue, 01.Искусственный интеллект и это лишь некоторые из них – и, конечно же, команды Google, Meta и др.

С учетом сказанного – пока у провайдеров LLM, похоже, все в порядке. Доходы OpenAI и Anthropic растут невероятными темпами, большое вам спасибо. Возможно, модели LLM действительно превращаются в товар, компании LLM по-прежнему имеют перед собой огромные возможности для бизнеса. Они уже стали компаниями с “полным стеком”, предлагая приложения и инструментарий для различных аудиторий (потребителей, предприятий, разработчиков) поверх базовых моделей.

Возможно, аналогия с поставщиками облачных технологий действительно довольно уместна. AWS, Azure и GCP привлекают и удерживают клиентов с помощью уровня приложений / инструментов и монетизируют с помощью уровня вычислений / хранилища, который в значительной степени недифференцирован.

Прорыв: Anthropic работает над своей самой мощной моделью на сегодняшний день, Жан-Клод pic.twitter.com/geJFls6yHs— Мэтт Терк (@mattturck)

4 марта 2024 г.

Смотреть:

БЕЗУМНЫЙ подкаст с Ори Гошеном, соучредителем AI21 Labs
БЕЗУМНЫЙ подкаст с Канджуном Цю, генеральным директором Imbue

LLM, SLM и гибридное будущее

Несмотря на все волнения по поводу больших языковых моделей, одной из явных тенденций последних нескольких месяцев стало ускорение разработки малых языковых моделей (SLM), таких как Llama-2-13b от Meta, Mistral-7b и Mixtral 8x7b от Mistral, а также Phi-2 и Orca-2 от Microsoft.

В то время как LLM становятся все больше (сообщается, что GPT-3 имеет 175 миллиардов параметров, GPT-4 — 1,7 триллиона, а мир ждет еще более масштабного GPT-5), SLM становятся надежной альтернативой для многих вариантов использования, поскольку они дешевле в эксплуатации, легче поддаются точной настройке и часто предлагают высокую производительность.

Еще одной ускоряющейся тенденцией является появление специализированных моделей, ориентированных на конкретные задачи, такие как кодирование (Code-Llama, Poolside AI) или отрасли (например, финансовая модель Bloomberg или стартапы, создающие модели Orbital Materials для материаловедения и т.д.).

Как мы уже видим на ряде корпоративных развертываний, мир быстро развивается в сторону гибридных архитектур, объединяющих несколько моделей.

Несмотря на снижение цен (см. Ниже), большие проприетарные LLM по-прежнему очень дороги, испытывают проблемы с задержкой, и поэтому пользователи / заказчики будут все чаще внедрять комбинации моделей, больших и малых, коммерческих и с открытым исходным кодом, общих и специализированных, для удовлетворения своих конкретных потребностей и финансовых ограничений.

Смотрите: БЕЗУМНЫЙ подкаст с Эйзо Кантом, техническим директором Poolside AI (Apple, Spotify)

Традиционный искусственный интеллект мертв?

С запуском ChatGPT произошла забавная вещь: большая часть ИИ, которые были развернуты до этого, в одночасье были помечены как “Традиционный ИИ”, в отличие от ”Генеративного ИИ».

Это было небольшим шоком для многих практиков искусственного интеллекта и компаний, которые до тех пор считались передовыми, поскольку термин “традиционный” явно предполагает грядущую массовую замену всех форм искусственного интеллекта чем-то новым.

Реальность гораздо более тонкая. Традиционный ИИ и генеративный ИИ в конечном счете очень дополняют друг друга, поскольку они работают с разными типами данных и вариантами использования.

То, что сейчас называют “традиционным ИИ”, а иногда ”прогнозирующим ИИ“ или ”табличным ИИ», также в значительной степени является частью современного ИИ (основанного на глубоком обучении). Однако в основном он фокусируется на структурированных данных (см. Выше) и таких проблемах, как рекомендации, прогнозирование оттока, оптимизация ценообразования, управление запасами. “Традиционный искусственный интеллект” получил огромное распространение за последнее десятилетие и уже внедрен в массовом производстве в тысячах компаний по всему миру.

Напротив, генеративный ИИ в основном оперирует неструктурированными данными (текст, изображения, видео и т.д.). Исключительно хорош в решении другого класса задач (генерация кода, изображений, поиск и т.д.).

И здесь будущее гибридное: компании будут использовать LLM для определенных задач, прогностические модели — для других. Самое главное, что они будут часто комбинировать их – LLM могут быть не очень хороши в предоставлении точного прогноза, например прогноза оттока, но вы могли бы использовать LLM, который запрашивает выходные данные другой модели, ориентированной на предоставление этого прогноза, и наоборот.

Тонкие обертки, толстые обертки и гонка за полным стеком

”Тонкая обертка» — пренебрежительный термин, который все любили использовать в 2023 году. Утверждается, что трудно создать долгосрочную ценность и дифференциацию, если ваши основные возможности обеспечиваются чужой технологией (например, OpenAI). Появившиеся несколько месяцев назад сообщения о том, что стартапы вроде Jasper столкнулись с трудностями после стремительного роста доходов, похоже, подтверждают этот ход мыслей.

Интересный вопрос заключается в том, что происходит со временем, когда молодые стартапы наращивают функциональность. Становятся ли тонкие обертки толстыми обертками?

В 2024 году кажется, что у толстых оболочек есть путь к дифференциации за счет:

Сосредоточение внимания на конкретной проблеме, часто вертикальной, поскольку все, что слишком горизонтально, рискует оказаться в “зоне поражения” больших технологий
Построение рабочего процесса, совместной работы и глубокой интеграции, характерных для данной проблемы
Проделываем большую работу на уровне модели искусственного интеллекта — будь то доработка моделей с конкретными наборами данных или создание гибридных систем (LLM, SLM и т.д.), адаптированных для конкретного бизнеса

Другими словами, они должны быть как узкими, так и “полным стеком” (как приложения, так и инфраструктура).

Интересные области, на которые стоит обратить внимание в 2024 году: агенты искусственного интеллекта, пограничный искусственный интеллект

За последний год было много шума вокруг концепции агентов искусственного интеллекта – по сути, последней мили интеллектуальной системы, которая может выполнять задачи, часто совместно. Это может быть что угодно: от помощи в бронировании поездки (вариант использования потребителем) до автоматического запуска полноценных кампаний SDR (вариант использования для повышения производительности) и автоматизации в стиле RPA (вариант использования предприятием).

Агенты искусственного интеллекта – это святой грааль автоматизации — парадигма “от текста к действию”, где ИИ просто выполняет работу за нас.

Каждые несколько месяцев мир искусственного интеллекта сходит с ума по продуктам, подобным агентам, от BabyAGI в прошлом году до Devin AI (“инженера-программиста искусственного интеллекта”) совсем недавно. Однако, в целом, большая часть этого ажиотажа на сегодняшний день оказалась преждевременной. Сначала предстоит проделать большую работу, чтобы сделать генеративный процесс менее хрупким и более предсказуемым, прежде чем сложные системы, включающие несколько моделей, смогут работать вместе и предпринимать реальные действия от нашего имени. Также отсутствуют компоненты, такие как необходимость встраивать больше памяти в системы искусственного интеллекта. Однако ожидайте, что агенты искусственного интеллекта станут особенно интересной областью в ближайшие год или два.

Еще одна интересная область — пограничный искусственный интеллект. Несмотря на огромный рынок LLM, работающих в огромных масштабах и поставляемых в качестве конечных точек, святым граалем в области ИИ стали модели, которые могут работать локально на устройстве без графических процессоров, в частности на телефонах, но также и на интеллектуальных устройствах типа IoT. Пространство очень динамичное: Mixtral, Ollama, Llama.cpp, Llamafile, GPT4ALL (Номинант). Google и Apple также, вероятно, будут проявлять все большую активность.

Генеративный ИИ движется к AGI или к плато?

Задавать этот вопрос почти кощунственно, учитывая все ошеломляющие отзывы об ИИ и невероятные новые продукты, которые, кажется, появляются каждую неделю, – но есть ли мир, где прогресс в генеративном ИИ замедляется, а не ускоряется на всем пути к AGI? И что бы это значило?

Аргумент двоякий: а) базовые модели — это упражнение в грубой силе, и у нас закончатся ресурсы (вычисления, данные) для их подпитки, и б) даже если мы не исчерпаем их, в конечном счете, путь к AGI — это рассуждения, на которые LLM не способны.

Интересно, что это более или менее та же дискуссия, которая велась в отрасли 6 лет назад, как мы описали в сообщении в блоге 2018 года. Действительно, что, кажется, в основном изменилось с 2018 года, так это огромное количество данных и вычислений, которые мы используем в моделях (со все возрастающими возможностями).

В целом менее ясно, насколько мы продвинулись в рассуждениях ИИ, хотя программа AlphaGeometry от DeepMind кажется важной вехой, поскольку она сочетает языковую модель с символьным движком, который управляет логическими выводами.

Очень трудно оценить, насколько мы близки к какому-либо “истощению” вычислений или данных.

Рубеж “исчерпания вычислительных ресурсов”, похоже, с каждым днем отодвигается все дальше. Недавно NVIDIA анонсировала графическую систему Blackwell GPU, и компания заявляет, что может развернуть модель с 27 трлн параметров (против 1,7 трлн у GPT-4).

Часть данных сложна – возникает более тактический вопрос, связанный с нехваткой данных, лицензированных по закону (см. Все лицензионные соглашения OpenAI), и более широкий вопрос, связанный с нехваткой текстовых данных в целом. Безусловно, вокруг синтетических данных происходит много работы. Ян Лекун обсудил, что для вывода моделей на новый уровень, вероятно, потребуется, чтобы они могли принимать гораздо более насыщенный видеовход, что пока невозможно.

От GPT-5 возлагаются огромные надежды. То, насколько он будет лучше GPT-4, будет широко рассматриваться как показатель общих темпов прогресса в области искусственного интеллекта.

С узкой точки зрения участников экосистемы стартапов (основателей, инвесторов), возможно, в среднесрочной перспективе этот вопрос имеет меньшее значение – если бы прогресс в генеративном ИИ достиг асимптоты завтра, у нас все еще были бы годы возможностей для бизнеса, внедряющих то, что у нас есть сейчас, по вертикали и вариантам использования.

Войны графических процессоров (переоценена ли NVIDIA?)

Находимся ли мы на ранней стадии масштабного цикла, когда вычислительные мощности становятся самым ценным товаром в мире, или резко наращиваем производство графических процессоров, что наверняка приведет к крупному краху?

Будучи практически единственной игрой в городе, когда дело доходит до генераторных графических процессоров с поддержкой искусственного интеллекта, NVIDIA, безусловно, переживает настоящий момент: цена акций выросла в пять раз до оценки в 2,2 триллиона долларов, а общие продажи выросли в три раза с конца 2022 года, огромный ажиотаж вокруг ее прибыли и Дженсен Хуанг из GTC, соперничающий с Тейлор Свифт за крупнейшее событие 2024 года.

Мне нравится этот снимок Дженсена Хуанга из объявления результатов NVIDIA за четвертый квартал
pic.twitter.com/9BrJgv88Yq— Мэтт Терк (@mattturck)

22 февраля 2024 г.

Возможно, отчасти это произошло еще и потому, что компания была конечным бенефициаром всех миллиардов, вложенных венчурными капиталистами в искусственный интеллект?

Генеративное инвестирование в искусственный интеллект: процесс, посредством которого венчурные компании переводят крупные суммы денег NVIDIA через посредников, известных как “стартапы”— Мэтт Терк (@mattturck)

14 июня 2023 г.

Как бы то ни было, несмотря на все неоспоримое мастерство компании, судьба NVIDIA будет зависеть от того, насколько устойчивой окажется нынешняя золотая лихорадка. Аппаратное обеспечение сложное, и с точностью предсказать, сколько графических процессоров потребуется для производства TSMC на Тайване, непросто.

Кроме того, конкуренция старается изо всех сил реагировать, от AMD до Intel и Samsung; стартапы (такие как Groq или Cerebras) набирают обороты, и могут появиться новые, как, по слухам, компания по производству микросхем Сэма Альтмана стоимостью 7 триллионов долларов. Новая коалиция технологических компаний, включая Google, Intel и Qualcomm, пытается использовать секретное оружие NVIDIA: программное обеспечение CUDA, которое привязывает разработчиков к чипам Nvidia.

Наше мнение: по мере сокращения дефицита графических процессоров в краткосрочной и среднесрочной перспективе на NVIDIA может оказываться понижательное давление, но долгосрочная перспектива для производителей чипов искусственного интеллекта остается невероятно радужной.

Искусственный интеллект с открытым исходным кодом: слишком много хорошего?

Это просто для того, чтобы немного взбодрить банк. Мы большие поклонники ИИ с открытым исходным кодом, и очевидно, что это было большой тенденцией последнего года или около того. Meta добилась серьезного рывка со своими моделями Llama, французский Mistral превратился из повода для споров в новую сияющую звезду генеративного искусственного интеллекта, Google выпустил Gemma, а HuggingFace продолжил свое восхождение как всегда динамичный дом искусственного интеллекта с открытым исходным кодом, предлагая множество моделей. Некоторые из самых инновационных работ в области генеративного искусственного интеллекта были выполнены сообществом разработчиков с открытым исходным кодом.

Однако в сообществе с открытым исходным кодом также ощущается инфляция. Сейчас доступны сотни тысяч моделей искусственного интеллекта с открытым исходным кодом. Многие из них являются игрушками или проектами выходного дня. Модели поднимаются и опускаются в рейтингах, некоторые из них достигают стремительных высот по стандартам Github star (некорректный показатель, но все же) всего за несколько дней, но так и не превращаются во что-то особенно полезное.

Рынок будет самокорректирующимся, со степенным распределением успешных проектов с открытым исходным кодом, которые получат непропорциональную поддержку со стороны облачных провайдеров и других крупных технологических компаний. Но в то же время нынешний взрыв ошеломил многих.

Сколько на самом деле стоит искусственный интеллект?

Экономика генеративного искусственного интеллекта — быстро развивающаяся тема. И неудивительно, что многое в будущем пространства вращается вокруг этого – например, можно ли серьезно бросить вызов Google в поиске, если стоимость предоставления ответов, основанных на искусственном интеллекте, значительно выше, чем стоимость предоставления десяти синих ссылок? И могут ли компании-разработчики программного обеспечения действительно использовать искусственный интеллект, если затраты на вывод съедают часть их валовой прибыли?

Хорошие новости, если вы являетесь заказчиком / пользователем моделей с искусственным интеллектом: мы, похоже, находимся на ранней стадии гонки ко дну в ценовой сфере, которая происходит быстрее, чем можно было предположить. Одним из ключевых факторов стал параллельный рост ИИ с открытым исходным кодом (Mistral и др.) и коммерческих поставщиков логического вывода (вместе AI, Anyscale, Replit), использующих эти открытые модели и использующих их в качестве конечных точек. Затраты на переключение для клиентов очень невелики (за исключением сложности работы с разными моделями, дающими разные результаты), и это оказывает давление на OpenAI и Anthropic. Примером этого стало значительное снижение затрат на встраиваемые модели, когда несколько поставщиков (OpenAI, Together AI и т.д.) Одновременно снизили цены.

С точки зрения поставщика, затраты на создание и обслуживание искусственного интеллекта остаются очень высокими. В прессе сообщалось, что Anthropic потратила более половины выручки, которую она получила, на оплату облачных провайдеров, таких как AWS и GCP, за запуск своих LLM. Также существуют расходы на лицензионные соглашения с издателями.

С положительной стороны, возможно, всем нам, пользователям генеративных технологий, стоит просто наслаждаться бурным развитием бесплатных сервисов, субсидируемых венчурным капиталом:

Венчурные капиталисты принесли вам дешевые Ubers
Венчурные капиталисты принесли вам дешевые Airbnbs
Венчурные капиталисты предлагают вам дешевый вывод с помощью искусственного интеллекта
ДОБРО ПОЖАЛОВАТЬ— Мэтт Терк (@mattturck)

26 января 2024 г.

Смотрите: БЕЗУМНЫЙ подкаст с Брэндоном Дудерштадтом и Заком Нуссбаумом, Nomic

Крупные компании и меняющаяся политическая экономия искусственного интеллекта: победила ли Microsoft?

Это был один из первых вопросов, который все задавали в конце 2022 года, и он еще более актуален в 2024 году: будут ли крупные технологии использовать большую часть преимуществ генеративного искусственного интеллекта?

ИИ вознаграждает масштаб – больше данных, больше вычислений, больше исследователей ИИ, как правило, дают больше мощности. Крупные технологические компании прекрасно осознают это. В отличие от сотрудников, участвовавших в предыдущих сменах платформы, ит-отдел также активно реагировал на грядущие потенциальные сбои.

Среди крупных технологических компаний определенно создается впечатление, что Microsoft играет в 4-D шахматы. Очевидно, что существуют отношения с OpenAI, в который Microsoft впервые инвестировала в 2019 году, а сейчас вложила 13 миллиардов долларов. Но Microsoft также сотрудничала с конкурентом с открытым исходным кодом Mistral. It инвестировала в конкурирующий с ChatGPT искусственный интеллект Inflection (Pi), но недавно приобрела его впечатляющим образом.

И, в конечном счете, все эти партнерские отношения, похоже, только увеличивают потребность в облачных вычислениях Microsoft – выручка Azure выросла на 24% по сравнению с аналогичным периодом прошлого года и достигла 33 миллиардов долларов во втором квартале 2024 года, при этом 6 пунктов роста облачных вычислений Azure приходится на сервисы искусственного интеллекта.

На случай, если вы запутались:
Microsoft является крупнейшим инвестором в OpenAI, но также конкурентом OpenAI и инвестором в конкурирующего чат–бота Inflection AI — между тем Microsoft также является ключевым партнером, но также и конкурентом Databricks с Azure AI
Надеюсь, это прояснит ситуацию— Мэтт Терк (@mattturck)

7 ноября 2023 г.

Тем временем Google и Amazon стали партнерами и инвестировали в конкурента OpenAI Anthropic (на момент написания статьи Amazon только что выделила компании еще 2,75 миллиарда долларов в рамках второго транша запланированных инвестиций в размере 4 миллиардов долларов). Amazon также сотрудничает с платформой с открытым исходным кодом Hugging Face. Сообщается, что Google и Apple обсуждают интеграцию искусственного интеллекта Gemini в продукты Apple. Meta, возможно, недооценивает всех, полностью сосредоточившись на ИИ с открытым исходным кодом. Далее, все происходит в Китае.

Очевидный вопрос заключается в том, насколько велики возможности для роста и успеха стартапов. Стартапы первого уровня (в основном OpenAI и Anthropic, возможно, вскоре к ним присоединится Mistral), похоже, наладили правильные партнерские отношения и достигли максимальной скорости. Что касается многих других стартапов, в том числе очень хорошо финансируемых, то жюри все еще не определилось.

Следует ли нам читать в решении Inflection AI позволить себя приобрести и проблемах генерального директора Stability AI признание того, что коммерческой популярности было труднее добиться для группы стартапов с генеративным ИИ “второго уровня”?

Фанатеешь от OpenAI – или нет?

OpenAI продолжает очаровывать – оценка в 86 миллиардов долларов, рост доходов, дворцовые интриги и Сэм Альтман, являющийся Стивом Джобсом этого поколения.:

Сэм Альтман, вернувшийся в OpenAI через день, подобен Стиву Джобсу, вернувшемуся в Apple через 12 лет, но для поколения TikTok https://t.co/AHqH7WmVfF— Мэтт Терк (@mattturck)

18 ноября 2023 г.

Пара интересных вопросов:

Не пытается ли OpenAI сделать слишком много? Перед всей этой ноябрьской драмой был OpenAI Dev Day, во время которого OpenAI ясно дала понять, что собирается делать * все * в ИИ, как по вертикали (полный стек), так и по горизонтали (разные варианты использования): модели + инфраструктура + поиск потребителей + предприятие + аналитика + инструменты разработки + торговая площадка и т.д. Это не беспрецедентная стратегия, когда стартап является первым лидером в большой смене парадигмы с де-факто неограниченным доступом к капиталу (Coinbase вроде как сделала это в криптовалюте). Но наблюдать за этим будет интересно: хотя это безусловно упростило бы БЕЗУМНЫЙ ландшафт, это будет сложной задачей для исполнения, особенно в условиях усиления конкуренции. От проблем с ленью в ChatGPT до неутешительных результатов работы на рынке можно предположить, что OpenAI не застрахован от действия закона притяжения бизнеса.

Распадутся ли OpenAI и Microsoft? Отношения с Microsoft были захватывающими – очевидно, поддержка Microsoft стала огромным стимулом для OpenAI с точки зрения ресурсов (включая вычислительные) и распространения (Azure на предприятии), и этот шаг был широко расценен как мастерский ход Microsoft в первые дни волны генеративного искусственного интеллекта. В то же время, как только что упоминалось выше, Microsoft ясно дала понять, что не зависит от OpenAI (имеет весь код, веса, данные), сотрудничает с конкурентами (например, Mistral) и благодаря приобретению искусственного интеллекта Inflection значительно усилила свою исследовательскую группу по ИИ.

Между тем, захочет ли OpenAI оставаться однопоточным в партнерстве с Microsoft по сравнению с развертыванием в других облаках?

Учитывая огромные амбиции OpenAI и стремление Microsoft к глобальному господству, в какой момент обе компании приходят к выводу, что они скорее конкуренты, чем партнеры?

Станет ли 2024 год годом искусственного интеллекта на предприятии?

Как упоминалось выше, 2023 год для предприятия (определяемого как Global 2000 companies) был одним из тех переломных лет, когда все изо всех сил стараются принять новую тенденцию, но на самом деле ничего особенного не происходит.

Были проведены некоторые проверки концепций и внедрены незаметные продукты искусственного интеллекта, которые обеспечивают “быстрые победы”, не требуя усилий всей компании (например, видеоролики с искусственным интеллектом для обучения и корпоративных знаний, такие как Synthesia *).

Помимо этого, возможно, крупнейшими победителями в области генеративного искусственного интеллекта на предприятиях до сих пор были Accentures of the world (Accenture, по сообщениям, заработала 2 миллиарда долларов на консалтинге в области искусственного интеллекта в прошлом году).

Главные победители увлечения искусственным интеллектом на данный момент: консультанты.— Мэтт Терк (@mattturck)

12 мая 2023 г.

Несмотря на это, есть огромная надежда, что 2024 год станет важным годом для ИИ на предприятиях – или, по крайней мере, для генеративного ИИ, поскольку традиционный ИИ уже занимает там значительное место (см. Выше).

Но мы еще рано отвечаем на некоторые ключевые вопросы, с которыми сталкиваются глобальные компании типа 2000 года:

Каковы варианты использования? До сих пор наиболее распространенными вариантами использования были в основном: а) совместные пилоты по генерации кода для команд разработчиков, б) управление корпоративными знаниями (поиск, обобщение текста, перевод и т.д.) И в) чат-боты с искусственным интеллектом для обслуживания клиентов (вариант использования, предшествующий генеративному ИИ). Конечно, есть и другие (маркетинг, автоматизированные SDR и т.д.), Но многое еще предстоит выяснить (режим второго пилота против полной автоматизации и т.д.).

Какие инструменты нам выбрать? Согласно вышесказанному, создается впечатление, что будущее за гибридами, сочетанием коммерческих поставщиков и открытого исходного кода, больших и малых моделей, горизонтальных и вертикальных инструментов GenAI. Но с чего начать?

Кто будет внедрять и обслуживать инструменты? В компаниях Global 2000 ощущается явная нехватка квалифицированных кадров. Если вы думали, что привлекать разработчиков программного обеспечения сложно, просто попробуйте нанять инженеров по машинному обучению.

Как нам убедиться, что у них не будет галлюцинаций? Да, вокруг RAG, ограждений, оценок и т.д. Выполняется огромный объем работы, но вероятность того, что инструмент генеративного ИИ может быть просто неправильным, и более широкий вопрос, заключающийся в том, что мы не действительно знаем, как работают модели генеративного ИИ, являются большими проблемами на предприятии.

Какова рентабельность инвестиций? Крупные технологические компании рано начали использовать генеративный ИИ для своих собственных нужд, и они показывают интересные предварительные данные. В своем отчете о доходах Palo Alto Networks упомянула о снижении примерно вдвое стоимости своего технического обслуживания, а ServiceNow упомянула об увеличении скорости внедрения инноваций разработчиками на 52%, но мы только начинаем понимать соотношение затрат и отдачи для генеративного искусственного интеллекта на предприятии.

Хорошей новостью для поставщиков генеративного ИИ является то, что корпоративные заказчики проявляют большой интерес к распределению бюджета (важно отметить, что это уже не “инновационные” бюджеты, а фактический операционный бюджет, возможно, перераспределенный из других мест) и ресурсов для его определения. Но мы, вероятно, говорим о 3-5-летнем цикле развертывания, а не об одном.

Смотреть:

БЕЗУМНЫЙ подкаст с Флорианом Дуэтто, генеральным директором Dataiku (Apple, Spotify)
БЕЗУМНЫЙ подкаст с Виктором Рипарбелли, генеральным директором Synthesia (Apple, Spotify)
БЕЗУМНЫЙ подкаст с Майком Мерчисоном, генеральным директором Ada (Apple, Spotify)

Собирается ли искусственный интеллект убить SaaS?

Это была одна из модных идей последних 12 месяцев.

Одна из версий вопроса: искусственный интеллект увеличивает время программирования в 10 раз, поэтому всего с несколькими средними разработчиками вы сможете создать индивидуальную версию SaaS-продукта, адаптированную к вашим потребностям. Зачем платить много денег SaaS-провайдеру, когда можно создать свой собственный.

Другая версия вопроса: будущее за единым интеллектом искусственного интеллекта (возможно, состоящим из нескольких моделей), который управляет всей вашей компанией с помощью ряда агентов. Вы больше не покупаете программное обеспечение для управления персоналом, финансов или продаж, потому что искусственный интеллект делает все полностью автоматизированным и бесперебойным способом.

Кажется, что мы несколько далеки от обеих этих тенденций, которые на самом деле проявляются каким-либо полноценным образом, но, как мы все знаем, в ИИ все меняется очень быстро.

Между тем, похоже, что вероятная версия будущего заключается в том, что продукты SaaS станут более мощными по мере того, как в каждый из них будет встроен искусственный интеллект.

Собирается ли искусственный интеллект убить венчурный капитал?

Оставляя в стороне (всегда забавную) тему о том, может ли ИИ автоматизировать венчурный капитал, как с точки зрения выбора компании, так и с точки зрения постинвестиционной добавленной стоимости, возникает интересная серия вопросов о том, соответствует ли класс активов размеру для смены платформы ИИ:

Слишком маленький венчурный капитал? Открытым компаниям мира потребовалось привлечь миллиарды долларов, и, возможно, потребуется привлечь еще много миллиардов. Большая часть этих миллиардов была предоставлена крупными корпорациями, такими как Microsoft, – вероятно, в значительной степени в форме сделок по обмену вычислениями на акционерный капитал, но не только. Конечно, многие венчурные капиталисты также инвестировали в крупные компании с основополагающей моделью, но, как минимум, эти инвестиции в высоко капиталоемкие стартапы являются явным отходом от традиционной модели инвестирования в программное обеспечение для венчурных капиталистов. Возможно, инвестирование в искусственный интеллект, по крайней мере, когда речь заходит о компаниях LLM, потребует крупных венчурных фондов – на момент написания статьи Саудовская Аравия, похоже, собирается запустить фонд искусственного интеллекта стоимостью 40 миллиардов долларов в сотрудничестве с американскими венчурными компаниями.

Слишком ли велик венчурный капитал? Если вы верите, что искусственный интеллект увеличит нашу производительность в 10 раз, включая суперкодеров, автоматизированных агентов SDR и автоматизированное создание маркетинга, то мы вот-вот станем свидетелями рождения целого поколения полностью автоматизированных компаний, управляемых скелетными командами (или, может быть, только одним сотрудником-одиночкой), которые теоретически могут достичь сотен миллионов доходов (и стать публичными)? Нужен ли компании ARR стоимостью 100 миллионов долларов , управляемой предпринимателем — одиночкой , венчурный капитал ?

Реальность всегда более тонкая, но если кто-то верит, что реальное создание ценности произойдет либо на уровне базовой модели, либо на прикладном уровне, то существует мир, в котором класс венчурных активов в том виде, в каком он существует сегодня, оказывается в неудобном положении .

Возродит ли искусственный интеллект потребителя?

Потребитель ждал нового импульса со времен социальных сетей и мобильных устройств. Вполне возможно, что им станет генеративный ИИ.

В качестве особенно интересного примера, MidJourney появилась, казалось бы, из ниоткуда с капиталом от 200 до 300 миллионов долларов, и, по-видимому, это очень прибыльно, учитывая, что у нее небольшая команда (40-60 человек, в зависимости от того, кого вы спросите).

Некоторые интересные области (среди многих других):

Поиск: впервые за десятилетия у поисковой монополии Google появилось несколько ранних, но заслуживающих доверия конкурентов. Несколько стартапов, таких как Perplexity AI и You.com возглавляют эволюциюпоисковых систем rom для поиска ответов.

Компаньоны по искусственному интеллекту: помимо мрачных аспектов, что, если бы у каждого человека был бесконечно терпеливый и услужливый компаньон, отвечающий его конкретным потребностям, будь то в знаниях, развлечениях или терапии

Удивительно противоречивый подход: гиперперсонализированный искусственный интеллект-компаньон, который может быть вашим лучшим другом и / или постоянным терапевтом, — это не антиутопия, а, напротив, огромный позитив для человечества, который приведет к уменьшению одиночества, насилия и, возможно, войн.— Мэтт Терк (@mattturck)

17 декабря 2023 г.

Оборудование для искусственного интеллекта: Humane, Rabbit, VisionPro — захватывающие новинки потребительского оборудования

Гиперперсонифицированные развлечения: какие новые формы развлечений и искусства мы изобретем по мере того, как генеративные инструменты на базе искусственного интеллекта будут становиться все лучше (и дешевле)?

Опыт просмотра фильмов:
2005: сходи в кинотеатр
2015: трансляция на Netflix
2025: попросите магистра права преобразовать текст в видео создать новый сезон сериала «Нарко » для просмотра сегодня вечером, но пусть действие будет происходить в Сирии с Брэдом Питтом, мистером Зверем и Трэвисом Келсом в главных ролях— Мэтт Терк (@mattturck)

15 февраля 2024 г.

Смотреть:

БЕЗУМНЫЙ подкаст с Аравиндом Шринивасом, генеральным директором Perplexity AI (Apple, Spotify)
БЕЗУМНЫЙ подкаст с Ричардом Сочером, генеральным директором, You.com (Apple, Spotify)
БЕЗУМНЫЙ подкаст с Крисом Валенсуэлой, генеральным директором Runway (Apple, Spotify)

Искусственный интеллект и блокчейн: чушь или увлекательно?

Я знаю, я знаю. Пересечение искусственного интеллекта и криптовалюты кажется идеальной темой для шуток X / Twitter.

Однако нельзя отрицать, что ИИ становится централизованным в нескольких компаниях, обладающих наибольшим количеством специалистов в области вычислений, данных и ИИ – от крупных технологов до известной своей закрытостью OpenAI. Между тем, сама суть предложения блокчейна заключается в создании децентрализованных сетей, которые позволяют участникам делиться ресурсами и активами. Там есть благодатная почва для исследований, тема, которую мы начали изучать много лет назад (презентация).

Ряд криптопроектов, связанных с искусственным интеллектом, заметно ускорились, включая Bittensor * (децентрализованная платформа машинного интеллекта), Render (децентрализованная платформа рендеринга GPU), Arweave (децентрализованная платформа данных).

Хотя мы не включили раздел криптовалюты в БЕЗУМНЫЙ ландшафт этого года, за этой областью интересно понаблюдать.

Теперь, как всегда, вопрос заключается в том, сможет ли криптоиндустрия помочь самой себе, а не превратиться в сотни мемкоинов, связанных с искусственным интеллектом, схемы перекачки и сброса и мошенничество.

БОНУС: Другие темы, которые мы здесь не обсуждали:

Убьет ли ИИ нас всех? Сторонники ИИ-рока против ускорителей ИИ
Регулирование, конфиденциальность, этика, глубокие подделки
Можно ли “создать” искусственный интеллект только в фантастике?

«Весь искусственный интеллект в Сан-Франциско», о чем свидетельствует тот факт, что все одержимы парижским стартапом— Мэтт Терк (@mattturck)

27 февраля 2024 г.

ЧАСТЬ III: ФИНАНСИРОВАНИЕ, слияния И поглощения И IPO

Финансирование

Текущая финансовая ситуация — одна из ситуаций ”сказки о двух рынках», где есть и искусственный интеллект, и все остальное.

Общее финансирование продолжало сокращаться, сократившись на 42% до 248,4 млрд долларов в 2023 году. Первые несколько месяцев 2024 года демонстрируют некоторые возможные зеленые всходы, но на данный момент тенденция более или менее не изменилась.

Инфраструктура данных по всем причинам, описанным выше, получила очень мало финансирования, за редким исключением Sigma Computing и Databricks.

Очевидно, Искусственный интеллект был совершенно другой историей.

Неизбежными характеристиками рынка финансирования искусственного интеллекта были:

Большая концентрация капитала в нескольких стартапах, в частности OpenAI, Anthropic, Inflection AI, Mistral и др.
Непропорционально высокий уровень активности корпоративных инвесторов. Тремя самыми активными инвесторами в искусственный интеллект в 2023 году были Microsoft, Google и NVIDIA
В приведенных выше корпоративных сделках есть некоторая неясность относительно того, какая сумма является фактической наличностью по сравнению с “расчетом на собственный капитал”

Несколько заслуживающих внимания сделок с момента нашего безумного 2023 года, в приблизительном хронологическом порядке (не исчерпывающий список!):

OpenAI, разработчик основополагающих моделей, привлек $ 10,3 млрд за два раунда, сейчас оценивается в $ 86 млрд; Adept, еще один разработчик основополагающих моделей, привлек $ 350 млн при оценке в $ 1 млрд; AlphaSense, платформа для исследования рынка финансовых услуг, привлекла $ 475 МЛН за два раунда, сейчас оценивается в $ 2,5 млрд, Anthropic, еще один разработчик основополагающих моделей, привлек $ 6,45 млрд за три раунда. раундов по оценке в 18,4 млрд долларов; Pinecone, платформа векторных баз данных, собрала 100 млн долларов при оценке в 750 млн долларов; Celestial AI, технологическая платформа оптических межсоединений для памяти и вычислений, собрала 275 млн долларов за два раунда; CoreWeave, поставщик облачных графических процессоров, собрал 421 млн долларов при оценке в 2,5 млрд долларов; Lightmatter, разработчик чипа для вычислений на малой мощности, собрал 308 млн долларов за два раунда, которые сейчас оцениваются в 1,2 млрд долларов; Sigma Computing, облачная платформа анализа данных, привлек $ 340 МЛН при оценке в $ 1,1 млрд; Inflection, другой разработчик базовой модели, привлек $ 1,3 млрд при оценке в $ 4 млрд; Mistral, разработчик базовой модели, привлек $ 528 МЛН в течение двух раундов, которые сейчас оцениваются в $ 2 млрд; Cohere, (сюрприз) разработчик базовой модели, привлек $ 270 млн при оценке в $ 2 млрд; Runway, разработчик генеративных видеомоделей, собрал $ 191 млн при оценке в $ 1,5 млрд; Synthesia *, платформа генерации видео для предприятий, собрала $ 90 млн при оценке в $ 1 млрд; Hugging Face, платформа машинного обучения и науки о данных для работы с моделями с открытым исходным кодом, собрала $ 235 млн при оценке в $ 4,5 млрд; Poolside, разработчик базовых моделей специально для генерации кода и разработки программного обеспечения, собрал $ 126 млн; Modular , платформа для разработки искусственного интеллекта, привлекла $ 100 млн при оценке в $ 600 млн; Imbue, разработчик агентов искусственного интеллекта, привлек $ 212 млн; Databricks, поставщик данных, аналитики и решений для искусственного интеллекта, привлек $ 684 млн при оценке в $ 43,2 млрд; Aleph Alpha, другой разработчик основополагающих моделей, привлек $ 486 млн; AI21 Labs, разработчик базовых моделей, привлек $ 208 млн при оценке в $ 1,4 млрд; Together, облачная платформа для генеративной разработки искусственного интеллекта, привлекла $ 208,5 млн за два раунда , сейчас оценивается в $ 1,25 млрд; VAST Data, платформа обработки данных для глубокого обучения, привлекла $ 118 млн при оценке в $ 9,1 млрд; Shield AI, пилотный разработчик искусственного интеллекта для аэрокосмической и оборонной промышленности, привлек $ 500 млн при оценке в $ 2,8 млрд; 01.ai, разработчик основополагающих моделей, привлек 200 миллионов долларов при оценке в 1 миллиард долларов; Адриан, производитель заводов по производству прецизионных компонентов для аэрокосмической и оборонной промышленности, привлек $ 117 млн; Сьерра Ай, разработчик чат-ботов с искусственным интеллектом для обслуживания клиентов, привлек $ 110 млн за два раунда; Glean, корпоративная поисковая платформа на базе искусственного интеллекта, привлекла $ 200 млн при оценке в 2,2 млрд долларов; Lambda Labs, поставщик облачных графических процессоров, привлек $ 320 МЛН при оценке в 1,5 млрд долларов; Magic, разработчик базовых моделей для генерации кода и разработка программного обеспечения, привлекла $ 117 млн при оценке в $ 500 млн.

Слияния и поглощения, принимайте рядовых

Рынок слияний и поглощений был довольно спокойным с БЕЗУМНОГО 2023 года.

Многие традиционные покупатели программного обеспечения были сосредоточены на цене собственных акций и бизнесе в целом, вместо того чтобы активно искать возможности приобретения.

И особенно строгая антимонопольная среда усложнили задачу потенциальным покупателям.

Adobe заблокирована при покупке Figma
JetBlue заблокировали сделку по приобретению Spirit Airlines
Amazon отказывается от сделки на сумму 1,4 миллиарда долларов по покупке iRobot, поскольку не видит «пути к одобрению регулирующих органов»
Что-то сильно нарушено в антимонопольном правоприменении— Мэтт Терк (@mattturck)

29 января 2024 г.

Частные инвестиционные компании были достаточно активны, ища возможности для снижения цен на более жестком рынке.

Некоторые заслуживающие внимания сделки с участием компаний, которые появлялись на протяжении многих лет в БЕЗУМНОМ ландшафте (в порядке масштабирования):

Broadcom, производитель полупроводников, приобрела VMware, компанию по облачным вычислениям, за 69 миллиардов долларов; Cisco, компания по сетевой инфраструктуре и безопасности, приобрела Splunk, платформу мониторинга и наблюдаемости, за 28 миллиардов долларов; Qualtrics, компания по управлению клиентским опытом, была передана в частные руки Silver Lake и CPP Investments за 12,5 миллиарда долларов; Coupa, платформа управления расходами, была передана в частные руки Тома Браво за 8 миллиардов долларов; New Relic, платформа мониторинга и наблюдаемости, была приобретена Francisco Partners и TPG за 6,5 миллиарда долларов; Alteryx, платформа анализа данных, была передана в собственность Clearlake Capital и Insight Partners за 4,4 миллиарда долларов; Salesloft, платформа управления доходами, была приобретена Vista Equity за 2,3 миллиарда долларов, которая затем также приобрела Drift, разработчика чат-ботов с искусственным интеллектом для взаимодействия с клиентами; Databricks, поставщик хранилищ данных, приобрела MosaicML, платформа для разработки искусственного интеллекта за 1,3 миллиарда долларов (и несколько других компаний за меньшие суммы, таких как Arcion и Okera); Thoughtspot, платформа анализа данных, приобрела за 200 миллионов долларов стартап в области бизнес-аналитики Mode Analytics; Snowflake, поставщик хранилищ данных, приобрела за 150 миллионов долларов Neeva, поисковую систему для потребителей с искусственным интеллектом; DigitalOcean, поставщик облачного хостинга, приобрела Paperpace, стартап по облачным вычислениям и разработке искусственного интеллекта, за 111 миллионов долларов; NVIDIA, производитель чипов для облачных вычислений, приобрела OmniML, платформу оптимизации AI / ML для edge.

И, конечно же, Microsoft “без приобретения” Inflection AI.

Будет ли 2024 год годом слияний и поглощений в области искусственного интеллекта? Многое зависит от сохранения динамики рынка.

В нижней части рынка за последние 12-18 месяцев было профинансировано множество молодых стартапов в области искусственного интеллекта с сильными командами. В последние пару циклов ажиотажа вокруг искусственного интеллекта за последнее десятилетие после первоначального цикла финансирования произошло множество приобретений — часто по ценам, которые казались непропорциональными фактической популярности этих компаний, но таланты в области искусственного интеллекта всегда были редкостью, и сегодня они не сильно отличаются.
В более высоких сегментах рынка есть веские бизнес-обоснования для дальнейшей конвергенции между ведущими платформами обработки данных и ведущими платформами искусственного интеллекта. Однако эти сделки, вероятно, будут намного дороже.

IPO?

На публичных рынках искусственный интеллект был горячей тенденцией. Акции “Великолепной семерки” (Nvidia, Meta, Amazon, Microsoft, Alphabet, Apple и Tesla) выросли по меньшей мере на 49% в 2023 году и способствовали росту фондового рынка в целом.

В целом, на публичных рынках по-прежнему ощущается острая нехватка акций с искусственным интеллектом для чистой игры. Те немногие, что доступны, щедро вознаграждены – акции Palantir подскочили на 167% в 2023 году.

Это должно стать хорошим предзнаменованием для целой группы стартапов, связанных с искусственным интеллектом перед IPO. В БЕЗУМНОМ пространстве много компаний значительного масштаба – в первую очередь Databricks, но также ряд других, включая Celonis, Scale AI, Dataiku * или Fivetran.

Тогда возникает интригующий вопрос о том, как OpenAI и Anthropic будут относиться к публичным рынкам.

Между тем, 2023 год был очень неудачным с точки зрения IPO. Только несколько компаний, связанных с MAD, стали публичными: Klaviyo, платформа автоматизации маркетинга, стала публичной по оценке в 9,2 миллиарда долларов в сентябре 2023 года (смотрите наш раздел Klaviyo S-1); Reddit, платформа социальных сетей в стиле форума (которая лицензирует свой контент игрокам с искусственным интеллектом), стала публичной по оценке в 6,4 миллиарда долларов в марте 2024 года; Astera Labs, полупроводниковая компания, обеспечивающая интеллектуальную связь для искусственного интеллекта и облачных технологий. инфраструктура была выставлена на торги по оценке в $ 5,5 млрд в марте 2024 года.

ЗАКЛЮЧЕНИЕ

Мы живем в совершенно особые времена. Мы на ранней стадии смены парадигмы. Время экспериментировать и пробовать новое. Мы только начинаем.