Неструктурированные данные и ИИ: Тонкая настройка больших языковых моделей для улучшения инвестиционного процесса
Отчеты

Неструктурированные данные и ИИ: Тонкая настройка больших языковых моделей для улучшения инвестиционного процесса

Данный отчет исследует возможности использования неструктурированных и альтернативных данных в сочетании с современными методами обработки естественного языка (NLP) на основе больших языковых моделей (LLM) для улучшения инвестиционного процесса.

Основные темы отчета:

  • Объяснение различий между неструктурированными и альтернативными данными, этические аспекты их использования и рекомендации по началу работы с этими данными с использованием инструментов с открытым исходным кодом.
  • Предоставление необходимой базовой информации по NLP для начала тонкой настройки LLM и ответы на вопросы о причинах резкого роста внедрения ИИ.
  • Применение этих концепций в конкретном кейсе по ESG, исследующем методы тонкой настройки для обнаружения существенных твитов по ESG с целью генерации инвестиционной доходности. Кейс демонстрирует ценность использования данных и инструментов с открытым исходным кодом для генерации новых инвестиционных идей.

Основное содержание:

Глава 1 посвящена введению в неструктурированные, альтернативные и данные из открытых источников. Разъясняются различия между ними, рассматриваются этические аспекты сбора данных методами веб-скрейпинга и работы с моделями ИИ.

Глава 2 фокусируется на эволюции методов NLP, объясняя ключевые прорывы, приведшие к созданию мощных LLM, таких как трансформеры и механизм внимания. Подробно рассматриваются различные подходы к тонкой настройке моделей, включая обучение на малом количестве примеров (few-shot), традиционную тонкую настройку и локальную настройку генеративных LLM.

Глава 3 представляет практический кейс по применению методов тонкой настройки LLM для классификации твитов компаний, связанных с ESG, по четырем категориям существенности. Портфели, построенные на основе наиболее существенной категории твитов, показывают превосходящую доходность, особенно для компаний малой капитализации. Это демонстрирует ценность анализа неструктурированных данных в реальном времени для получения альфы.

В заключение подчеркивается, что по мере роста объема альтернативных и неструктурированных данных инвестиционным профессионалам необходимо осваивать методы их обработки, особенно NLP, чтобы оставаться конкурентоспособными. Открытое сотрудничество в области ИИ создает благодатную почву для инноваций и открытий. Новая эра данных требует более творческого подхода, чтобы раскрыть потенциал окружающей нас информации.

Hi, I’m admin

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *