1. Главная
  2. Инновационные лаборатории
  3. Проекты, над которыми мы работаем
  4. ESG Controversy Prediction

ESG Controversy Prediction

Выявление противоречащих данных ESG

Использование машинного обучения и обработки естественного языка для выявления противоречащих данных ESG в новостях компаний

Проблемы и возможности

Данные о факторах корпоративного управления, социальной и экологической ответственности (ESG) имеют важнейшее значение для финансовых рынков, поскольку с их помощью инвесторы могут подойти к достижению своих инвестиционных целей с учетом принципов устойчивого развития.

Инвесторы могут изучать раскрываемые компаниями данные ESG, но как правило им также важен доступ к информации, которая не включена в отчеты и может содержать противоречащие данные.

К таким данным могут относиться сведения о выбросе токсических отходов (экологическая ответственность), нарушениях прав человека (социальная ответственность) или коррупции на руководящих должностях (корпоративное управление).

В отличие от традиционной финансовой информации, данные ESG зачастую неструктурированы и извлекаются из отчетов компаний и новостных статей. Несмотря на то, что противоречащие данные ESG могут значительно ухудшить эффективность инвестиций, анализ таких данных до сих пор проводится вручную, что усложняет задачу.

center
01:43

Тим Наджент, главный исследователь Refinitiv Labs, рассказывает, как его команда использует инновационные технологии обработки естественного языка для автоматизации поиска противоречащих данных ESG и предоставления данных ESG нашим клиентам для принятия инвестиционных решений (EN).

Решение        

Выявление противоречащих данных ESG в неструктурированных данных

Инструмент ESG Controversy Prediction от Refinitiv Labs использует сочетание контролируемого машинного обучения и обработки естественного языка для отработки алгоритма.

Алгоритм автоматически классифицирует статьи по упоминаниям противоречащих данных ESG по 20 темам, выбранным внутренним персоналом. При обнаружении соответствующих данных алгоритм высчитывает рейтинг вероятности по каждой из тем. 

Если рейтинг вероятности превышает пороговое значение, данные поступают непосредственно в канал обработки данных ESG, в то время как прогнозы с низкой вероятностью отправляются аналитикам для дополнительной ручной проверки.

Благодаря более точному анализу прогнозируемых противоречий инвесторы могут быстро и эффективно принимать информированные и проактивные решения об инвестициях с учетом принципов устойчивого развития.

Инструмент прогноза противоречащих данных ESG в действии

Для проведения исследований с использованием контролируемого машинного обучения необходимы высококачественные данные.

Состав прототипа:

  • 31 600 новостных статей, аннотированных аналитиками Refinitiv, с разбивкой по 20 темам противоречащих данных ESG
  • Используемый компонент обработки естественного языка — модель обработки естественного языка с открытым кодом BERT (представления двунаправленного кодировщика на основе архитектуры Transformers) от Google, языковая нейросеть, создающая лингвистические представления
  • Алгоритм BERT прошел обучение на 3,3 млрд слов из общедоступных корпусов, таких как Википедия и открытый набор данных BookCorpus
  • Подразделение Refinitiv Labs провело дальнейшее обучение модели для анализа более специфических тем (финансы и бизнес) на основе контента из Reuters News Archive, добавив еще 715 млн слов из более чем двух миллионов статей о корпоративных и финансовых новостях
  • После этого команда провела тонкую настройку модели на материале аннотированных новостных статей для классификации тем противоречащих данных ESG

В целом это позволило улучшить эффективность прототипа по сравнению с базовой моделью BERT.

Refinitiv Labs ESG classifier data screen shot
ESG Controversy Prediction — это практическое решение, последовательно разрабатываемое Refinitiv Labs для решения реальной проблемы анализа противоречащих данных ESG. Благодаря автоматизации процессов распознавания и классификации данных наши клиенты могут получить существенные преимущества при принятии инвестиционных решений.

Стратегия сотрудничества

При разработке решений для актуальных проблем на финансовых рынках Refinitiv Labs использует стратегию сотрудничества и ориентации на клиента, объединяя обратную связь от клиентов, собственные комплексные данные и первоклассные партнерские технологии.

Сотрудничество с клиентами:

  • Работа над достижением общей цели по созданию доступных прогнозов противоречащих данных ESG

  • Учет обратной связи, полученной от клиентов, на каждом этапе процесса разработки 

  • Объединение усилий для оценки и направления процесса разработки и релизов

Мы используем:

  • Модель обработки естественного языка с открытым кодом BERT от Google

Перспективы

Graphic illustrating a black arrow moving inside a blue box

Цели Refinitiv Labs на будущее

Refinitiv Labs планирует расширить применение машинного обучения и обработки естественного языка.

  • Добавление API для предоставления клиентам доступа к узкоспециализированной модели BERT на базе данных Reuters News Archive
  • Настройка узкоспециализированной модели для выполнения различных задач, таких как прогнозирование финансовых настроений
  • Обучение модели BERT преобразованию расшифровок обсуждений прибылей и убытков в текстовый формат