MBZUAI запускает PaperCircle: Open-source решение на базе ИИ для борьбы с переизбытком научной информации

13

Университет искусственного интеллекта имени Мухаммеда бен Заида (MBZUAI) представил PaperCircle — многоагентную систему искусственного интеллекта с открытым исходным кодом, разработанную, чтобы помочь исследователям ориентироваться в колоссальном потоке современной академической литературы. Автоматизируя процессы поиска, организации и анализа научных работ, этот инструмент призван изменить сам подход ученых к работе с огромными массивами данных.

Кризис информационной перегрузки в сфере STEMM

Запуск PaperCircle решает критическую проблему, ставшую «узким местом» в современной науке. Объемы научных публикаций достигли таких масштабов, что проведение ручного обзора литературы становится практически невозможным для одного человека.

С 2004 года темпы роста академических публикаций в областях науки, технологий, инженерии, математики и медицины (STEMM) резко ускорились. Для сравнения: количество работ, написанных в международной соавторстве, выросло с 7 000 в 1980 году до 440 000 к 2010 году. По мере роста объема данных исследователи сталкиваются с проблемой «информационного шума»: необходимостью искать «иголку» — прорывное открытие — в стоге сена из миллионов статей.

Как работает PaperCircle: мультиагентный подход

В отличие от стандартных поисковых инструментов, PaperCircle использует мультиагентную архитектуру на базе больших языковых моделей (LLM). Вместо одной нейросети, выполняющей все задачи, система задействует специализированных «агентов», которые работают в скоординированном режиме:

  • Конвейер поиска (Discovery Pipeline): Этот этап собирает данные как из онлайн, так и из офлайн-источников. Используется многокритериальная оценка и «ранжирование с учетом разнообразия», что гарантирует исследователям нахождение релевантных работ, которые не просто дублируют друг друга, а предлагают широкий спектр различных точек зрения.
  • Конвейер анализа (Analysis Pipeline): На этом этапе система выходит за рамки простого чтения. Она преобразует отдельные статьи в структурированные графы знаний. Эти графы связывают концепции, методы, эксперименты и графики, позволяя исследователям задавать сложные вопросы по всей коллекции статей сразу, а не анализировать их по отдельности.
  • Агенты-критики (Critique Agents): Специализированные агенты выступают в роли цифровых рецензентов. Они создают подробные критические разборы, выделяя сильные и слабые стороны работ, что помогает ученым эффективно распределять время на чтение.

Для интеграции в существующие рабочие процессы система выдает структурированные и воспроизводимые результаты в различных форматах, включая JSON, CSV, BibTeX, Markdown и HTML.

Академическое признание и техническая прозрачность

Значимость этой разработки подтверждается её принятием на конференцию ACL 2026 (64-я ежегодная встреча Ассоциации компьютерной лингвистики) в Сан-Диего. Примечательно, что исследование PaperCircle было номинировано на устный доклад — привилегия, которая предоставляется лишь узкому кругу наиболее выдающихся работ на этой престижной конференции.

Тем не менее, разработчики сохраняют научную строгость, открыто заявляя о текущих ограничениях системы. Тесты показывают, что, хотя система отлично справляется с поиском, её оценка рецензий пока не в полной мере совпадает с человеческим суждением (коэффициент корреляции ниже 0,25). Исследовательская группа полагает, что по мере интеграции более крупных и мощных моделей этот разрыв будет сокращаться.

Заключение

Выпуская PaperCircle как программное обеспечение с открытым исходным кодом, MBZUAI предоставляет мировому научному сообществу мощный и масштабируемый инструмент для управления информационным взрывом. Этот шаг может значительно ускорить темпы научных открытий, позволяя исследователям тратить меньше времени на поиск и больше — на синтез новых идей.

Релиз PaperCircle открывает новую эру в исследовательской деятельности, превращая процесс обработки данных из рутинного поиска в интеллектуальный синтез знаний.