Університет штучного інтелекту імені Мухаммеда бен Заїда (MBZUAI) представив PaperCircle — багатоагентну систему штучного інтелекту з відкритим вихідним кодом, розроблену, щоб допомогти дослідникам орієнтуватися у колосальному потоці сучасної академічної літератури. Автоматизуючи процеси пошуку, організації та аналізу наукових праць, цей інструмент покликаний змінити сам підхід вчених до роботи з величезними масивами даних.
Криза інформаційного навантаження у сфері STEMM
Запуск PaperCircle вирішує критичну проблему, що стала вузьким місцем в сучасній науці. Обсяги наукових публікацій досягли таких масштабів, що проведення ручного огляду літератури стає практично неможливим однієї людини.
З 2004 року темпи зростання академічних публікацій у галузях науки, технологій, інженерії, математики та медицини (STEMM) різко прискорилися. Для порівняння: кількість робіт, написаних у міжнародному співавторстві, зросла з 7 000 у 1980 році до 440 000 до 2010 року. У міру зростання обсягу даних дослідники стикаються з проблемою “інформаційного шуму”: необхідністю шукати “голку” – проривне відкриття – у копиці сіна з мільйонів статей.
Як працює PaperCircle: мультиагентний підхід
На відміну від стандартних пошукових інструментів PaperCircle використовує мультіагентну архітектуру на базі великих мовних моделей (LLM). Замість однієї нейромережі, яка виконує всі завдання, система задіює спеціалізованих «агентів», які працюють у скоординованому режимі:
- Конвеєр пошуку (Discovery Pipeline): Цей етап збирає дані як з онлайн, так і з офлайн-джерел. Використовується багатокритеріальна оцінка та «ранжування з урахуванням різноманітності», що гарантує дослідникам знаходження релевантних робіт, які не просто дублюють один одного, а пропонують широкий спектр різних точок зору.
- Конвеєр аналізу (Analysis Pipeline): На цьому етапі система виходить за рамки простого читання. Вона перетворює окремі статті на структуровані графи знань. Ці графи пов’язують концепції, методи, експерименти та графіки, дозволяючи дослідникам ставити складні питання по всій колекції статей відразу, а не аналізувати їх окремо.
- Агенти-критики (Critique Agents): Спеціалізовані агенти виступають у ролі цифрових рецензентів. Вони створюють докладні критичні розбори, виділяючи сильні та слабкі сторони робіт, що допомагає вченим ефективно розподіляти час читання.
Для інтеграції в існуючі робочі процеси система видає структуровані та відтворювані результати у різних форматах, включаючи JSON, CSV, BibTeX, Markdown та HTML.
Академічне визнання та технічна прозорість
Значимість цієї розробки підтверджується її прийняттям на конференцію ACL 2026 (64-а щорічна зустріч Асоціації комп’ютерної лінгвістики) у Сан-Дієго. Примітно, що дослідження PaperCircle було номіновано на усну доповідь — привілей, який надається лише вузькому колу найвидатніших робіт на цій престижній конференції.
Тим не менш, розробники зберігають наукову строгість, відкрито заявляючи про поточні обмеження системи. Тести показують, що, хоча система добре справляється з пошуком, її оцінка рецензій поки повною мірою збігається з людським судженням (коефіцієнт кореляції нижче 0,25). Дослідницька група вважає, що в міру інтеграції більших і найпотужніших моделей цей розрив скорочуватиметься.
Висновок
Випускаючи PaperCircle як програмне забезпечення з відкритим вихідним кодом, MBZUAI надає світовій науковій спільноті потужний та масштабований інструмент для управління інформаційним вибухом. Цей крок може значно прискорити темпи наукових відкриттів, дозволяючи дослідникам витрачати менше часу на пошук і більше синтез нових ідей.
Реліз PaperCircle відкриває нову еру в дослідницької діяльності, перетворюючи процес обробки даних із рутинного пошуку на інтелектуальний синтез знань.
