Google представила ИИ-поисковик научных работ, но его подход к ранжированию вызывают вопросы

Google запустила тестирование нового поискового сервиса на основе искусственного интеллекта в рамках проекта Scholar Labs. Он призван помогать учёным находить ответы на подробные исследовательские вопросы. Некоторые члены научного сообщества, впрочем, подвергли сомнению критерии определения качества научных исследований, обращает внимание The Verge.

Источник изображения: blog.google

Нет ясности, насколько смогут учёные доверять сервису, который для ранжирования поисковой выдачи использует не традиционные способы оценки популярности исследования, а анализирует взаимосвязи между словами. В научном поиске отсутствуют фильтры для общепринятых критериев, которые обычно используются, чтобы отличить «хорошие» исследования от «не очень хороших». Наиболее привычной в научной среде является метрика, отражающая количество цитирований исследования в других работах с момента его публикации — она в значительной мере отражает популярность статьи. Здесь есть связь и со временем: опубликованное недавно исследование может не цитироваться вовсе или набрать сотни ссылок за несколько месяцев, а исследования ещё из девяностых годов могут цитироваться несколько тысяч раз.

Ещё одна традиционная метрика называется импакт-фактором. У журналов, которые публикуют широко цитируемые исследования, более высокий импакт-фактор, а значит, такие материалы считаются более строгими или значимыми для научного сообщества. Так, у журнала Applied Sciences импакт-фактор равен 2,5, а у Nature он составляет уже 48,5. В оригинальной версии научной поисковой машины Google, то есть без ИИ, есть опция ранжирования выдачи по «релевантности» где для каждого результата отображается количество цитирований.

Источник изображения: BoliviaInteligente / unsplash.com

Цель обновлённого алгоритма — находить «наиболее полезные статьи при исследовательском поиске», заявили в Google. Теперь сервис ранжирует их по принципу, который, утверждают в компании, используют сами учёные — с учётом «полного текста каждого документа, места публикации, автора, а также частоты и давности цитирования в другой научной литературе». Но изолированного ранжирования по количеству цитирований статьи или импакт-фактору издания не будет.

«Импакт-фактор и количество цитирования зависят от области исследования в статьях, и большинству пользователей может быть непросто угадать подходящие значения в контексте конкретных исследовательских вопросов. <..> Если ограничиваться импакт-фактором или количеством цитирований, зачастую можно пропустить ключевые статьи, в частности, статьи в междисциплинарных или смежных областях либо журналах, а также недавно опубликованные статьи», — подчеркнули в Google. Можно запросить поиск по «недавним» работам, а при подготовке выдачи используются полные тексты статей. Данный сервис в компании назвали «новым направлением для нас», и при дальнейшей работе над ним Google планирует учитывать отзывы пользователей.