Новости Software

Российские учёные предложили метод быстрого построения моделей для поисковиков

Исследователи из Московского физико-технического института (МФТИ) и Вычислительного центра им. А.А. Дородницына Российской академии наук (ВЦ РАН) предложили новый метод автоматического построения ранжирующих моделей.

При поиске среди миллионов файлов и документов в Интернете пользователь в ответ на короткий запрос ожидает получить небольшой полезный список. Результаты в этом списке должны быть выстроены определённым образом. Ранжирующие модели как раз и применяются для того, чтобы обработать запрос от пользователя на поиск информации.

Ранжирующая модель строится на основе простейших математических функций. Применяющийся подход предполагает создание из них сложной функции, которая бы решала поставленную задачу — поиск нужного документа по запросу небольшой длины. Работа российских учёных была направлена на оптимизацию способа построения такой модели.

Одним из методов формирования моделей является генетическое программирование. Специальный алгоритм отсеивает модели низкого качества путём «естественного отбора» и на основе оставшихся создаёт более подходящие. Лучшие варианты имеют большую вероятность быть включёнными в следующие поколения. Сменяя множество поколений, алгоритм приближается к оптимальному решению.

Но существует ряд проблем. Одна из них — необходимость длительных расчётов. Российские исследователи предложили новый подход к порождению ранжирующих моделей для поиска документов в больших коллекциях, который позволяет повысить скорость выполнения задачи в 50 раз. Кроме того, решена проблема «стагнации» — когда из-за структурной схожести моделей их «скрещивание» не даёт существенно новых результатов. Более подробно о работе исследователей можно узнать здесь

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
Прежде чем оставить комментарий, пожалуйста, ознакомьтесь с правилами комментирования. Оставляя комментарий, вы подтверждаете ваше согласие с данными правилами и осознаете возможную ответственность за их нарушение.
Все комментарии премодерируются.
Комментарии загружаются...
window-new
Soft
Hard
Тренды 🔥
Google протестирует систему отображения доменых имён вместо полных URL-адресов, чтобы бороться с мошенниками 5 мин.
Охота продолжается: в Cyberpunk 2077 будут задания, напоминающие контракты на чудовищ из The Witcher 3 54 мин.
«Это отстой»: Фил Спенсер прокомментировал перенос Halo Infinite 57 мин.
Пользователи похвалили Rockstar за важные исправления и улучшения в последнем обновлении для GTA Online 59 мин.
Помогать или использовать: демонстрация геймплея On The Edge — последнего дополнения к Frostpunk 2 ч.
Тридцатипроцентная скидка на электронные госуслуги будет продлена 2 ч.
Лэнс Макдоналд опроверг ещё одну порцию слухов о ПК-версии Bloodborne 3 ч.
В новом трейлере Microsoft Flight Simulator демонстрируются самолёты и аэропорты 3 ч.
На «Яндекс» подали в суд с обвинением в пиратстве и требованием 3 млрд рублей 3 ч.
В сериале по мотивам The Last of Us будет шокирующий момент, вырезанный из игры 4 ч.