Сегодня 26 марта 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Gmail получил спам-фильтр на основе ИИ — это крупнейшее обновление системы защиты за последние годы

В блоге разработчиков Google появилось подробное описание свежего обновления спам-фильтров почтового сервиса Gmail. В компании его называли «одним из крупнейших обновлений системы защиты за последние годы».

 Источник изображения: diedryreyes3456 / Pixabay

Источник изображения: diedryreyes3456 / Pixabay

Речь идёт об интеграции в почтовую службу новой системы классификации текстов Resilient & Efficient Text Vectorizer (RETVec). По словам разработчиков, она эффективно определяет спам-сообщения, включая электронные письма с большим количеством специальных символов, смайлов, опечаток и других элементов, которые прежде были различимы для человека, но трудно определяемы для спам-фильтров. Согласно имеющимся данным, новый алгоритм эффективно определяет, в том числе, сообщения с гомоглифами, т.е. графически сильно похожими друг на друга знаками, разными по значению.

По данным Google, алгоритм RETVec обучен для эффективного выявления сообщений, в которых содержится текст, подвергавшийся каким-либо манипуляциям, включая вставку или удаление символов, опечатки, гомоглифы и др. Алгоритм обучался с использованием продвинутого кодировщика, способного эффективного кодировать любые символы и слова в формате UTF-8. В итоге разработчики получили алгоритм, который «из коробки» работает на более чем 100 языках мира.

 Пример спам-письма с гомоглифами / Источник изображения: Ron Amadeo / arstechnica.com

Пример спам-письма с гомоглифами / Источник изображения: Ron Amadeo / arstechnica.com

RETVec, судя по всему, во-многом работает также, как читают люди. Алгоритм построен на базе ИИ-фреймворка TensorFlow и в процессе его работы определяется визуальное «сходство» для определения значения слов, а не символы, из которых они фактически состоят. По данным Google, замена используемого ранее текстового векторизатора Gmail на RETVec позволила повысить уровень обнаружения спама по сравнению с базовым на 38 %, а количество ложных срабатываний уменьшилось на 19,4 %. При этом количество используемых моделью тензорных вычислительных процессоров (TPU) снизилось на 83 %, что делает нынешнее обновление одним из крупнейших для системы защиты Gmail за последние годы.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Discord получил большое обновление интерфейса с тёмной темой и улучшенным оверлеем 15 мин.
CD Projekt зареклась использовать генеративный ИИ в The Witcher 4 и других новых играх 2 ч.
Инсайдер показал, как будет выглядеть iOS 19, но это не точно 3 ч.
В работе СБП и российских банков произошёл масштабный сбой 3 ч.
Криптовалютный банк Трампа запустит свой стейблкоин, привязанный к доллару 3 ч.
Легендарный игровой журнал Game Informer вернулся из мёртвых благодаря студии Нила Бломкампа 5 ч.
CD Projekt подтвердила, когда выйдет The Witcher 4 — не раньше 2027 года 15 ч.
Правительство возьмёт объекты КИИ на карандаш и наведёт порядок в деле миграции на отечественное ПО 15 ч.
Новая компания сооснователя Blizzard анонсировала мультиплеерный шутер Wildgate, который выглядит как Sea of Thieves в космосе 16 ч.
Google представила Gemini 2.5 Pro — свою самую умную ИИ-модель, которая превзошла OpenAI o3 16 ч.
GS Group займётся импортозамещением полупроводников для отечественных авто 14 мин.
Китай ударит по Nvidia новыми экологическими нормами — компания потеряет до $17 млрд выручки в год 2 ч.
Глава квантового подразделения Google пообещал настоящий прорыв в технологиях через пять лет 2 ч.
Выход Cerebras Systems на IPO откладывается из-за задержки рассмотрения американским регулятором CFIUS 2 ч.
Noctua показала жидкостный кулер, который работает без помпы, и обозначила сроки его дебюта 2 ч.
BMW объединилась с Alibaba для совместной разработки автомобильного ИИ 3 ч.
Руководитель Alibaba предупредил о перегреве рынка ЦОД для искусственного интеллекта 3 ч.
SMART Modular представила энергонезависимые модули памяти CXL E3.S 4 ч.
Объём рынка корпоративного WLAN-оборудования в 2024 году сократился на 12,7 % 4 ч.
Учёные открыли чёрные дыры «на максималках» — сегодня таких уже нет 4 ч.