Сегодня 26 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Рукописи не горят: ИИ прочитал испорченные извержением вулкана свитки из древнеримской библиотеки

Благодаря машинному обучению археология совершила рывок вперёд. С помощью ИИ разработан метод чтения сожжённых или иным образом повреждённых свитков папируса. Таких документов множество, и находятся всё новые и новые. Технологию ещё предстоит доработать, однако первые результаты оказались успешными.

 Внешний вид обугленного свитка, который был прочитан с помощью ИИ. Источник изображения: scrollprize.org

Внешний вид обугленного свитка, который был прочитан с помощью ИИ (источник изображения: scrollprize.org)

Ещё в 18 веке при раскопках римской виллы в Геркулануме было обнаружено более 1000 целых или частичных свитков в особняке, который, как считалось, принадлежал тестю Юлия Цезаря. Извержение Везувия в 79 году н.э. и последующее погребение свитков землёй превратили их в обугленные останки, развернуть которые можно было только один раз — они при этом рассыпались. Тексты также были нечитаемые, поскольку чернила выгорели вместе с основой. Прочесть всё это и многое другое — это достойно усилий.

Попытки создать технологию для прочтения обугленных свитков из Геркуланума много лет возглавлял специалист по информатике из Университета Кентукки Брент Силз (Brent Seales). Он и его команда с помощью рентгеновской томографии на ускорительном комплексе Diamond Light Source — источнике синхротронного излучения третьего поколения в графстве Оксфордшир — научились распознавать следы чернил в волокнах папируса, не трогая и не разрушая свиток.

Но распознать чернила — это только начало. Необходимо было «развернуть» свиток и прочитать текст. Для этого в 2023 году на деньги спонсоров был объявлен конкурс Vesuvius Challenge с призом около $1 млн. К концу года начали определяться лидеры. В частности, студент факультета компьютерных наук в Университете Небраски в Линкольне Люк Фарритор (Luke Farritor) был объявлен победителем этапа «Первые буквы» за расшифровку первых связных фраз из сожжённого текста, за что получил $40 тыс.

Позже к Фарритору присоединились Юсеф Надер (Youssef Nader) из Германии и Джулиан Шиллигер (Julian Schilliger) из Швейцарии. Они разработали алгоритм «разворачивания» свитков. Все вместе они смогли прочесть более 2000 букв из свитка. Как стало известно на днях, приз в размере $700 тыс. ушёл этой команде.

Искусственный интеллект справляется с задачей в несколько этапов. Свиток разбивается на сектора с определением каждого слоя. Предложено несколько способов решить эту головоломку. Например, ИИ отслеживает паутинку трещин в каждом слое, что позволяет точно определить слой и потом выровнять его цифровую копию. Пожалуй, это самая сложная часть работы.

Распознавание букв греческого алфавита также происходит не напрямую из текста, что важно для подтверждения опыта команды сторонними группами исследователей. Все данные берутся из базы, полученной рентгеновской томографией, а не с помощью программ по оптическому распознаванию символов. Немаловажно и то, что предложенный группой победителей конкурса код открыт и может быть использован другими группами для проверки результатов. И они были подтверждены. ИИ на самом деле восстанавливает текст по обнаруженным остаткам чернил в волокнах свитков.

Технология далека от совершенства, но её возможности обещают привнести множество нового в наши знания о прошлом. Она может быть применена также к прочтению текстов папирусов, в которые заворачивали мумии. Этих папирусов груды в каждом приличном музее, а это кладезь информации о жизни тысячи лет назад.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Новый год пришёл раньше времени»: Sony включила в декабрьскую линейку PS Plus сразу пять игр, в том числе Lego Horizon Adventures и Killing Floor 3 57 мин.
Продажи Cyberpunk 2077 превысили 35 миллионов копий, а команда Cyberpunk 2 растёт не по дням, а по часам 2 ч.
ЕС откажется от сканирования переписок — ИТ-гиганты выиграли битву за конфиденциальность пользователей 3 ч.
Новый геймплейный трейлер Warhammer 40,000: Dark Heresy показал в деле огрина Когга, поумневшего благодаря аугментации коры головного мозга 3 ч.
После скандала Character.AI закрыла свободные чаты для детей — вместо них появились безопасные «Истории» 3 ч.
Китай штампует новые ИИ-модели еженедельно — США уже проигрывают гонку открытого ИИ 3 ч.
Переосмысление классики психологических квестов: культовая российская игра Sublustrum получит новую жизнь на ПК и консолях 4 ч.
В этот день в 1996 году в США выдали патент на MP3 – формат аудио, перевернувший музыкальную индустрию 4 ч.
«ChatGPT — это продукт, а не друг»: подростки спрашивали ИИ о преступлениях — теперь ими занимается полиция 4 ч.
Ubisoft представила Teammates — прототип игры с ИИ-напарниками, реагирующими на голосовые команды 5 ч.
Seagate создала магнитный диск на 6,9 Тбайт — из таких можно создать HDD на 55–69 Тбайт 14 мин.
TSMC сообщила о старте серийного производства 2-нм чипов 2 ч.
Продажи Tesla рушатся по всему миру — Маск увлёкся роботами, а стоило бы новыми машинами 3 ч.
Китай против Nvidia: владельцу TikTok запретили использовать «зелёные» чипы в новых дата-центрах 4 ч.
AWS вложит $26 млрд в ИИ-инфраструктуру в Индиане, покрыв расходы на новые ЛЭП и электростанции для своих ЦОД 5 ч.
Очередной рекорд разгона DDR5 — покорена планка в 13 500 МТ/с 5 ч.
Твердотельные трансформаторы сингапурской Amperesand обещают произвести революцию в питании ИИ ЦОД 5 ч.
iPhone 17 переворачивает рынок: Apple близка к тому, чтобы обогнать Samsung по поставкам смартфонов 6 ч.
Airbus чуть не остановила выпуск самолётов из-за нехватки топлива для генераторов ЦОД в критический момент 6 ч.
Apple выпустит iPad mini с OLED-дисплеем в третьем квартале 2026 года, но это не точно 6 ч.