Новости Software

Интернетчики – бесплатная рабочая сила для библиотек

Каждый день пользователи интернета "расшифровывают" около 60 миллионов графических изображений, известных как CAPTCHA. Такие изображения используются для защиты против автоматических регистраций на сайтах, при заказе товаров через интернет и во многих других случаях.
CAPTCHA
Исследователи Университета Карнеги-Меллона задумались над тем, как можно использовать это с практической целью. Они изобрели способ, благодаря которому интернетчик, решая эти загадки, может помогать переводить книги в цифровой формат. В среднем человек тратит на расшифровку одного изображения примерно 10 секунд, однако в день это мизерное число превращается в 150 тысяч часов полезного времени. Как правило, перевод книг в цифровой формат происходит следующим образом: страницы сканируются, а затем используются специальные программы для распознавания текста, в результате чего текст книг становится доступным для поиска через интернет. Однако приложения для распознавания текста не всегда работают корректно. В частности, они бессильны, если буквы искажены, затенены или просто потертые. В подобных случаях, чтобы перевести книгу в цифровой формат, текст набирают вручную. Исследователи Университета Карнеги-Меллона работают с организацией Internet Archive, которая ежемесячно сканирует 12 тысяч книг. Представители Internet Archive отправляют исследователям тысячи файлов, которые компьютер не распознал. Файлы загружаются на сервер Университета и разделяются на отдельные слова, которые можно использовать как CAPTCHA на всех сайтах в интернете. Далее одна и та же картинка предлагается нескольким людям, и если все они расшифровывают ее одинаково, компьютер принимает полученный текст как правильный.

Источник:

window-new
Soft
Hard
Тренды 🔥