Сегодня 22 декабря 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Аналитика

Виртуальные библиотеки и хранилища знаний

⇣ Содержание

Электронные библиотеки

За последние пятьдесят веков библиотеки существенно изменились - от собрания корзин с глиняными дощечками, покрытыми клинописью (археологи отыскали их на территории давно не существующего государства Шумер) и бесконечных полок с фолиантами "за горизонт", они постепенно переходят в цифровую форму: когда в памяти одного компьютера могут быть записаны миллионы байт полезной информации. Хранилища текстов в сети Интернет у нас в стране создают обычно любители - издательства до сих пор считают это не самым правильным действием, поскольку однозначной и идеально работающей схемы по оплате таких произведений (кроме, разве что, SMS) до конца не придумано. Здесь мы не будем упоминать проекты Yahoo и Google по сканированию книг (большая часть из этих произведений - на английском языке), а также специальные библиотеки научных текстов при вузах. Скорее, сосредоточимся на отечественных проектах, где можно найти книги из школьного и вузовского курсов, научно-популярные издания, а также другие произведения "библиопопсы", который хватит для утоления интеллектуального голода пользователей сети. Первое, к чему придется привыкнуть при работе с электронными библиотеками, - отсутствие каких-либо гарантий, что необходимый вам текст книги будет отсканирован и выложен в сеть: вступление в силу новой части Гражданского кодекса, где предусмотрены различные кары за нарушение авторских и имущественных прав, заставляют владельцев таких ресурсов удалять книги по требованию их создателей или издательств. Во-вторых, поиск необходимого издания можно проводить как с помощью интернет-поисковиков, так и с помощью встроенных систем поиска в крупных электронных библиотеках - далеко не все новинки индексируются полностью. В-третьих, не стоит особенно ругаться на множество различных баннеров, которыми буквально обвешены электронные библиотеки - только некоторые из них, работающие по прямым договорам с издательствами, получают деньги от продажи книг, остальные живут только за счет рекламы. И, наконец, область применения - чаще всего в электронных библиотеках Рунета можно встретить художественную литературу (как классическую, так и современную), реже - научную, крайне много - политической и исторической, а также компьютерной: все это энтузиасты (наиболее активный источник пополнения таких библиотек) сканируют весьма активно.
 Сайты из категории 'Литература'
Каталог ресурсов "Рамблер" - категория "Литература".
В сети встречаются три основных типа библиотек - созданные одним или несколькими энтузиастами и работающие как коммерческие предприятия (баннеры, партнерские ссылки на "бумажные" книги" и т.д.), магазины с платными книгами, а также полностью некоммерческие проекты. Наиболее простой способ поиска интернет-библиотек: заглянуть в специальные каталоги web-ресурсов и выбрать наиболее подходящий сборник литературы. Правда, в таких каталогах стоит отличать "сайты одной книги" от полноценных библиотек - здесь они соседствуют весьма тесно.
 Библиотека 'Альдебаран'
Заглавная страница библиотеки "Альдебаран" - все завешено баннерами, поскольку сайт живет по рекламной модели. Система внутреннего поиска - сверху справа.
 Страница книги
На странице каждой книги, размещенной в базе данных, есть обложка и аннотация, web-ссылка на имя автора и как минимум 2-3 формата книги.
Одна из наиболее крупных Рунетовских библиотек - это "Альдебаран". Если посмотреть на центральную страницу проекта, то мы видим то, о чем говорили выше: множество различных баннеров, а полезная информация занимает немного места на втором-третьем экране. Впрочем, по каждой книге представлена аннотация, обложка (по возможности - но нет ее очень редко), а также несколько вариантов представления текста - это либо RTF, либо FB2, либо "обычный" формат текстового редактора Word. Для чтения книги на смартфоне или коммуникаторе удобнее всего загружать RTF или DOC и пересохранять это в TXT.
 Проект 'ЛитРес'
Заглавная страница проекта "ЛитРес" - явное отличие от бесплатных библиотек: нет кричащей рекламы.
Стоит отметить и проект "ЛитРес", который был создан авторами электронных библиотек FictionBook.lib, "Альдебаран", Litportal, Bookz.ru и "Фэнзин" еще в 2006 году. Сейчас здесь можно найти порядка 17 тыс. книг на русском языке, которые можно купить, в среднем, за 10-30 руб. (по сути, за каждую тысячу знаков текста читатель платит в среднем 8 копеек - вполне доступно). Безусловно, бесплатно и хорошо не бывает, поэтому за небольшие деньги (ведь в цену не включена наиболее разорительная часть стоимости - печать на бумаге) можно получить качественную копию книги - причем, все новинки от того же АСТ, "Эксмо", "Олма Пресс", "Вершина", "Коммерсантъ" и т.д., добираются до сети уж точно не позже "обычных" магазинов. Обычно все книги "заточены" для чтения на "обычных" ПК, а также смартфонах и коммуникаторах, включая iPhone. Для работы с проектом желательно зарегистрироваться, что даст возможность корректировать ошибки, возможные при SMS-платежах.
 Страница книги
У каждой книги есть текстовый фрагмент, который можно скачать для оценки произведения, а оплатить можно с помощью 30-ти платежных систем: за WebMoney или "Яндекс.Деньги", а также по SMS можно купить без регистрации.
 Оплата книги по SMS
Оплата книги по SMS.
Правда, при оплате стоит учесть комиссию платежных систем за организацию платежа. Самый грабительский вариант - это SMS, где к цене книги прибавляется еще 100% (!) для "раздачи" контент-провайдеру (владельцу короткого номера) и оператору мобильной связи. Поэтому наиболее выгодный вариант - платить электронными валютами или банковской карточкой. Кстати, есть здесь и месячные абонементы с ценой доступа от 99 до 499 руб. за каждые четыре недели использования библиотеки.
 Библиотека Максима Мошкова
Центральная страница "Библиотеки Максима Мошкова".
 Art of War
Центральная страница проекта " Art of War ".
 Военная литература
Центральная страница проекта " Военная литература ".
Упомянем и некоммерческий проект - "Библиотеку Максима Мошкова", где сконцентрировано порядка 5,5 Гб "чистого" текста - это самая известная в Рунете библиотека, открытая еще пятнадцать лет назад. Ее пополняют обычные читатели, присылающие художественную литературу, фантастику техдокументацию и юмор, историю и поэзию, книги по эзотерике. Здесь простой "текстовый" интерфейс, хорошая система поиска. Из наиболее интересных подпроектов "Библиотеки" мы бы отметили Art of War - творчество ветеранов последних лет, где встречаются очень интересные рассказы, проект "Военная литература", отдельный раздел "Заграница", который предназначен для создания авторских разделов с путевыми заметками и впечатлениями о зарубежной жизни. А также - весьма подробный список русскоязычных литературных архивов в интернете - собственно, к нему с удовольствием автор и отсылает любителей хорошего чтения.

Оперативный перевод

Создание адекватной системы машинного перевода - глобальная задача, с которой, без сомнения, в полной мере не справились еще ни в одной стране мира. К сожалению, об устройствах, способных в реальном времени переводить нашу речь с учетом всех правил грамматики и стилистики, остается только мечтать, представляя их себе по описаниям в фантастических романах. Пока что пользователям на коммерческом рынке доступны весьма мощные, но, увы, далеко еще не совершенные системы, которые переводят содержание документа "близко к тексту". Ведь для того, чтобы понять все нюансы лингвистической конструкции в иностранном языке, необходимо хоть как-то в этом разбираться. С того момента, как в 1954 г. в Джорджтаунском университете система Mark II правильно перевела 49 предложений с русского языка на английский, для чего использовала минимальный словарь в 250 слов, прошло больше полувека. Около тридцати лет минуло с того времени, когда технологии машинного перевода стали доступными для гражданского населения и покатились по коммерческим рельсам, что явилось прямым следствием распространения персональных компьютеров. Но пока большинство пользователей не готово платить за языковые приложения, которые нужны им от случая к случаю, а крупные государственные контракты проходят по закрытым статьям бюджета и практически не достаются коммерческим компаниям.
 Проект Translate.ru
Проект Translate.ru - оперативный перевод в сети.
Более уверенно чувствуют себя производители словарей, поскольку их разработка обходится дешевле и занимает довольно мало времени. В данном случае, полагают многие разработчики, достаточно создать грамотную систему поиска и "загнать" в машинную память бумажную версию аналогичного издания.
 Проект BabelFish Yahoo!
Проект BabelFish от Yahoo!
 Проект Google Translate
Проект Google Translate.
 Проект Bing Translator
Проект Bing Translator.
Кроме того, большинству обычных пользователей хватает общедоступных сервисов перевода - к примеру, Translate.ru или аналогичного сервиса из крупных поисковых систем - скажем, BabelFish Yahoo!, Google Translate или Bing Translator. В целом, единственное предназначение подобных систем - нивелировать кросскультурный поиск в интернете, т. е. идентифицировать основную тему web-страницы, понять ее смысл, но не более того. Отметим, что интересные разработки в области машинного перевода имеют такие компании из США, как Babylon, Translation Experts, Transparent Language, европейские Linguatec и Langenscheidt, а также Asia Online, как явствует из ее названия, из Юго-Восточной Азии.
 Словари Lingvo
Словари Lingvo работают в режиме online.
Кстати, в мировом масштабе крупными игроками в этом сегменте являются издательства, занимающиеся "бумажной" литературой, а совсем не компакт-дисками или электронными книгами; можно отметить такие, как Webster, Longman и т.д. В России наиболее популярен словарь Lingvo компании ABBYY, который, как и Translate.ru от "Промт", существует в виде отдельного проекта или бесплатного онлайн-сервиса поисковой машины "Яндекс". Учитывая, что количественно интернет-пользователей пока гораздо меньше, чем "мобилизованных" абонентов с терминалами сотовой связи, разработчики систем машинного перевода и электронных словарей связывают возможный рост рынка с увеличением "умных" мобильных устройств - смартфонов и коммуникаторов. Именно такие устройства применяются пользователями, которым необходим стандартный функционал - перевод web-страниц, сообщений e-mail и SMS. Главное преимущество такого перевода - быстрый доступ к информации. Даже в командировке или во время деловой встречи пользователь всегда имеет возможность оперативно ознакомиться с иностранными документами, переведя их на русский язык. Главным критерием для такой программы является качество перевода. Помимо этого, важны еще удобство интерфейса, легкость интеграции программы с другими средствами обработки документов, выбор тематики и утилита пополнения словаря. Однако как для словарей, так и для систем машинного перевода существуют определенные ограничения, связанные с характеристиками "железа" (процессор, память и т.д.). Это сказывается на быстродействии продукта - например, снижается количество одновременно подключенных для поиска слова словарей. Основной подход в позиционировании электронных словарей для мобильных устройств и систем машинного перевода, в общем-то, очевиден. Первая группа продуктов ориентирована на людей, которые владеют языком на среднем уровне и стремятся усовершенствовать свои знания. При этом электронный словарь помогает в работе - с его помощью можно выразить мысли на иностранном языке, подобрать нужное выражение, уточнить значение незнакомого слова в переписке, изучить все формы слова и т.д. Второй тип ПО ориентирован на людей с низким или нулевым знанием языка. Такие системы помогают, например, понять, о чем в целом идет речь в документе на незнакомом языке, уловить основную суть текста. К сожалению, пока пользователю часто приходится "прощать" программам-переводчикам некоторые неточности.
 Переводчики и словари
Переводчики и словари для мобильных телефонов вполне полезны в командировке.
К подобным программам можно отнести ведущие на российком рынке разработки - ABBYY Lingvo 12 "Европейская версия" или ABBYY Lingvo 12 "Англо-русский словарь", PROMT Mobile, а также "СловоЕд" Экспресс или Делюкс (версии программы отличаются количеством слов, примерами произношения, употребления и грамматической информацией), Languages Speereo Voice Translator, Python Dictionary, w0lf's Translator и т.д. Возможное развитие подобных систем, которые подойдут европейцам для путешествия в странах с крайне сложными для них языками, - это визуальный переводчик. К примеру, уличные указатели или вывески можно фотографировать встроенной в "умный" мобильный терминал камерой и отправлять контент-провайдеру, чтобы его система подобрала правильный вариант перевода и предложила его пользователю по SMS. Аналогичная система уже применяется в европейских сетях операторов связи - с ее помощью можно загружать на мобильный терминал игры и рингтоны, просто направив телефон на телеэкран с рекламой. Для обладателей "обычных" телефонов операторы мобильной связи предлагают электронные словари с доступом через SMS (можно отправить на короткий номер 4443 SMS-сообщение, содержащее код RE, если требуется перевод с русского на английский или ER, если обратно, а также слово или фразу, требующие перевода) или WAP (к примеру, wap.lingvo.ru или wap.translate.ru), причем эти сервисы реализуются уже давно, с 2002 г. Но особой популярностью они не пользуются - обычно потребность в них возникает в тот момент, когда абонент находится за границей, где дата-роуминг или отправка текстовых сообщений - крайне дорогое удовольствие. К слову, всевозможные завлекательные описания дешевых Java-программ, где можно прочесть, что они обеспечивают "поддержку 12 языков, около 30 направлений перевода не только отдельных слов, но и предложений", причем все это "весит" не больше 50 кб, а стоит какие-то 4-5 долл., не соответствуют реальности. Пусть вас не вводят в заблуждение тезисы о том, что секрет "приготовления" такой программы-полиглота до смешного прост - достаточно процесс перевода текста возложить на плечи специализированного интернет-сервера и тем самым добиться максимальной эффективности; чаще всего там можно обнаружить только краткий словарь путешественника из сотни общеупотребительных фраз. Полностью заменить человеческий интеллект ни электронный словарь, ни система машинного перевода не в состоянии - особенно это касается сложных текстов со множеством нюансов, уловить которые может только адаптивная человеческая психика. Поэтому наиболее оперативным сервисом останется привлечение к сотрудничеству переводчика-синхрониста. Как вариант, можно позвонить по мобильному телефону на короткий номер контент-провайдера, предоставляющего такую услугу, и оператор станет "мобильным переводчиком", способным переводить любые фразы. Доллара за два в минуту.
 Монопереводчики Ectaco
Монопереводчики компании Ectaco.
Отметим отдельный сегмент языковых моноустройств - так называемые карманные переводчики. Это устройства, исполненные в едином корпусе с голосовым анализатором и небольшой QWERTY-клавиатурой для ввода иностранного текста. Наиболее крупным игроком на этом рынке является компания Ectaco, которая специализируется на разработке карманных электронных переводчиков. Подобных решений множество - есть недорогие варианты с черно-белым экраном, а также устройства для бизнес-пользователей с функцией воспроизведения речи. Отличие от версий для смартфонов и коммуникаторов одно: помимо роли словаря или путеводителя, такое устройство может сыграть и роль репетитора. К примеру, программа Language Teacher, реализованная в некоторых моделях, не только демонстрирует на экране, как пишется то или иное слово или предложение, но и проговаривает его вслух. После чего предлагает сделать это владельцу устройства и немедленно выдает оценку на точность исполнения задания. Таким образом, человек может совершенствовать как собственное произношение, так и восприятие речи на слух. Важнейшими факторами, формирующими впечатление от электронных словарей, оказались удобство и понятность программы для работы, богатство словарной базы и быстродействие программы в целом. Без сомнения, это наиболее быстро "сужающийся" рынок: новых моноустройств выходит все меньше, и они не могут конкурировать с коммуникаторами, на которых установлены электронные словари, не говоря уже о системах машинного перевода. Между тем, будущее рынка, очевидно, за универсальными переводчиками, обладающими голосовым анализатором. Но все это - на базе мобильных аппаратов. Однако разработать такое устройство - довольно сложная задача. Ведь оно должно "слышать", распознавать, переводить и воспроизводить речь с хорошим качеством и при этом быть совместимым со всеми наиболее развитыми операционными системами. А вот объединения в одном продукте многофункционального словаря и системы машинного перевода, скорее всего, не будет. Система перевода имеет больше функций, она способна перевести и слово, и текст. Но и у словаря есть свои преимущества: он может дать примеры использования слова, варианты, "связки" с общеупотребительными терминами. Это два разных продукта. В настоящий момент мы наблюдаем определенную "эволюцию" мобильных пользователей - от простого телефона они переходят к коммуникаторам, оснащенным новейшими программными средствами. Таким образом, процесс "принятия" ими новых технологий поступательно идет вперед: быстрое развитие интернета сопровождается появлением интересных сайтов, в том числе на иностранном языке. Так что, возможно, мобильный переводчик станет обязательным атрибутом коммуникатора уже в недалеком будущем.

Выводы

Наиболее разумным вариантом получения оперативной информации будет, конечно, обращение к постоянно обновляемым энциклопедиям, которые наполняются самыми обычными пользователями - там будет наибольшее количество web-ссылок, новых данных и сопроводительной информации. Правда, верить им на слово не стоит - перепроверить данные можно с помощью "классических" текстов энциклопедий, написанных профессионалами своего дела и научных фондов библиотек, которые обычно работают при крупных вузах страны. А вот словари, в т.ч. онлайновые, помогут в оперативном переводе, а системы машинного перевода можно использовать для лучшего понимания результатов поиска. Безусловно, число online-библиотек будет только увеличиваться, причем в платных проектах будет возможность заказать не только вариант текста для "настольного" компьютера, смартфонов и коммуникаторов, но и для специальных электронных книг типа Kindle 2 или аналогичных. Главное в этом случае - убедиться в том, что магазин действительно торгует книгами и использует надежную платежную систему для оплаты пластиковыми картами (именно здесь есть наибольший риск потери персональных данных).
- Обсудить материал в конференции


 
← Предыдущая страница
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.

window-new
Soft
Hard
Тренды 🔥
Облако Vultr привлекло на развитие $333 млн при оценке $3,5 млрд 2 ч.
Разработчик керамических накопителей Cerabyte получил поддержку от Европейского совета по инновациям 2 ч.
Вышел первый настольный компьютер Copilot+PC — Asus NUC 14 Pro AI на чипе Intel Core Ultra 9 4 ч.
Foxconn немного охладела к покупке Nissan, но вернётся к этой теме, если слияние с Honda не состоится 9 ч.
В следующем году выйдет умная колонка Apple HomePod с 7-дюймовым дисплеем и поддержкой ИИ 9 ч.
Продажи AirPods превысили выручку Nintendo, они могут стать третьим по прибыльности продуктом Apple 10 ч.
Прорывы в науке, сделанные ИИ в 2024 году: археологические находки, разговоры с кашалотами и сворачивание белков 18 ч.
Arm будет добиваться повторного разбирательства нарушений лицензий компанией Qualcomm 22 ч.
Поставки гарнитур VR/MR достигнут почти 10 млн в 2024 году, но Apple Vision Pro занимает лишь 5 % рынка 24 ч.
Первая частная космическая станция появится на два года раньше, но летать на неё будет нельзя 21-12 15:47