Теги → cloud vision

Google выпустила публичную бета-версию анализатора видео на базе искусственного интеллекта

Google предоставила всем желающим доступ к бета-версии API Cloud Video Intelligence, который анонсировала в марте. Он позволяет пользователям загружать видео и с помощью системы обнаружения меток получать информацию об объектах на нём.

В новой версии API компания добавила поддержку обнаружения порнографического контента. Так сервис, в который разработчик встраивает Cloud Video Intelligence, сможет обнаруживать неприемлемые ролики и блокировать их отправку.

Google анонсировала и ряд улучшений для API Cloud Vision, которые делают некоторые возможности интерфейса программирования более точными. Модель обнаружения меток, которая называет объекты на изображениях, теперь поддерживает более 10 тысяч сущностей. Она, например, может отличить сухой завтрак на картинке от обычного. Также в два раза возросла вероятность подбора наиболее подходящей для изображения метки.

Показатель ошибок модели безопасного поиска, которая обнаруживает контент для взрослых, снизился на 30 %. У модели поиска текста средняя скорость обнаружения выросла на 25 %. Также она стала на 5 % точнее при работе с романскими языками. Система обнаружения лиц Google стала более чем в два раза лучше распознавать грусть, удивление и злость.

Благодаря сервисам Google разработчикам проще встраивать в приложения возможности искусственного интеллекта. Им не нужно самостоятельно создавать системы машинного обучения. С публичным запуском API Cloud Video Intelligence калифорнийский гигант показал: приложения можно существенно улучшать без каких-либо усилий, поскольку Google вносит изменения в фоновом режиме.

Google открыла всем разработчикам доступ к Cloud Vision

Сервис Cloud Vision, который некоторое время был доступ лишь ограниченному числу людей, перешёл в стадию публичного бета-теста, что означает, что опробовать его теперь может любой разработчик. Сервис этот позволяет с лёгкостью встраивать в приложения функции для распознавания объектов на изображениях и их классификации.

Технология Google может делать различные стандартные вещи вроде распознавания текста на картинках, однако её главная возможность — это именно распознавание объектов. Та же технология используется при поиске изображений в Google Photos: она способна распознать всё — начиная с цветов, еды и животных и заканчивая местными достопримечательностями. По словам Google, алгоритм способен распознать тысячи различных объектов.

Ещё одна интересная возможность Cloud Vision — классификация изображений. Сервис также может отмечать неприемлемый контент, благодаря чему разработчики фото-приложений смогут при желании поддерживать тот или иной возрастной рейтинг в своих продуктах. Более того, сервис способен определять сентиментальность людей на снимках — например, так можно отсортировывать фотографии с улыбающимися людьми.

Google также раскрыла цены на использование Cloud Vision. Например, при необходимости определения ярлыков вам придётся заплатить $2 за тысячу фотографий, а вот базовое определение символов на снимках обойдётся в $0,6 за тысячу фото. В период бета-тестирования каждый пользователь сможет обрабатывать не более 20 миллионов картинок. 

Сервис по распознаванию картинок от Google стал доступен разработчикам

Компания Google выпустила бета-версию своего API под названием Cloud Vision, с помощью которого разработчики могут создавать приложения, «понимающие» содержимое картинок. На данный момент набор из шести инструментов могут опробовать лишь избранные разработчики. Если вы разработчик и хотите принять участие в бета-тестировании Cloud Vision, пройдите по этой ссылке, заполните анкету и объясните, что вы собираетесь делать с инструментарием.

Инструмент под названием Safe Search Detection может быть особенно полезен компаниям, разрабатывающим приложения для шеринга картинок. Многие пользователи публикуют в таких приложениях запрещённый контент, но Safe Search Detection может такой контент блокировать.

Инструмент Facial Detection может определять лица на изображениях, а также различные особенности лиц и даже их расположение — например, эмоции человека могут быть описаны инструментом как «радость и печаль». Google пообещала не использовать технологию для распознавания лиц и не хранить какую-либо информацию на своих серверах.

Функция Landmark Detection позволяет приложению определить на фотографии Эйфелеву башню и даже показать её местоположение. То же касается и многих других популярных достопримечательностей. А Entity Detection определяет общую тематику фото — например, фотография фермы, скорее всего, получит от сервиса метку «производство».

window-new
Soft
Hard
Тренды 🔥