Теги → нейросеть
Быстрый переход

Meta обучила нейросеть data2vec работе с речью, изображениями и текстом, чтобы она смогла «понимать мир»

Исследователи Meta обучили одну модель искусственного интеллекта (ИИ) обрабатывать речь, изображения и текст — они надеются, что подобные «мультимодальные» системы лягут в основу будущих разработок в области дополненной реальности и метавселенной.

Источник изображения: Gerd Altmann / pixabay.com

Источник изображения: Gerd Altmann / pixabay.com

Модель, получившая название data2vec, выполняет задачи разного рода: при голосовом вводе она распознаёт речь; при вводе данных в формате картинки она идентифицирует объекты на ней; а получив на вводе текст, проверяет его на грамматические ошибки и анализирует интонации с эмоциональным фоном. Традиционно ИИ-алгоритмы обучаются на данных одного типа, однако в случае с data2vec было решено работать с тремя форматами. Но с каждым из них нейросеть работает независимо от остальных.

Компания надеется, что в перспективе подобные мультимодальные модели сделают компьютеры более адаптивными — способными совмещать физические и цифровые окружения в едином понятийном измерении. «Люди воспринимают мир через комбинацию зрения, слуха и слов — системы вроде этой однажды станут понимать мир так же, как и мы. Когда-нибудь она будет встроена в очки дополненной реальности или ИИ-ассистент, чтобы, например, помочь человеку приготовить обед, примечая пропущенные ингредиенты, рекомендуя убавить огонь или [выполняя] более сложные задачи», — прокомментировал проект изданию The Register глава Meta Марк Цукерберг (Mark Zuckerberg).

Аппаратная платформа системы data2vec была построена с использованием 16 ускорителей NVIDIA V100 и A100. В качестве исходных данных для обучения ИИ использовались 960 часов голосовых аудиозаписей, несколько миллионов слов из книг и со страниц «Википедии», а также картинки из базы ImageNet-1K. В ходе тестирования при выполнении конкретных заданий data2vec показала себя эффективнее некоторых топовых ИИ-моделей, обученных на данных только одного типа. В перспективе, заявил один из разработчиков проекта, планируется расширить восприятие нейросети данными других типов, таких как запахи, 3D-объекты и видеозаписи.

Московские камеры видеонаблюдения будет контролировать нейросеть за 4,2 млрд рублей

ООО «Спецдорпроект» стало победителем электронного аукциона, проводимого Департаментом по конкурентной политике Москвы. Компании предстоит построить комплекс видеонаблюдения, управляемый нейросетью. Проект оценён в 4,24 млрд рублей, начальная цена торгов составляла 4,29 млрд рублей.

Источник изображения: PIRO4D / pixabay.com

Источник изображения: PIRO4D / pixabay.com

Система будет запущена в Москве до конца года. В течение 5 лет московские власти арендуют у компании 1300 видеокамер, 770 из которых будут установлены на МКАД, остальные появятся на других магистралях в городе. Каждый комплекс видеонаблюдения будет включать в себя три камеры, ИК-подсветку дальностью до 250 м, а также 40-кратный оптический зум. Нейросеть сможет выявлять ДТП, пробки, мусор и животных на дорогах, вставшие на дороге автомобили, пожары, а также «вторжения транспортных средств в запрещённую зону».

Как передаёт RB.RU, главой ООО «Спецдорпроект» является Антон Клячин, он же возглавляет «Гринтех», являющийся владельцем 75 % активов компании. Господин Клячин также является партнёром юридической фирмы Salomon Partners и бывшим главным юрисконсультом Russian Technologies — это был один из первых венчурных инвестиционных фондов «Альфа-групп».

Как сообщили в администрации Москвы, нейросеть, обрабатывающая информацию с новых камер наблюдения, будет передавать данные в полицию и коммунальные службы, однако напрямую для вынесения штрафов она использоваться не станет. Сейчас в Москве работает система видеонаблюдения из 200 тысяч камер; в течение года появятся ещё 2 тысячи камер с поддержкой распознавания лиц.

«Сбер» обучил нейросеть генерировать эмодзи по описанию

Инженеры «Сбера» предложили генерировать эмодзи-изображения на основе заложенного пользователями описания. Для этого они использовали нейросеть ruDALL-E (XL), на основе которой построили модель Emojich.

Источник изображения: rudalle.ru

Источник изображения: rudalle.ru

Нейросеть ruDALL-E была разработана специалистами Sber AI и SberDevices, её предназначение — создание изображений на основе текстового описания на русском языке. Проект Emojich был построен на данной платформе. Как подчеркнули в «Сбере», это первый пример практического применения нейросети. Ознакомиться с работой проекта можно при помощи Telegram-бота, приложения «Салют», а также в специальном разделе сайта ruDALL-E. Пользователям приложения авторы проекта предлагают отдать ему команду: «Салют, включи художника», после чего сформулировать запрос на эмодзи-картинку. Код Emojich опубликован в официальном репозитории нейросети на Github.

Исполнительный вице-президент СТО «Сбербанк Груп» Давид Рафаловский отметил, что эмодзи сегодня активно используются при общении в мессенджерах, однако их ассортимент, а значит, и набор выражаемых ими эмоций ограничен. Поэтому авторы проекта решили обучить нейросеть генерировать новые эмодзи на основе любой фразы.

Нейросеть ruDALL-E была анонсирована «Сбером» в ноябре. Для её обучения использовались два типа данных: тексты и изображения, благодаря чему она может создавать картинки по текстовому описанию. Нейросеть существует в двух вариантах: ruDALL-E XL с 1,3 млрд параметров и ruDALL-E 12B с 12 млрд параметров.

Академики РАН усомнились в том, что искусственному интеллекту можно доверять

На президиуме Российской академии наук был поднят ряд важных вопросов, связанных с технологиями искусственного интеллекта. Академики попытались понять: может ли человек доверять искусственному интеллекту, и где должна проходить граница этого доверия?

Источник изображения: Gerd Altmann / Pixabay

Источник изображения: Gerd Altmann / Pixabay

«Дело в том, что ИИ это сегодня «чёрный ящик», но самое главное, что никто, даже сами авторы программ не знают, как он работает. Можно ли в такой ситуации довериться его выводам? Ведь он будет, по сути, брать на себя функции оракула по самым разным вопросам. И надо признать, что многие задачи эта умная машина уже сейчас делает быстрее и лучше человека. И кто знает, а может у кого-то вообще возникнуть соблазн: так давайте вообще откажемся от науки. Всё передоверим нейросетям, на них любые расчёты смогут провести обычные операторы даже без высшего образования <…> Но мало кто задумался, что в итоге такого доверия можно получить совершенно искажённую картину, которая обойдётся в многие миллионы долларов», — приводит источник слова президента РАН Александра Сергеева.

Несмотря на то, что человек доверяет компьютерам и другой технике, в случае с искусственным интеллектом ситуация иная. Люди до сих пор не до конца понимают, как работает мозг человека. Точно также нет полного понимания того, что происходит внутри нейросети, построенной по аналогии с мозгом. Основой нейросетей является достаточно простое уравнение одного нейрона. Однако в случае, когда задействовано 500 млрд таких компонентов, никто точно не может сказать, какие связи устанавливаются внутри нейросети.

Также отмечается, что по мере развития нейросетей выявляется всё больше недостатков таких технологий. На начальном этапе нейросеть обучается на сотнях тысяч или миллионах примеров чего-либо. Однако зачастую даже небольшое отклонение от полученных в процессе обучения знаний приводит к тому, что система выдаёт неверный результат. Одним из ярких примеров этого является многомиллионная нейросеть IBM, которая разрабатывалась для медицины, но оказалось, что алгоритм ставит диагнозы на уровне среднего врача-человека. На основе этого учёные пришли к выводу о том, что ИИ-технологии позволяют строить очень умные системы, но и они далеко не безгрешны.

«Сегодня мировой тренд — создание так называемого доверенного искусственного интеллекта. То есть разработать такие требования, которые в принципе не позволят выпустить в мир нейросеть, которая способна совершать ошибки. И тестировать эту технику перед началом эксплуатации. Если пройдёт испытание успешно, то можно доверять. Для разработки таких аналогов ГОСТов в институте создан первый в России Центр доверенного искусственного интеллекта», — сказал во время выступления академик РАН Арутюн Аветисян.

Власти предоставят разработчикам нейросетей доступ к госданным

Стало известно, что разработчики технологий на основе искусственного интеллекта будут иметь возможность получения доступа к государственным наборам данных через государственных операторов на основе мотивированного запроса. Такую возможность предполагает проект концепции Минцифры, который был представлен на этой неделе на расширенном заседании Комиссии РСПП по медиаиндустрии и предпринимательству в информационной сфере.

Источник изображения: fancycrave1 / Pixabay

Источник изображения: fancycrave1 / Pixabay

Советник генерального директора Центра экспертизы и координации информатизации Министерства цифрового развития Андрей Никуличев, комментируя данный вопрос, сообщил, что представленная концепция предполагает создание государственных операторов наборов данных, которые будут определены правительством и субъектами РФ. Наборы данных будут создаваться на заявительной основе, причём стоимость одного дата-сета составит не менее 1 млн рублей. Состав и источники данных для дата-сетов будут определяться операторами, которые также должны будут обезличивать информацию и обеспечивать доступ к ней в зависимости от класса защищённости.

Предполагается создание нескольких классов данных: в первый войдут общедоступные данные, во второй — обезличенные конфиденциальные, в том числе связанные с банковской, медицинской, налоговой тайной и др., а в третий — данные, содержащие гостайну. Отмечается, что вопрос доступа к данным третьего класса продолжает обсуждаться. В зависимости от класса данных будет изменяться список лиц, имеющих к ним доступ. Проверять результаты обезличивания информации и правильность отнесения информации к тому или иному классу будут специальные аккредитованные центры.    

«Мы должны чётко знать, кому эти наборы данных нужны, каким образом они будут использоваться, какой социально-экономический эффект они будут приносить», — приводит источник слова господина Никуличева. Представленная инициатива предполагает, что в 2022-2023 годах разработчики смогут получить доступ к общедоступным данным, в 2023 году — к обезличенным данным, в 2024 году — к данным, содержащим гостайну. Также отмечается, что в рамках реализации этой концепции потребуется внесение изменений в законы «Об информации, информационных технологиях и о защите информации», «О персональных данных» и «Об обеспечении доступа к информации о деятельности государственных органов и органов местного самоуправления».

Онлайн-кинотеатр Megogo задействует нейросеть для поиска запрещённого контента

Онлайн-кинотеатр Megogo планирует использовать нейросеть для поиска в фильмах запрещённого законом контента. Это необходимо для правильной маркировки фильмов и удаления неприемлемой продукции. Об этом «Ведомостям» рассказал глава сервиса Виктор Чеканов.

Источник: MEGOGO

Источник: Megogo

По словам Чеканова, это превентивная мера для устранения возможных нарушений. Нейросеть будет заниматься поиском нецензурной лексики, сцен курения и употребления спиртных напитков в кадре, а также прочий неприемлемый контент.

Нейросеть будет состоять из двух элементов: звукового распознавания на базе открытого продукта Vosk и системы графического распознавания. Глава  Megogo уточнил, что система сможет самостоятельно определять и помечать неудобоваримый контент через год. Сейчас для обучения нейросети в рабочем процессе участвуют люди. Чеканов также заявил, что они планируют научить систему распознавать сцены насилия, но как именно это будет реализовано пока неясно.

Онлайн-кинотеатр  Megogo стал первым стриминговым сервисом, против которого Роскомнадзор составил протокол за неверно выставленную возрастную маркировку фильму — вместо 18+ в сервисе был установлен рейтинг 16+. Виктор Чеканов тогда заявил, что в маркировке компания ориентировалась на прокатное удостоверение Минкультуры.

Google рассказала, как искусственный интеллект делает информацию полезнее

На онлайн-мероприятии Search On компания Google привела некоторые подробности относительно работы нейросети MUM, которая ляжет в основу обновлённой поисковой системы. Алгоритмы на основе искусственного интеллекта позволят совмещать визуальный и текстовый поиск, а также помогут пользователям работать с контекстом интересующих тем.

Источник: blog.google

Источник: blog.google

Сегодня у человека всегда под рукой огромное количество информации — намного больше, чем когда-либо было в истории человечества. Важно то, как человек использует эту информацию, и помочь ему в этом сейчас может искусственный интеллект. Это касается и простых повседневных вопросов, и решения сложных глобальных проблем. На прошедшем накануне онлайн-мероприятии Search On компания Google рассказала о внедрении новейших технологий искусственного интеллекта в поисковые продукты, благодаря чему пользователям открываются новые способы поиска и изучения информации, более естественные и интуитивно понятные.

В мае на конференции Google I/O компания анонсировала принципиально новый алгоритм обработки информации, основанный на нейросети MUM (Multitask Unified Model — «Многозадачная унифицированная модель»). В ближайшие месяцы компания радикально обновит поисковую машину, объединив визуальный поиск с возможностью задавать вопросы относительно того, что видит пользователь. Google привела несколько примеров, как будет работать обновлённая платформа.

В приложении Google Lens можно открыть изображение рубашки и попросить Google найти такой же узор на другом предмете гардероба, например, на носках. В подобном случае поисковый запрос трудно сформулировать одними только словами: можно ввести «белые носки в викторианском стиле с цветочным рисунком», но далеко не факт, что в выдаче будет тот рисунок, который ищет пользователь. В этом случае сочетание визуального поиска с текстовым запросом действительно представляется самым разумным решением. И оно будет доступно с MUM.

Конечно же, нововведение коснётся и основного продукта Google — поисковой машины, работа с которой станет более естественной и интуитивно понятной. Система упростит пользователям изучение и понимание новых тем. К примеру, человек решил украсить свою квартиру и хочет изучить акриловую живопись. Задав соответствующий поисковый запрос, он выходит на выдачу Google, при этом система показывает в выдаче результаты, на которые люди обращают внимание в первую очередь. В случае с акриловой живописью это более 350 тем, среди которых система поможет выбрать требуемое направление. Это обновление станет доступным в ближайшие месяцы.

Далее нейросеть позволяет легко масштабировать тему запроса, сужая или, напротив, расширяя её. В случае с акриловой живописью сужение означает, например, конкретизацию техник рисования или художественные курсы, которые пользователь может посещать. Если же расширить тему, то Google позволит, например, ознакомиться с работами известных художников.

Источник: blog.google

Источник: blog.google

Обновлённый поисковый алгоритм предоставляет ещё одну возможность — поиск примеров для вдохновения. Применительно к живописи это может означать техники акриловой заливки (флюид арт), соответствующий запрос покажет страницу с примерами работ. Искать источники вдохновения можно по любым другим темам, например, по костюмам на Хэллоуин.

Возможности поисковых нейросетей сегодня не ограничиваются одними только статическими картинками — система анализирует имеющиеся в её распоряжении видео и определяет ключевые моменты в записях, например, решающий бросок в баскетбольном матче. Нейросеть MUM не только анализирует содержимое видео, но и предлагает темы, связанные с контентом записи, даже если эти темы не были упомянуты в явном виде. Первая версия этой функции будет выпущена в ближайшие недели, а в дальнейшем она будет расширена.

Иными словами, MUM позволяет пользователям открывать более широкий ассортимент страниц, видео и картинок, которые пользователи не могли найти раньше или даже не искали иным образом.

Обновления поисковой машины не ограничиваются одними только алгоритмами новой нейросети — Google внесла некоторые изменения в интерфейс поиска, упрощая процесс совершения покупок из различных интернет-магазинов. Причём речь идёт не только о крупных игроках электронной коммерции — ключевым критерием являются фактические потребности пользователя. Компания также проводит активную работу по облегчению оценки достоверности найденной информации.

Впрочем, и интернет-поиском компания тоже не ограничивается. Google ежедневно направляет пользователей на более чем 100 млн сайтов и ежемесячно связывает людей с более чем 120 млн компаний, у которых нет собственных сайтов — система предоставляет номера телефонов, маршруты проезда и прохода.

ИИ-алгоритм Facebook перепутал темнокожих мужчин с приматами

Один из роликов в профиле издания The Daily Mail в социальной сети Facebook, в котором присутствовали темнокожие мужчины, был автоматически отмечен как видео с приматами. Пользователи обратили внимание, что соцсеть предлагает «продолжить смотреть видео о приматах», что побудило компанию провести расследование и остановить работу соответствующего алгоритма. Facebook уже принесла извинения, назвав случившееся «недопустимой ошибкой».

Изображение: Jim Wilson / The New York Times

Изображение: Jim Wilson / The New York Times

Речь идёт о видео, которое появилось в профиле The Daily Mail 27 июня. В нём демонстрируются стычки темнокожих мужчин с белыми гражданскими лицами и полицейскими. Ролик не имеет никакого отношения к приматам. Представители компании провели расследование, по результатам которого функционирование дающего рекомендации ИИ-алгоритма было приостановлено.

«Как мы уже говорили, несмотря на то, что мы работаем над улучшением искусственного интеллекта, мы знаем, что он несовершенен и нам ещё предстоит много работы. Мы приносим свои извинения всем, кто мог увидеть эти оскорбительные рекомендации», — прокомментировала данный вопрос пресс-секретарь Facebook Дэни Левер (Dani Lever).

Изображение: The New York Times

Изображение: The New York Times

Отметим, что Google, Amazon и другие технологические гиганты уже много лет находятся под пристальным вниманием из-за предвзятости создаваемых ими алгоритмов, особенно в расовых вопросах. Исследования показали, что технология распознавания лиц предвзято относится к темнокожим людям и с трудом идентифицирует их, из-за чего произошло несколько инцидентов, когда темнокожие подвергались дискриминации или беспричинным арестам.

Случаи, подобные нынешнему, случались и ранее. Например, в 2015 году сервис Google Фото пометил несколько снимков с темнокожими людьми как изображения «гориллы», за что Google пришлось приносить извинения. Тогда же было объявлено, что компания будет работать над немедленным устранением проблемы. Более чем через два года было установлено, что Google решила вопрос путём цензурирования слова «горилла» в поисковых запросах, а также частичной блокировкой слов «шимпанзе» и «обезьяна».

Построенная по образцу человеческого мозга нейросеть успешно выполнила когнитивные задания

Канадские учёные смоделировали нейросеть по образцу человеческого мозга. Она справилась с заданиями в области когнитивной деятельности более гибко и эффективно, чем традиционные системы.

Источник: scitechdaily.com

Источник: scitechdaily.com

Авторами проекта стали учёные Монреальского неврологического института-госпиталя и Института искусственного интеллекта Квебека. Они провели подробное исследование данных магнитно-резонансной томографии в крупном репозитории Open Science, реконструировали паттерны мозговых связей и спроектировали на их основе нейросеть. В результате получилась система модулей ввода-вывода, действительно напоминающая биологический мозг. Для проверки работоспособности системе поставили когнитивное задание, связанное с памятью. Речь идёт не о побитной фиксации данных, а об интерпретации получаемой информации и её усвоении как знания — по образцу работы человеческого мозга. Далее исследователи провели наблюдение за тем, как система его выполняла.

Авторы проекта уверены, что он уникален по двум причинам. Предыдущие работы по мозговым связям (коннектомике) предполагали описание организации структуры мозга без оглядки на то, как при этом осуществляется процесс вычислений и реализуются базовые функции. Кроме того, традиционные современные нейросети имеют произвольную структуру, не всегда привязанные к моделям организации мозговых связей. Поэтому, интегрируя мозговую коннектомику в архитектуру нейросети, авторы исследования надеялись получить дополнительные сведения о физиологической реализации когнитивных процессов мозгом, чтобы на основе этих данных вывести новые принципы проектирования нейросетей.

В результате обнаружилось, что нейросеть, построенная по образцу мозговых связей человека — нейроморфная нейросеть, — выполняет когнитивные задания, связанные с памятью, более гибко и эффективно, чем аналоги на основе традиционной произвольной архитектуры.

«В проекте объединены две мощные научные дисциплины. У неврологии и искусственного интеллекта общие корни, но в последнее время они разошлись. Использование искусственных нейросетей поможет нам понять, как структура мозга обеспечивает реализацию его функций. В свою очередь, использование эмпирических данных для создания нейросетей откроет принципы проектирования для создания лучшего искусственного интеллекта. Таким образом, эти области помогут друг другу и обогатят наше понимание мозга», — прокомментировал проект один из его авторов, Братислав Мисич (Bratislav Misic).

«М.Видео-Эльдорадо» внедрила искусственный интеллект для помощи продавцам-консультантам

Группа «М.Видео-Эльдорадо» внедрила специализированную нейронную сеть, которая в перспективе теоретически сможет заменить продавцов-консультантов. В текущем виде искусственный интеллект призван помогать сотрудникам магазинов отвечать на вопросы покупателей.

Здесь и ниже изображения «М.Видео-Эльдорадо» / mvideoeldorado.ru

Здесь и ниже изображения «М.Видео-Эльдорадо» / mvideoeldorado.ru

О проекте, как сообщает газета «Ведомости», рассказал Дмитрий Марыкин, менеджер направления розничных процессов в «М.Видео-Эльдорадо». По его словам, на поиск ответов на нестандартные вопросы у консультантов может уходить от 15 минут до нескольких часов. Искусственный интеллект сможет справляться с решением большинства таких задач за считанные секунды.

«Иногда продавцу сложно сориентироваться в вопросах, которые он не решает ежедневно: где отремонтировать технику, как получить возврат денег за товар наличными, если вы платили картой, можно ли оплатить товар бонусными баллами, если он продается со скидкой и т. п.», — отметил господин Марыкин.

Сеть «М.Видео-Эльдорадо» сейчас объединяет 1074 магазина в 279 городах по всей России. В ней постоянно появляются скидки, акции, новые технологии и сервисы, а поэтому сотрудники не всегда могут отслеживать все изменения. В такой ситуации как раз и придёт на помощь искусственный интеллект.

Отмечается, что в федеральной российской сети бытовой электроники и техники для дома электронный разум в таком формате применяется впервые.

С помощью бортовой камеры электромобили Tesla способны определять предметы, удалённые до 62 метров

Илон Маск (Elon Musk) долгое время бравировал готовностью Tesla обходиться без дорогостоящих лидаров для контроля расстояния электромобиля в движении до окружающих предметов, а недавно компания отказалась для рынка США и от использования обычных радаров. Энтузиаст продемонстрировал, как нейросеть помогает электромобилю Tesla определять дистанцию до объектов при помощи данных с камеры.

Источник изображения: Electrek

Источник изображения: Electrek

Как отмечает Electrek, получивший доступ к исходному коду программного обеспечения Tesla энтузиаст с псевдонимом Green на страницах Twitter выложил видеоролик, демонстрирующий способность электромобилей этой марки определять расстояние до других расположенных на пути следования объектов. Работа нейросети завязана на данные с единственной фронтальной камеры, хотя их в данной части электромобиля три, а всего Tesla оснащает машины восемью камерами.

Для работы нейросети достаточно разрешения видео в одну восьмую часть от исходного, программное обеспечение определяет лишь силуэты объектов, удалённых от электромобиля во фронтальном направлении на дистанцию от 5 до 62 метров. Формируется трёхмерная картинка, которую исследователь ради наглядности преобразовал в монохромную с разными уровнями яркости объектов. Чем ближе предмет к электромобилю, тем он ярче. Пример доказывает, что уверенное определение расстояния до объектов может быть реализовано при помощи одних только видеокамер, без датчиков другого типа. К сожалению, обычные камеры уязвимы к погодным условиям, хотя Tesla предусмотрела подогрев того участка лобового стекла, к которому прилегает корпус основной фронтальной камеры — на случай снегопада или обледенения.

«Яндекс» запустил «Балабоба» — сервис, который способен дописать любой текст с помощью ИИ

«Яндекс» запустила новый сервис «Балабоба», который использует ИИ на основе языковой модели Yet another Language Model (YaLM) и способен генерировать каждое последующее слово в предложении. Нейросеть с 3 млрд параметров в процессе обучения использовала страницы «Википедии», новостные статьи, книги, открытые записи в социальных сетях и другие материалы. YaLM используется для формирования ответов в поисковике «Яндекса» и ответах голосового помощника «Алиса».

Изображение: Яндекс

Изображение: Яндекс

Согласно имеющимся данным, новый сервис «Яндекса» способен генерировать текст в разных стилях, таких как народные мудрости, телевизионные репортажи, тосты, рекламные слоганы и др. Чтобы получающиеся в результате генерации тексты были правильными грамматически и разнообразны с лексической точки зрения, в процессе обучения использовались терабайты данных. Разработчики также исключили из выборки повторяющиеся, незаконченные и неестественные тексты, чтобы модель не была излишне перегруженной.

Главная особенность YaLM заключается в способности быстро обучаться новому. Достаточно всего несколько примеров, чтобы нейросеть могла писать осмысленные отзывы на фильмы, застольные тосты или теории заговора. Для достижения результата хватит от пяти до нескольких десятков примеров, показывающих, каким образом нужно писать такие тексты, чтобы нейросеть смогла в дальнейшем составлять осмысленные заметки. Разработчики отмечают, что для генерации простых рекламных слоганов нейросеть обучалась на нескольких известных примерах, включая «Найдётся всё», знаменитом слогане «Яндекса».

Китайская нейросеть WuDao 2.0 с 1,75 трлн параметров превосходит аналоги от Google и OpenAI

Китайские учёные из Пекинской академии искусственного интеллекта (BAAI) вместе с десятками коллег из других организаций создали самую сложную в мире модель обработки естественного языка (NLP), которая превосходит аналоги от Google и OpenAI. Генеративная нейронная сеть глубокого обучения WuDao 2.0 создана в рамках стремления Китая повысить свою технологическую конкурентоспособность на мировой арене.

Изображение: Xinhua

Изображение: Xinhua

WuDao 2.0 представляет собой предварительно обученную ИИ-модель, которая использует 1,75 трлн параметров. Для сравнения, модель GPT-3 от OpenAI использует 175 млрд параметров, а представленная в январе Google Switch Transformer — 1,6 млрд параметров. Параметры — это переменные, определяемые моделями машинного обучения. По мере развития модели параметры уточняются, их количество возрастает, за счёт чего повышается точность работы алгоритма и его производительность.

Разработчики показали, как WuDao 2.0 использует свои возможности для имитации речи, написания стихов, распознавания изображений и генерации текста. Согласно имеющимся данным, WuDao 2.0 обучалась на английском и китайском языках, для чего исследователи использовали 4,9 Тбайт изображений и текстов, включая 1,2 Тбайт текстов на английском и китайском языках.

«Эти сложные модели, обученные на гигантских наборах данных, требуют лишь небольшого количества новой информации для освоения конкретной функции, потому что они могут использовать уже полученные знания для выполнения новых задач», — сказал один из учёных BAAI Блейк Ян (Blake Yan).

В действиях алгоритма создания превью изображений в Twitter обнаружили расовые и половые предубеждения

Разработчики из Twitter изучили алгоритм автоматического создания превью изображений, которые загружаются в социальную сеть пользователями. В результате было установлено, что этот инструмент в процессе работы оставляет белых людей на фото чаще, чем темнокожих, а женщин — чаще чем мужчин.

Изображение: Getty Images

Изображение: Getty Images

Twitter также объявила о начале процесса отказа от использования старой системы создания изображений для предварительного просмотра, которая автоматически применяется к картинкам в постах пользователей. Согласно имеющимся данным, более совершенный алгоритм обрезки изображений уже начал постепенно разворачиваться для пользователей Twitter, которые взаимодействуют с платформой с помощью мобильных устройств.

Источник отмечает, что старый алгоритм уделял особое внимание тому, чтобы центрировать вид очень высоких или широких изображений таким образом, чтобы кадрировать лица людей или какие-то другие интересные детали, запечатлённые на снимке. Однако не всегда эта функция срабатывала должным образом, из-за чего в некоторых случаях превью получалось неудачным.

На расовые предубеждения алгоритма обрезки фото в Twitter ещё в прошлом году обратили внимание пользователи соцсети. Разработчики быстро отреагировали на их сообщения и пообещали проделать работу, направленную на исследование данного вопроса. В результате оказалось, что старый алгоритм на 8 % чаще оставлял в кадре мужчин, на 4 % чаще белых людей обоих полов по сравнению с темнокожими, на 7 % чаще белых женщин по сравнению с темнокожими и на 2 % чаще белых мужчин по сравнению с темнокожими.

«Мы попытались найти компромисс между скоростью обработки и согласованностью автоматической обрезки с потенциальными рисками, которые были выявлены в исследовании. Один из наших выводов заключается в том, что не все пользователи Twitter являются подходящими кандидатами для обработки алгоритмом, и в этом случае решение о том, как кадрировать изображение, лучше всего принимает человек», — сказала глава подразделения по разработке программного обеспечения в Twitter Румман Чоудхури (Rumman Chowdhury). Она также напомнила, что недавно в Twitter была развёрнута функция реалистичного предварительного просмотра, позволяющая избежать кадрирования снимков с соотношением сторон 16:9 и 4:3.

ФК «Ливерпуль» и DeepMind изучают возможность использования нейросетей в футболе

Стало известно, что футбольный клуб «Ливерпуль» объединил усилия с командой разработчиков принадлежащей Alphabet компании DeepMind с целью изучить возможности использования искусственного интеллекта в мире футбола. Результаты совместной работы опубликованы в журнале Journal of Artificial Intelligence Research.

В последние годы объём данных, доступных в футболе, значительно увеличился за счёт разнообразных датчиков, GPS-трекеров и алгоритмов компьютерного зрения, которые используются для слежения за движением мяча и перемещениями игроков по полю. Обилие данных означает, что для их анализа могут использоваться передовые технологии.

Исследование показало, что футбольные команды могут использовать нейронные сети для выявления закономерностей, которые не может заметить тренер. Отмечается, что футбол предлагает для DeepMind ограниченную, но сложную среду для тестирования алгоритмов. «Игра, подобная футболу, очень интересна, потому что здесь много агентов, есть аспекты конкуренции и сотрудничества. В отличие от шахмат или го, футболу присуща неопределённость, потому что в него играют в открытом мире», — считает один из исследователей из DeepMind Карл Туйлс (Karl Tuyls).

Неопределённость не означает, что нельзя делать прогнозы в футболе, и это одна из областей, где ИИ-алгоритм может оказаться наиболее полезным. Например, можно обучить нейросеть на данных о конкретной команде и составе, чтобы предсказывать, как игроки будут реагировать в разных ситуациях на поле. Такой алгоритм сможет прогнозировать последствия тактических изменений или того, как, например, будет играть соперник, в случае, если ключевой игрок покинет поле из-за травмы.

Цель исследования не в том, чтобы создать замену тренерам, а в том, чтобы создать дополнительный инструмент. «Есть большое количество данных, которые алгоритм должен переварить, и обрабатывать массивы таких данных не всегда просто. Мы пытаемся создать вспомогательную технологию», — говорят исследователи. Нейросеть также могла бы использоваться для прогнозирования того, как тот или иной игрок будет бить пенальти. Ещё один вариант использования нейросетей в футболе заключается в оценке влияния конкретных действий игроков в той или иной ситуации на конечный результат. Такая информация была бы полезна для послематчевого анализа.

«Цель состоит в том, чтобы иметь целостную систему, которая хорошо интегрируется с игроком-человеком на поле и облегчает его работу. Я не думаю, что вы увидите большие достижения в следующие полгода или год, но в следующие пять лет некоторые инструменты будут сильнее развиты и вы увидите появление чего-то вроде «Автоматизированного видеопомощника для тренера», который поможет проводить предматчевый и послематчевый анализ», — считает Карл Туйлс.

window-new
Soft
Hard
Тренды 🔥
Бизнес получит доступ к ведомственным обезличенным данным для обучения ИИ 39 мин.
«Яндекс» и Национальная система платёжных карт поддержали Samsung в патентном споре, связанном с Samsung Pay 44 мин.
Новый владелец объединит киберспортивные компании ESL Gaming и FACEIT в одну 51 мин.
Новая функция Steam Cloud позволит на лету переключаться между игровыми сессиями на Steam Deck и ПК с сохранением прогресса 2 ч.
Отличия от «беты», открытый мир и «Новая игра +»: свежие подробности Elden Ring с Taipei Game Show 2022 3 ч.
Роскомнадзор может создать систему блокировки звонков с подменных телефонных номеров 3 ч.
VR-экшен с элементами выживания The Walking Dead: Saints & Sinners получит продолжение 3 ч.
Переиздание классического арканоида Breakout от Atari поступит в продажу 10 февраля 4 ч.
Интерактивная поэма A Memoir Blue «переехала» на март 4 ч.
Видео: бои, навыки и стелс в новом геймплейном ролике ролевого экшена Weird West 4 ч.
Lexar представила память Ares RGB DDR4 для игровых компьютеров 8 мин.
Lenovo готовит к выпуску игровой смартфон Legion Halo на чипе Snapdragon 8 Gen1 Plus 44 мин.
Электрическое аэротакси Joby установило мировой рекорд по скорости полёта в своей категории 57 мин.
Aruba Networks: подавляющее большинство компаний в EMEA интересуется NaaS, но не все до конца понимают, что это такое 60 мин.
Космический грузовик SpaceX Dragon успешно вернул с МКС на Землю более 2000 кг научных грузов 2 ч.
В последнем квартале выручка Logitech оказалась на 2 % ниже, чем годом ранее — тогда удалёнка лучше подогревала спрос 3 ч.
Acer представила Chromebook Spin 311 — ноутбук-трансформер для учёбы на процессоре MediaTek 3 ч.
Южнокорейский телеком-оператор SK Telecom ускорил темпы разработки летающих такси 4 ч.
Кулер Akasa Alucia H4 предназначен для процессоров с TDP до 185 Вт 4 ч.
IBM завершила квартал рекордным ростом выручки за последние десять лет 5 ч.