Опрос
|
реклама
Быстрый переход
Разработана система обучения ИИ на повреждённых данных — это защитит от претензий правообладателей
22.05.2024 [16:52],
Павел Котов
Модели искусственного интеллекта, которые генерируют картинки по текстовому описанию, при обучении на оригинальных изображениях могут их «запоминать», поднимая таким образом вопрос о нарушении авторских прав. Для защиты от претензий со стороны правообладателей была разработана система Ambient Diffusion для обучения моделей ИИ только на повреждённых данных. ![]() Источник изображения: github.com/giannisdaras Диффузионные модели — передовые алгоритмы машинного обучения, которые генерируют высококачественные объекты, постепенно добавляя шум в набор данных, а затем обращая этот процесс вспять. Как показали исследования, такие модели способны запоминать образцы из обучающего массива. Эта особенность может иметь неприятные последствия в аспектах конфиденциальности, безопасности и авторских прав. К примеру, если ИИ обучается работе с рентгеновскими снимками, он не должен запоминать изображения конкретных пациентов. Чтобы избежать этих проблем, исследователи из Техасского университета в Остине и Калифорнийского университета в Беркли разработали фреймворк Ambient Diffusion для обучения диффузионных моделей ИИ только на изображениях, которые были повреждены до неузнаваемости — так практически обнуляется вероятность, что ИИ «запомнит» и воспроизведёт оригинальную работу. Чтобы подтвердить свою гипотезу, учёные обучили модель ИИ на 3000 изображений знаменитостей из базы CelebA-HQ. При получении запроса эта модель начинала генерировать изображения, почти идентичные оригинальным. После этого исследователи переобучили модель, использовав 3000 изображений с сильными повреждениями — маскировке подверглись до 90 % пикселей. Тогда она начала генерировать реалистичные человеческие лица, которые сильно отличались от оригинальных. Исходные коды проекта его авторы опубликовали на GitHub. ИИ добрался до буфера обмена Windows 11
22.05.2024 [15:30],
Павел Котов
Microsoft добавила в пакет утилит PowerToys для Windows 11 новую функцию Advanced Paste, которая позволяет «на лету» конвертировать содержимое буфера обмена при помощи искусственного интеллекта. Она призвана упростить пользователям некоторые рабочие процессы. ![]() Источник изображения: Windows / unsplash.com Функция Advanced Paste появилась в версии PowerToys 0.81 — после активации она вызывается сочетанием клавиш Win + Shift + V. При этом появляется контекстное окно, в котором предлагаются параметры форматирования содержимого буфера обмена при вставке: например, это может быть текст без форматирования, текст с разметкой или формат JSON. ![]() Источник изображения: microsoft.com В настройках Advanced Paste есть также опция «Вставка с ИИ» (Paste with AI), которая открывает доступ к ресурсам OpenAI. В этом случае можно также выбрать составление сводки текста, его перевод, генерацию кода, переписывание текста в деловом стиле, «нотацию Йоды» для программистов или отправку иного запроса к ИИ. Правда, для доступа к набору функций ИИ в настройках PowerToys потребуется указать ключ OpenAI API и закупить кредиты для учётной записи в экосистеме OpenAI. ИИ прокрался в «Госуслуги» — Минцифры тестирует разные генеративные нейросети на «Максе»
22.05.2024 [14:45],
Владимир Фетисов
Министерство цифрового развития, связи и массовых коммуникаций РФ проводит тестирование генеративного искусственного интеллекта в цифровом помощнике «Максе» на портале «Госуслуг». Об этом пишет информационное агентство ТАСС со ссылкой на слова замглавы ведомства Олега Качанова. ![]() Источник изображения: geralt/Pixabay «Да, конечно [тестируем]. <…> Генеративные нейросети планируется использовать в роботе "Максе". Это понятное для нас направление, мы уже идём по пути тестирования, отрабатываем разные варианты», — приводит источник слова господина Качанова. При этом замминистра не уточнил, какие именно нейросети стали основой для функций, проходящих тестирование на портале «Госуслуг». Он отметил, что на данный момент ни на каком конкретном варианте для «Макса» Минцифры не остановилось, но текущий этап уже можно назвать тестированием. Господин Качанов также рассказал, что внедрение нейросетей является недешёвым проектом, особенно если учесть, что не все из существующих алгоритмов одинаково полезны. «То есть можно было взять что-то своё [в плане движка], можно взять опенсорс-движки, можно взять некие проприетарные движки. Мы отрабатываем разные варианты, ни на каком конкретном ещё не остановились», — добавил замминистра. Google добавит в рекламу 3D-модели и виртуальную примерку одежды с помощью ИИ
22.05.2024 [14:36],
Владимир Фетисов
Google продолжает добавлять в свою поисковую систему технологии на базе искусственного интеллекта. На этой неделе компания анонсировала появление рекламы в генерируемых ИИ сводках ответов на введённый запрос. В дополнение к этому Google предложила рекламодателям возможность создавать 3D-модели своих товаров, а продавцам одежды — показывать, как тот или иной элемент гардероба смотрится на людях разной комплекции и цвета кожи. Всё это тоже построено на ИИ. ![]() Источник изображений: Pixabay Google планирует облегчить процесс онлайн-шопинга, сделав более наглядным процесс демонстрации одежды в рекламных объявлениях. Рекламодатель сможет получить десятки разных моделей без необходимости делать фотографии с реальными людьми. На начальном этапе эта функция будет доступна продавцам женских и мужских рубашек, другие типы одежды пока не поддерживаются. Новый формат рекламы является логическим продолжением бесплатного инструмента виртуальной примерки одежды, который Google сделала доступным для рекламодателей в прошлом году. Новый алгоритм объединяет изображения товаров продавцов с существующими фотографиями моделей и является одним из первых примеров того, как Google адаптирует собственные генеративные нейросети для своего основного бизнеса, связанного с онлайн-рекламой. Ожидается, что новая генеративная функция сделает для покупателей проще процесс поиска подходящей одежды, поскольку они смогут увидеть, как она сидит на человеке схожей комплекции и цвета кожи. В дополнение к этому рекламодатели смогут генерировать 3D-модели своих товаров из нескольких фото. К примеру, достаточно сделать снимки кроссовок с разных сторон и загрузить их в сервис Google, чтобы получить трёхмерную модель обуви, которую можно добавить в рекламное объявление. Ещё ретейлеры смогут генерировать совершенно новые изображения товаров на основе снимков из прошлых рекламных кампаний. В дальнейшем Google намерена улучшать ИИ-алгоритмы и добавлять новые функции для рекламодателей. Компания пытается упростить процесс создания привлекательных изображений для маркетинговых кампаний без необходимости траты средств и времени на графических дизайнеров, фотографов и моделей. Очевидно, что в будущем количество сгенерированной ИИ рекламы в интернете будет только расти. Провал заменителя смартфона AI Pin вынудил стартап Humane выставить себя на продажу
22.05.2024 [12:52],
Владимир Мироненко
Похоже, заменитель смартфона AI Pin не смог совершить революцию не снискал огромной популярности — разработавший его стартап Humane занялся поисками потенциального покупателя своего бизнеса. Поиски начались вскоре после появления первых обзоров новинки с нелицеприятной критикой её ограниченных возможностей, сообщил Bloomberg со ссылкой на информированные источники. ![]() Источник изображений: humane.com По словам одного из источников, Humane обратилась за помощью к финансовому консультанту. Компания рассматривает возможность продажи бизнеса за сумму в пределах от $750 млн до $1 млрд. Процесс всё ещё находится на ранней стадии, поэтому нет никаких гарантий, что он приведёт к какой-либо сделке. Устройство AI Pin вызвало большой интерес у пользователей, однако после выхода подверглось резкой критике со стороны экспертов и потребителей из-за проблем с его надёжностью и практичностью. Компания сообщила, что работает над устранением таких недостатков, как небольшая продолжительность автономной работы, перегрев устройства, точность ответов и время отклика. В настоящее время Humane привлекла порядка $230 млн от ряда крупных инвесторов, включая генерального директора OpenAI Сэма Альтмана (Sam Altman). В конце прошлого года её стоимость оценивалась в $800 млн. Поиски Humane потенциального покупателя происходит в то время, когда её конкуренты укрепляют позиции на рынке устройств с ИИ. В частности, Meta✴ Platforms совершенствует очки Ray-Ban с искусственным интеллектом, а стартап Rabbit предлагает портативное устройство Rabbit R1, которое управляет приложениями с помощью ИИ вместо пользователя. Но пока ни одна из технологий не нашла широкого применения и не завоевала большой популярности. Microsoft представила платформу Windows Copilot Runtime для разработки Windows-приложений с ИИ
22.05.2024 [12:31],
Павел Котов
Ключевой особенностью представленной Microsoft концепции компьютеров Copilot Plus PC являются новые функции на основе искусственного интеллекта, интегрированные непосредственно в Windows 11. В реальности работу платформы ИИ на Windows 11 обеспечивают более 40 моделей ИИ, доступ к которым разработчикам приложений открывается через специальную среду выполнения — Windows Copilot Runtime, о которой Microsoft подробно рассказала на конференции Build. ![]() Источник изображения: Windows / unsplash.com Среда выполнения Windows Copilot Runtime включает в себя библиотеку API, которые разработчики могут использовать в своих приложениях; а также платформы ИИ и цепочки инструментов для новых моделей на устройствах под Windows. «Библиотека Windows Copilot состоит из готовых к использованию API ИИ, таких как Studio Effects, Live Captions Translations, OCR, Recall with User Activity и Phi Silica, которые будут доступны разработчикам в июне», — пояснил глава подразделения Windows and Surface Паван Давулури (Pavan Davuluri). Разработчики смогут подключать библиотеку Windows Copilot для интеграции в приложения возможностей пакета Studio Effects, включая фильтры и размытие. К примеру, Meta✴ добавила эти функции в клиент WhatsApp — в видеозвонках появятся размытие фона и зрительный контакт. Функциями перевода и Live Captions разработчики смогут пользоваться либо вообще без кода, либо с его минимальным присутствием. ![]() Источник изображения: blogs.windows.com Ранее Microsoft анонсировала функцию Recall, благодаря которой компьютеры Copilot Plus получили возможность сохранять все действия пользователей на компьютере с возможностью последующего поиска. Разработчики смогут подключать свои приложения и к этой функции — пользователи смогут продолжать работу с программой с того места, где они остановились в прошлый раз. В Microsoft считают, что эти функции, для работы которых необходимы ИИ-ускорители Arm-процессоров, а также чипов AMD и Intel, запустят целую волну приложений с ИИ в ближайшее десятилетие. Microsoft Copilot дорос до виртуального сотрудника — ИИ-помощник будет самостоятельно выполнять простые рабочие задачи
22.05.2024 [12:21],
Павел Котов
Вскоре Microsoft предложит предприятиям и разработчикам возможность использовать помощника на базе искусственного интеллекта Copilot в качестве виртуального сотрудника для рутинных рабочих задач. Вместо того, чтобы функционировать только в режиме чат-бота, Copilot станет выполнять мониторинг почтовых ящиков, сможет автоматизировать ряд задач и осуществлять ввод данных — сегодня всё это работникам компаний приходится выполнять вручную. ![]() Источник изображений: microsoft.com «Мы очень быстро поняли, что работа Copilot только в формате общения сегодня крайне ограничивает его возможности. Вместо того, чтобы Copilot ждал, пока с ним кто-нибудь поговорит, что если его могли бы сделать более активным и дали ему возможность работать в фоновом режиме над задачами автоматизации?» — пояснил инициативу ресурсу The Verge корпоративный вице-президент Microsoft по бизнес-приложениям и платформам Чарльз Ламанна (Charles Lamanna). Пока новые возможности Copilot открылись лишь небольшой группе участников программы тестирования, но уже в этом году они появятся в общедоступной предварительной версии Copilot Studio. Компании смогут создавать агентов Copilot, способных брать на себя функции службы техподдержки, адаптации сотрудников и многое другое. Такие агенты будут запускаться при определённых событиях и работать с собственными данными компании. Вот как описывает механизм его работы сама Microsoft: «Представьте, что вы — новый сотрудник. Проактивный Copilot приветствует вас, анализирует информацию из отдела кадров и отвечает на ваши вопросы, знакомит вас с напарником, обучает и определяет сроки, помогает с формами и организует встречи на первую неделю. Теперь кадровики и [другие] сотрудники смогут выполнять свои обычные задачи без хлопот с администрированием». Такие механизмы автоматизации, конечно, вызывают вопросы о потере рабочих мест людьми и опасения по поводу того, как ИИ будет развиваться дальше. Господин Ламанна подчёркивает, что агенты Copilot смогут избавить человека от повторяющихся и однообразных задач, таких как ввод данных, а полностью подменять собой человека они не будут. Другими словами, Microsoft, по собственному утверждению компании, стремится избавить сотрудников от скучных монотонных заданий. С учётом постоянной борьбы между техногигантами за доминирование в сфере ИИ создаётся впечатление, что одной автоматизацией дело не ограничится. Но, отмечает Ламанна, важными составляющими рабочего процесса остаются человеческие мнение и сотрудничество, и автоматизировать можно не всё. Microsoft также сообщила, что оградила Copilot от потенциальных сбоев, таких как галлюцинации ИИ, встроив в Copilot Studio элементы управления. Это значит, что агент ИИ должен действовать в рамках того, что было определено в рамках инструкций и операций, связанных с автоматизацией задач. Упростились и механизмы переноса данных в локальный экземпляр Copilot — с общедоступных веб-сайтов, а также SharePoint, OneDrive и прочих ресурсов. Если в 2023 году основными задачами Copilot были поиск данных и составление сводок пользовательского контента, то в этом году основным направлением деятельности Microsoft в области ИИ становится кастомизация. Прежде Copilot был сосредоточен на индивидуальном взаимодействии с человеком, а сейчас он будет больше работать с группами пользователей. В этом году обновятся возможности Team Copilot для корпоративного мессенджера Microsoft — ИИ сможет управлять повестками дня во время встреч и заметками, модерировать чаты подразделений, помогать ставить задачи и отслеживать сроки в Microsoft Planner. Nvidia втрое ускорила работу ИИ на видеокартах GeForce RTX
22.05.2024 [12:08],
Николай Хижняк
Nvidia сообщила, что дополнительно увеличила ИИ-производительность своих видеокарт GeForce RTX и платформ RTX AI PC с выпуском последнего драйвера версии GeForce Game Ready 555.85 WHQL. В ходе конференции Microsoft Build компания Nvidia анонсировала ряд новых оптимизаций производительности для алгоритмов искусственного интеллекта, которые теперь доступны в рамках экосистемы RTX, включая графические процессоры GeForce RTX, рабочие станции и ПК. ![]() Источник изображений: Nvidia Nvidia отмечает, что последние оптимизации нацелены на ускорение работы ряда больших языковых моделей (LLM) использующихся генеративным ИИ. Новый драйвер Nvidia версии 555 обеспечивает видеокартам GeForce RTX и платформам RTX AI PC трёхкратный прирост ИИ-производительности при работе с фреймворками ONNX Runtime (ORT) и DirectML. Оба инструмента используются для запуска ИИ-моделей в среде операционной системы Windows. Кроме того, новый драйвер увеличил производительность программного интерфейса WebNN для DirectML, который используется веб-разработчиками для размещения новых ИИ-моделей. Nvidia сообщает, что сотрудничает с Microsoft над дальнейшим повышением производительности графических процессоров RTX и добавлением поддержки DirectML в PyTorch. Ниже приведен полный список возможностей, которые предлагаются свежим драйвером Nvidia R555 для графических процессоров GeForce RTX и ПК с RTX:
В тестах производительности ORT, генеративного расширения искусственного интеллекта, выпущенного Microsoft, новый драйвер Nvidia приводит к приросту производительности по всем направлениям, как для типов данных INT4, так и для FP16. Благодаря методам оптимизации, добавленным в это обновление, производительность больших языковых моделей Phi-3, Llama 3, Gemma и Mistral увеличивается до трёх раз. Nvidia также напоминает, что преимущество экосистемы RTX заключается в использовании возможностей воспроизводительных тензорных ядер. На их основе работают DLSS Super Resolution, Nvidia Ace, RTX Remix, Omniverse, Broadcast, RTX Video и другие технологии. Кроме того, для использования тензорных ядер в ускорении работы ИИ компания предлагает комплекты разработчиков TensorRT, Maxine и RTX Video. В своём пресс-релизе Nvidia сообщает, что её GPU обеспечивают ИИ-производительность до 1300 TOPS (триллионов операций в секунду), что гораздо выше возможностей любых других конкурентных решений. Microsoft, OpenAI и другие обязались защитить человечество от мощных ИИ-систем
22.05.2024 [11:49],
Владимир Мироненко
Крупнейшие технологические компании, включая Microsoft, Amazon и OpenAI, во вторник в ходе саммита AI Seoul Summit 2024 заключили международное соглашение о безопасности искусственного интеллекта, взяв на себя добровольное обязательство по обеспечению безопасной разработки своих самых передовых моделей ИИ. ![]() Источник изображения: GDJ/Pixabay В рамках соглашения компании опубликуют концепции безопасности для своих передовых моделей, предусматривающие, в том числе, предотвращение использования технологии злоумышленниками. Эти концепции будут включать «красные линии» для технологических компаний, определяющие риски, связанные с использованием систем ИИ, которые будут считаться «недопустимыми». В их числе автоматизированные кибератаки и угроза создания биологического оружия. Для реагирования на возникновение таких рисков компании планируют внедрить «аварийный выключатель», с помощью которого будет прекращена разработка ИИ-моделей, если нельзя будет гарантировать снижение этих рисков. Согласованный на саммите пакт расширяет перечень обязательств разработчиков ИИ, принятый в ноябре прошлого года, и применяется только к так называемым пограничным моделям. Этот термин относится к технологии, используемой в системах генеративного ИИ, таких как семейство больших языковых моделей OpenAI GPT, лежащих в основе чат-бота ChatGPT. С тех пор как OpenAI представила ChatGPT в ноябре 2022 года, регулирующие органы разных стран и технологические лидеры всё больше выражают беспокойство по поводу рисков, связанных с использованием инновационных систем ИИ. В связи с этим в марте 2024 года Европарламент одобрил первый в мире закон, которым регулируются использование и разработка ИИ. Microsoft представила малую языковую модель Phi-3-Silica для компьютеров Copilot Plus PC
22.05.2024 [10:59],
Владимир Мироненко
Вслед за презентацией компактной ИИ-модели Phi-3-vision, компания Microsoft представила на ежегодной конференции Microsoft Build 2024 ещё одну малую языковую модель (SLM) Phi-3-Silica, которая будет использоваться на компьютерах класса Copilot Plus PC. Эти ПК оснащены чипами со встроенным нейронным сопроцессором (NPU), обеспечивающим локальную работу функций на основе ИИ. ![]() Источник изображения: Pixabay Это самая маленькая из всех моделей семейства Phi-3, обладающая 3,3 млрд параметров. Семейство Phi-3 также включает модель Phi-3-mini с 3,8 млрд параметров, Phi-3-vision (4,2 млрд параметров), Phi-3-small (7 млрд параметров) и Phi-3-medium (14 млрд параметров). Как ожидается, первые ноутбуки под брендом Copilot Plus PC со встроенной Phi-3-Silica поступят в продажу в июне этого года. По данным Microsoft, показатель Time to first token (TTFT) у Phi-3-Silica составляет 650 токенов в секунду, а при работе модель потребляет около 1,5 Вт, освобождая мощности процессора и графического ускорителя ПК для обработки других вычислений. При генерации токенов модель повторно использует кеш-память KV NPU, сама генерация осуществляется на ЦП со скоростью примерно 27 токенов в секунду. «Модели Phi-3 значительно превосходят языковые модели того же и большего размера по ключевым показателям. Phi-3-mini работает лучше, чем модели вдвое большего размера, а Phi-3-small и Phi-3-medium превосходят гораздо более крупные модели, включая GPT-3.5T», — отметила Microsoft. ЕС принял первый в мире закон об искусственном интеллекте
22.05.2024 [10:53],
Анжелла Марина
Европейский союз окончательно согласовал первый в мире закон, регулирующий использование искусственного интеллекта. Документ устанавливает «всеобъемлющие правила» для технологий ИИ и основан на оценке рисков их применения в автономном транспорте, медицинских устройствах, финансовых сервисах и образовании. ![]() Источник изображения: Copilot Закон является новаторским и устанавливает подход к регулированию ИИ. В частности, полностью будет запрещено использование так называемых систем «социального рейтинга», которые ранжируют граждан на основе анализа их данных. Также запрещено прогнозное моделирование для нужд полиции и использование эмоционального распознавания на рабочих местах и в школах, сообщает издание CNBC. Системы ИИ высокого риска, такие как автономные автомобили, медицинские устройства, финансовые и образовательные сервисы, будут оцениваться на предмет угроз здоровью, безопасности и правам граждан. Кроме того, закон вводит жесткие ограничения на так называемые генеративные системы ИИ, к которым относится, например, ChatGPT. Для них устанавливаются требования соблюдения законодательства об авторских правах, раскрытия информации об обучении моделей, регулярного тестирования кибербезопасности. Изменение в законодательстве ЕС произошло после запуска OpenAI ChatGPT в ноябре 2022 года. Тогда чиновники осознали, что существующее законодательство лишено проработанных деталей, которые важны в регулировании использования генеративным искусственным интеллектом материалов, защищенных авторским правом. Полностью закон заработает не раньше чем через 12 месяцев, а уже существующие системы, такие как ChatGPT, Gemini и Copilot, получат переходный период на 36 месяцев для приведения в соответствие новым нормам. «Принятие закона об искусственном интеллекте является важной вехой для Европейского союза», — заявил государственный секретарь Бельгии по вопросам цифровизации Матье Мишель (Mathieu Michel). За нарушение закона компании будут оштрафованы на сумму до 35 млн евро или 7% годовой выручки. Это коснется в первую очередь американских технологических гигантов, таких как Google, Microsoft и OpenAI. «Теперь внимание должно быть обращено на эффективную реализацию и обеспечение соблюдения закона об искусственном интеллекте», — заявила глава глобальной группы потребительских товаров и розничной торговли в ЕС Десислава Савова (Dessislava Savova). Основная цель принятия данного закона заключается в обеспечении доверия, прозрачности и подотчетности при использовании технологий ИИ, не сдерживая при этом инновации. У Windows Recall есть большая проблема помимо конфиденциальности — огромный аппетит к памяти
22.05.2024 [10:51],
Николай Хижняк
Новая функция Recall операционной системы Windows 11, которая в настоящий момент находится в стадии тестирования, вызвала много споров на тему безопасности. Однако у неё есть ещё один серьёзный недостаток. Она будет занимать значительное пространство постоянной памяти компьютера. ![]() Источник изображения: Mark Hachman / IDG Функция Recall станет частью ИИ-помощника Copilot в Windows 11 и предназначена для того, чтобы записывать каждое действие, совершённое с компьютером. Она будет время от времени делать скриншоты того, что отображается на экране компьютера, шифровать данную информацию и хранить её на локальном накопителе ПК. С помощью Recall пользователи смогут возвращаться к нужному моменту временной шкалы (ранее открытому приложению, файлу, видео, странице в браузере и т.д.). Microsoft заверяет, что вся информация, сохраняемая Recall, будет храниться на компьютерах пользователя и не будет отправляться в облако. Функцию можно будет настроить, включив фильтр приложений и веб-сайтов, удалив определённые отрезки времени, чтобы они не сохранялись в Recall, или приостанавливать работу функции в любой момент с помощью значка на панели задач. Формально речь идёт об очень мощном локальном поиске на ПК, который позволит находить любые данные на компьютере, даже если они не были сохранены привычным образом. Для одних пользователей функция Recall может показаться крайне полезной, для других она может оказаться пугающей, ведь теперь компьютер фактически будет следить за каждым шагом пользователя. Однако вопрос безопасности — это лишь часть проблемы. Microsoft сообщила, что Recall будет занимать на накопителе ПК 50 Гбайт пространства. При этом около 25 Гбайт памяти будут активно ею использоваться для хранения информации. Как заявил представитель Microsoft в разговоре с изданием PC Mag, именно это является причиной, почему компания требует для работы функции наличия твердотельного накопителя объёмом не менее 256 Гбайт. Напомним, Recall будет доступна только на компьютерах категории Copilot Plus PC, к которым Microsoft выдвигает определённые технические требования. По словам Microsoft, 25 Гбайт будет хватать для хранения в Recall примерно трёхмесячной истории. При заполнении выделенной памяти старые файлы будут заменяться новыми записями. Предполагается, что объём памяти для хранения данных можно будет увеличить. На данный момент неизвестно, будет ли Recall поддерживать подключение внешних накопителей. На фоне ожидаемого роста цен на некоторые SSD всё это может привести к росту стоимости ПК. Microsoft Edge научился на лету переводить на русский видео с YouTube и других сайтов — есть поддержка и других языков
22.05.2024 [07:37],
Владимир Мироненко
Браузер Microsoft Edge скоро предложит функцию закадрового перевода и дублирования видео в реальном времени на таких сайтах, как YouTube, LinkedIn, Coursera и т.д. В рамках конференции Build, стартовавшей 21 мая в Сиэтле (США), компания Microsoft объявила, что новая функция, работающая на основе искусственного интеллекта, сможет переводить разговорный контент, предоставляя дубляж и субтитры прямо во время просмотра. ![]() Источник изображения: geralt/Pixabay В настоящее время эта функция поддерживает перевод с испанского на английский, а также перевод с английского на немецкий, хинди, итальянский, русский и испанский. Ожидается, что новая функция Edge на базе ИИ также сделает видео более доступными для слабослышащих или страдающих потерей слуха пользователей, предлагая автоматическое создание субтитров. Microsoft сообщила, что Edge также будет поддерживать перевод устного контента в реальном времени на новостных сайтах, таких как Reuters, CNBC и Bloomberg. В дальнейшем компания планирует увеличить количество поддерживаемых сайтов, а также расширить возможности Edge по переводу большего количества языков. Новая функция пополнит набор возможностей Edge на базе ИИ, появившихся у браузера благодаря интеграции с Copilot. В настоящее время Edge поддерживает возможность обобщения содержания видеороликов YouTube, но он пока не обладает способностью генерировать текстовые резюме для каждого видео, поскольку при их создании полагается на транскрипцию видео. Благодаря ИИ процессоры с архитектурой RISC-V займут четверть рынка к 2030 году
22.05.2024 [04:51],
Алексей Разин
Относительно молодую процессорную архитектуру RISC-V благодаря её открытости нередко выбирают в качестве основы для своих разработок молодые компании, поэтому специалисты Omdia ожидают, что она к 2030 году займёт четверть мирового рынка. Её продвижение будет особенно заметно в автомобильном и промышленном сегментах, но сфера искусственного интеллекта тоже проявит активность. ![]() Источник изображения: RISC-V Отсутствие необходимости платить лицензионные отчисления за разработку и последующую реализацию процессоров с архитектурой RISC-V привлекает к ней многих игроков, как и возможность подстроить наборы команд под собственные нужды. Исторически архитектура RISC-V долгое время ассоциировалась с сегментом промышленной автоматизации и Интернета вещей, поскольку первые решения на её основе по сути своей были микроконтроллерами. Тем не менее, одной из наиболее активно растущих сфер применения процессоров с архитектурой RISC-V в период до 2030 года станет сегмент систем искусственного интеллекта. По прогнозам аналитиков Omdia, процессоры с архитектурой RISC-V найдут широкое применение в периферийных вычислениях, связанных с работой систем искусственного интеллекта. В период с 2024 по 2030 годы объёмы поставок процессоров с архитектурой RISC-V будут в среднем увеличиваться на 50 % ежегодно, как считают в Omdia. К концу периода прогнозирования мировые объёмы поставок таких процессоров вырастут до 17 млрд штук. Из этого количества 46 % процессоров будут применяться в сегменте промышленной автоматизации, но автомобильный сегмент продемонстрирует самый активный рост, он составит до 66 % в год. В сегменте ИИ темпы роста популярности процессоров с архитектурой RISC-V тоже будут довольно высокими, но к концу десятилетия их объёмы поставок лишь едва превысят 500 млн штук. Компактная модель Phi-3-vision от Microsoft умеет «читать» изображения
21.05.2024 [22:01],
Владимир Мироненко
Компания Microsoft анонсировала ИИ-модель Phi-3-vision, новую версию своей небольшой языковой модели Phi-3, способную просматривать изображения и рассказывать пользователю о том, что на них изображено. Phi-3-vision является мультимодальной ИИ-моделью, обладающей способностью читать текст и просматривать изображения, предназначенной для использования в первую очередь на мобильных устройствах. ![]() Источник изображения: geralt/Pixabay Как сообщает Microsoft, Phi-3-vision, доступная в виде предварительной версии, представляет собой модель с 4,2 млрд параметров, которая может выполнять общие задачи на визуальное мышление, включая ответы на вопросы о диаграммах или изображениях. Phi-3-vision гораздо меньше других ИИ-моделей, ориентированных на работу с изображениями, таких как DALL-E от OpenAI или Stable Diffusion от Stability AI. В отличие от этих моделей, Phi-3-vision не генерирует изображения, хотя способна понимать, что изображено на картинке, и анализировать изображение по запросу пользователя. Microsoft представила модель Phi-3 в апреле, выпустив Phi-3-mini, самую маленькую модель семейства Phi-3 с 3,8 млрд параметров. Семейство Phi-3 также включает модель Phi-3-small (7 млрд параметров) и Phi-3-medium (14 млрд параметров). Разработчики начали выпуск небольших и лёгких ИИ-моделей, таких как Phi-3, в связи с ростом спроса на использование более экономичных и менее ресурсоёмких сервисов ИИ. Небольшие ИИ-модели не занимают много места в памяти и поэтому их можно использовать на телефонах и ноутбуках. Microsoft выпустила ряд небольших моделей в дополнение к Phi-3 и её предшественнику Phi-2. Её модель Orca-Math, ориентированная на решение математических задач, как сообщается, отвечает на математические вопросы лучше, чем более крупные аналоги, такие как Gemini Pro от Google. ИИ-модели Phi-3-mini, Phi-3-small и Phi-3-medium уже доступны для использования и присутствуют в библиотеке моделей Azure. |
✴ Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»; |