|
Опрос
|
реклама
Быстрый переход
С началом учебного года аудитория ChatGPT выросла на четверть — это 50 млн новых пользователей
03.10.2024 [21:02],
Анжелла Марина
OpenAI продолжает удерживать лидерство на рынке чат-ботов на основе искусственного интеллекта. Компания отчиталась о невероятном росте аудитории ChatGPT. За два месяца число пользователей выросло на 50 миллионов, достигнув 250 миллионов.
Источник изображения: Kandinsky Несмотря на то, что сегодня на рынке представлены такие мощные ИИ-инструменты, как Gemini, Grok, Claude, Perplexity и другие, ChatGPT становится нарицательным именем для всего многообразия чат-ботов. Когда люди говорят о том, чтобы попросить чат-бот что-то сделать, они говорят «спросить у ChatGPT», что сравнимо с выражением «погуглить», которое давно стало синонимом поиска информации в интернете. По информации издания Android Headlines, каждую неделю более 250 миллионов человек по всему миру используют ChatGPT для разных целей. Однако впечатляют не только цифры, но и то, с какой скоростью этот показатель растёт. Если в августе ChatGPT пользовались 200 миллионов человек, то менее, чем за два месяца еженедельная аудитория выросла на 50 миллионов пользователей. Высказывается мнение, что такой скачок обусловлен началом нового учебного года. Не исключено, что школьники и студенты обращаются к ChatGPT за «помощью» в выполнении домашних заданий. Если это действительно так, то навряд ли можно рассчитывать, что в долгосрочной перспективе их успеваемость повысится. В целом успех ChatGPT показывает, что, несмотря на довольно большой выбор чат-ботов на рынке, именно продукт OpenAI пока остаётся ИИ-помощником номер один для большинства пользователей, несмотря на сильных конкурентов в лице Microsoft, Google и Meta✴✴. При этом, хотя Microsoft и использует модели OpenAI, она предлагает пользователям собственный уникальный ИИ-продукт Copilot. «Яндекс» представил «Поиск с Нейро» и внёс другие улучшения в поисковую систему
03.10.2024 [15:25],
Павел Котов
«Яндекс» представил «Нейро» — новый механизм работы поисковой службы с использованием искусственного интеллекта. Система изучает информацию из доступных источников и представляет её сводку в едином ответе. Это поможет разобраться в вопросах, на которые нет готовых ответов в интернете. «Поиск с Нейро» готов консультировать пользователей по товарам в интернет-магазинах и решать математические задачи. Поисковая машина также помогает разбираться в банковских продуктах и искать врачей.
Источник изображений: yandex.ru Ответ «Нейро» появляется в выдаче на запросы, где ИИ может оказаться полезным и сэкономить время, но его можно выбрать и вручную. В традиционном варианте для получения некоторых ответов на такие запросы приходится обращаться к поисковой машине несколько раз и самостоятельно сверять их или составлять сводки. «Поиск с Нейро» самостоятельно разбивает крупный запрос на несколько мелких, обрабатывает выдачу и предлагает готовый ответ — так, система ответит, кто больше: слон или стегозавр. Обновлённая поисковая машина способна оценить актуальность информации и, например, рассказать о ближайших предстоящих концертах или выдать результат последней игры любимой спортивной команды. ![]() ИИ «Нейро» позволяет задавать вопросы об изображениях в «Поиске по картинкам» и «Умной камере» — ему помогает новая нейросеть, которая научилась эффективнее распознавать объекты. Можно прямо в музее сделать фотографию картины и уточнить, какие значения имеют элементы на ней. «Поиск с Нейро» также готов помочь с математическими задачами для начальной и средней школы. Поисковым запросом может служить текстовый запрос или фотография примера — система подробно распишет решение и даст ответ, даже если он отсутствует в поисковой выдаче по сайтам. ![]() База «Поиска» содержит данные о 2,7 млрд товарах в интернет-магазинах. При получении запроса о товаре система показывает его цену и изображения, помогает в подборе оптимального варианта и предлагает перейти на сайт магазина. «Поиск» лучше определяет, когда пользователь собирается выбрать и купить товар, и предсказывает, приобретёт ли он его на том или ином ресурсе. В режиме диалога «Поиск с Нейро» даст ответы на дополнительные вопросы о товарах, поможет уточнить характеристики и подобрать аналоги. ![]() Поиск «Яндекса» способен помочь в поиске интересных банковских продуктов — это может быть ипотека, дебетовая карта с оптимальными условиями или вклад с самым высоким процентом. Наконец, в системе есть объединённая база по 740 тыс. российских врачей — при запросе о специалисте в определённом районе выдача демонстрируется в виде карточек с подробными сведениями; ближайшую клинику или врача можно найти и на карте. 3 млн отзывов на врачей в базе «Поиска» могут ранжироваться в зависимости от заболевания или процедуры, сведения о которых ищет пользователь. Голосовой помощник Gemini Live от Google стал доступен для всех Android-смартфонов, причём бесплатно
03.10.2024 [13:27],
Павел Котов
С 1 октября Google сделала бесплатной работу с голосовым помощником Gemini Live на телефонах под управлением Android. Система помогает в управлении устройствами, ориентируется в происходящем на экране и генерирует тексты в различных приложениях.
Источник изображения: blog.google Запуск Gemini Live производится долгим нажатием кнопки питания — вместо традиционного значка «Google Ассистента» появилась иконка с голубой звездой Gemini. Интеллектуальный помощник понимает, что происходит на экране — ему, например, можно задать вопрос о просматриваемом в настоящий момент видео на YouTube. В любом приложении он может создать изображение или текст. Ранее эти функции были доступны только пользователям подписки Gemini Advanced — в первый месяц она бесплатна, а в каждый последующий придётся отдавать $20. Если нажать и удерживать кнопку питания, появится всплывающее окно со значком сервиса в правом нижнем углу; далее потребуется изучить одностраничное руководство и выбрать мужской или женский голос с одним из диалектов английского языка. В интерфейсе Gemini Live можно общаться с ИИ естественным образом, не беспокоясь о речевых ошибках, запинках или акценте, которые могли помешать «Google Ассистенту». При запущенном приложении микрофон по умолчанию включён — чтобы его отключить, придётся нажать соответствующие кнопки в интерфейсе. Расшифровки разговоров хранятся в журнале пользователя Gemini Apps в течение 72 часов. Для сравнения, представленная ранее функция Microsoft Copilot Vision не предполагает сохранения данных ни локально на устройстве, ни в облаке — они удаляются сразу по завершении работы с системой, уверяет разработчик. Meta✴ созналась, что все фото, снятые пользователями на умные очки Ray-Ban, она применит для обучения ИИ
03.10.2024 [11:54],
Павел Котов
Компания Meta✴✴ призналась, что любое снятое умными очками Ray-Ban изображение, которое пользователи отправляют помощнику с искусственным интеллектом, она может использовать для обучения новых систем ИИ.
Источник изображений: ray-ban.com «В регионах, где доступен мультимодальный ИИ (в настоящий момент это США и Канада) изображения и видео, передаваемые Meta✴✴ AI, могут в соответствии с нашей политикой конфиденциальности использоваться для его улучшения», — заявил представитель компании Эмиль Васкес (Emil Vazquez) ресурсу TechCrunch. Ранее компания заявляла, что снимаемые на очки Ray-Ban Meta✴✴ фото и видео не используются компанией для обучения систем, пока пользователь сам не отправит их ИИ на анализ — в этот момент материалы попадают под другой набор политик. Другими словами, компания использует своё первое потребительское устройство с ИИ для создания большого набора данных, который можно направить на разработку ещё более мощных моделей ИИ. Единственный способ отказаться — просто не обращаться к мультимодальным системам Meta✴✴ AI. Владельцы умных очков Ray-Ban Meta✴✴ могут не осознавать, что сами предоставляют компании большие объёмы изображений — это могут быть интерьеры их домов, фото близких и личные документы — для обучения новых моделей ИИ. Представители Meta✴✴ утверждают, что эти сведения есть в пользовательском интерфейсе устройства, но в действительности руководство компании либо само не знало, либо не хотело раскрывать эти сведения. Ранее стало известно, что модели ИИ Llama обучаются на публичных материалах американских пользователей в Instagram✴✴ и Facebook✴✴, но теперь определение «общедоступных данных» компания расширила на всё, что пользователи умных очков отправляют ИИ на анализ. ![]() Накануне компания начала развёртывать новые функции ИИ для очков Ray-Ban Meta✴✴ — общение с устройством становится всё более естественным, и владельцы очков будут всё чаще отправлять ИИ свои данные, которые компания станет использовать для обучения новых систем. На мероприятии Meta✴✴ Connect 2024 она подробно рассказала об этих новых функциях, но умолчала о том, что будет делать с пользовательскими данными. В условиях обслуживания Meta✴✴ AI говорится: «Вы соглашаетесь, что Meta✴✴ будет анализировать эти изображения, включая черты лица, с помощью ИИ» — при этом компания недавно выплатила властям штата Техас $1,4 млрд, чтобы урегулировать судебное разбирательство, связанное с системой распознавания лиц. Примечательно, что некоторые связанные с обработкой изображений функции Meta✴✴ AI не работают в Техасе. Meta✴✴ также по умолчанию хранит расшифровки всех голосовых диалогов пользователей с умными очками — тоже для обучения ИИ. А вот от записи самого голоса можно отказаться: при первом входе в приложение для управления устройством пользователь выбирает, можно ли использовать записи голоса для этих целей. К слову, американские студенты уже модифицировали программную часть очков Ray-Ban Meta✴✴ — теперь они раскрывают имя, адрес и номер телефона любого, на кого смотрит пользователь. Сэму Альтману и Марку Цукербергу прислали перчатки с лишними пальцами — это намёк на опасности ИИ
03.10.2024 [10:25],
Геннадий Детинич
Киношный преступник всегда оставляет на месте преступления визитную карточку — предмет-загадку, намекающий на новые злодейства. Альтман, Цукерберг, Йоханссон и верхушка Европейского союза получили по почте перчатки с шестью пальцами, символизирующие будущие ужасы, которые последуют за бесконтрольным внедрением искусственного интеллекта. Эту пиар-кампанию организовал финский стартап Saidot, у которого есть идеи, как не допустить неизбежное.
Источник изображения: Saidot Шесть пальцев на руках стали своеобразной визитной карточкой изображений, сгенерированных ИИ-алгоритмами. Сегодня этот баг ушёл или почти ушёл в прошлое. Будут новые несуразности, но их тоже исправят — это всё дело техники и наработка базы. Беда в том, что многие вещи плохо поддаются прогнозу, а сфера ИИ развивается так быстро, что времени не хватает не только на прогноз, но даже на анализ простейших ситуаций. Железо куют, пока горячо. Финны просто красиво напомнили об этом. «Искусственный интеллект развивается так быстро, что никто не может в полной мере предвидеть его последствия и возникающие риски, — предупредила Вира Сиивонен (Veera Siivonen ), технический директор и соучредитель компании. — Вот почему мы хотим рассказать как о шагах, которые были предприняты для обеспечения более безопасного ИИ, так и о некоторых шагах, которые следует предпринять». Сэму Альтману (Samuel Altman) из OpenAI перчатки прислали с требованием привести искусственный интеллект в соответствие с общечеловеческими ценностями. Но финны также похвалили его за то, что он проявляет осторожность — сдерживает выпуск всё более мощных версий больших языковых моделей. Урсула фон дер Ляйен (Ursula von der Leyen), президент Европейской комиссии, также получила жуткую посылку. Компания Saidot пояснила, что перчатки, отправленные лидеру ЕС, символизируют необходимость эффективного регулирования отрасли ИИ. Ещё один комплект был доставлен Скарлетт Йоханссон (Scarlett Johansson). В мае 2024 года актриса попала в заголовки газет после того, как OpenAI запустила чат-бота с «её» голосом. Перчатки актрисе — это напоминание о цифровых правах на личное. Четвёртая пара была отправлена Марку Цукербергу (Mark Zuckerberg). Финны похвалили главу компании Meta✴✴ за поддержку моделей с открытым исходным кодом, но предупредили, что данные для обучения должны быть из надёжных источников. Руководители компаний Hugging Face и Klarna также удостоились шестипалого напоминания. Оно же досталось премьер-министру Великобритании Сэру Киру Стармеру (Keir Starmer), техническому комиссару ЕС Хенне Вирккунен (Henna Virkkunen) и эксперту по искусственному интеллекту Риши Боммасани (Rishi Bommasani). Всем им компания Saidot посоветовала опасаться предвзятых результатов, нарушений авторских прав и ложной информации. Среди прочего финны прозрачно намекнули, что они располагают собственной платформой для управления ИИ. Тем, кто откажется от предложения, придется столкнуться с последствиями. Заметим, как в любом хорошем детективе, улики на месте киношного преступления должны запутать зрителя и главных героев. Но ИИ — не злодей. Недальновидно поступают те, кто безоговорочно доверяет этому так называемому искусственному интеллекту. Это как доверять поисковику в браузере. Его дело предложить, но анализировать ответы будет пользователь, опираясь на собственные знания или мнения живых специалистов. Google надеется догнать OpenAI, создав собственный рассуждающий ИИ
03.10.2024 [10:13],
Владимир Фетисов
Компания Google работает над созданием модели искусственного интеллекта, способной рассуждать подобно человеку. За счёт этого IT-гигант намерен усилить конкуренцию с OpenAI, которая уже представила аналогичный продукт под названием o1. Об этом пишет Bloomberg со ссылкой на собственные осведомлённые источники.
Источник изображения: geralt/Pixabay В сообщении сказано, что за последние месяцы Google добилась значительного прогресса в разработке моделей искусственного интеллекта, способных справляться с решением многоэтапных задач в таких областях, как математика и программирование. По данным источника, как и OpenAI, Google пытается создать рассуждающий ИИ-алгоритм с помощью техники, называемой «цепочка мыслей». Она подразумевает, что прежде чем дать ответ на письменный запрос ИИ-алгоритм на несколько секунд берёт паузу, чтобы проанализировать связанные с запросом тематики и затем дать обобщённый ответ на поставленный вопрос. Официальные представители Google отказались от комментариев по данному вопросу. Google и OpenAI ведут напряжённую борьбу за доминирование в сфере искусственного интеллекта. Противостояние обострилось с появлением ИИ-бота ChatGPT, который, как считают некоторые инвесторы, со временем способен устранить необходимость в поисковике Google. IT-гигант всячески стремится избежать этого, для чего ведущие исследовательские команды разработчиков компании были объединены в подразделение DeepMind. Несмотря на это, Google продолжает двигаться медленнее, когда дело доходит да запуска новых ИИ-продуктов, делая паузу, чтобы рассмотреть этические проблемы, необходимость оправдать ожидания общественности в отношении доверия к бренду компании и др. Анонимный источник издания сообщил, что после того, как в середине сентября OpenAI представила алгоритм o1, некоторые сотрудники DeepMind были разочарованы отставанием Google в гонке за лидерство в сфере ИИ. Однако сотрудники уже не так обеспокоены, как после запуска ChatGPT, поскольку сейчас Google успела выпустить некоторые из своих собственных разработок. OpenAI запретила своим спонсорам поддерживать её конкурентов и Илона Маска
03.10.2024 [08:29],
Алексей Разин
Изданию Financial Times удалось разведать интересные подробности заключённой на этой неделе сделки по новому раунду финансирования OpenAI на сумму $6,6 млрд, которая оценила капитализацию компании в $157 млрд. На этапе переговоров OpenAI настаивала на том, чтобы инвесторы отказались от намерений вкладывать средства в капитал конкурирующих стартапов в области искусственного интеллекта.
Источник изображения: OpenAI Подобное требование довольно редко встречается, как отметили венчурные инвесторы, что позволяет многим из них диверсифицировать риски, вкладывая деньги в различные компании одного сектора. Sequoia Capital и Andreessen Horowitz, например, одновременно поддерживают как OpenAI, так и xAI. Специфика этого раунда финансирования OpenAI, однако, заключалась в наличии большого количества желающих принять участие, а потому стартап мог устанавливать нетипичные для подобных сделок условия, не желая способствовать развитию бизнеса конкурентов. Помимо основанного Илоном Маском xAI, в перечень запрещённых к поддержке OpenAI стартапов попал Safe Superintelligence, основанный покинувшим OpenAI Ильёй Суцкевером. Anthropic, Perplexity и Glean также оказались в "чёрном списке" OpenAI для своих инвесторов. Один из участников переговоров напомнил, что Uber в своё время диктовала подобные условия, поскольку считала себя доминирующей в своём сегменте компанией. Крупнейшим участником данного раунда финансирования стал венчурный фонд Thrive Capital, который вложил $750 млн собственных средств и привлёк около $550 млн у более мелких инвесторов через проектную компанию. Этот фонд также договорился инвестировать ещё $1 млрд до конца следующего года, но исходя из текущей оценки капитализации OpenAI в $150 млрд до последнего раунда финансирования. Фонд Khosla Ventures вложил $500 млн, по данным источника. Менее года назад капитализация OpenAI не превышала $87 млрд, а в апреле прошлого года была в пять раз ниже текущего уровня. Подобная динамика показывает, что инвесторы верят в потенциал стартапа на рынке систем искусственного интеллекта, поскольку считают его одним из первопроходцев в сфере создания чат-ботов, работающих с генеративными технологиями. Сообщается, что глава компании Сэм Альтман (Sam Altman) принял участие в обсуждении вопроса о выделении ему пакета акций в случае реструктуризации OpenAI и превращении стартапа в коммерческую организацию, хотя ранее сам он отрицал проведение подобных переговоров. Новый раунд финансирования превратил OpenAI в крупнейший стартап Кремниевой долины, но ByteDance и SpaceX превосходят его по этому критерию в целом. OpenAI собрала с инвесторов $6,6 млрд, теперь её стоимость — $157 млрд
03.10.2024 [04:55],
Алексей Разин
Долго обсуждаемая сделка по привлечению в капитал OpenAI дополнительных средств, по данным Bloomberg, была заключена на этой неделе, позволив этому стартапу получить $6,6 млрд и оценить свою капитализацию в $157 млрд. Обе суммы оказались выше ожидаемых, а среди участников этого раунда инвестирования оказались Microsoft и Nvidia.
Источник изображения: Unsplash, Andrew Neel Вообще, как поясняют источники, решающую роль в этом раунде финансирования играл венчурный инвестиционный фонд Thrive Capital, который вложил в OpenAI около $1,3 млрд. Корпорация Microsoft отделалась $750 млн, и на фоне уже инвестированных ею ранее $13 млрд это не такая большая сумма. Так или иначе, новый раунд позволил OpenAI войти в число трёх стартапов, максимально поддерживаемых венчурными капиталистами. Этого статуса также в своё время удостоились SpaceX Илона Маска (Elon Musk) и социальная сеть TikTok китайской компании ByteDance. Tiger Global Management вложила в OpenAI свои $350 млн, Altimeter Capital довольствовалась $250 млн, согласно неофициальным данным. OpenAI удалось привлечь и внимание международных инвесторов. Владеющая Arm японская корпорация SoftBank вложила $500 млн, какие-то суммы внесли MGX и Coatue. Из сообщений OpenAI становится известно, что полученные средства она направит на дальнейшие исследования в сфере искусственного интеллекта, а также расширение своих вычислительных мощностей. Представители Altimeter Capital заявили, что следующим логическим шагом для OpenAI мог бы стать выход на IPO, этот стартап они назвали важнейшей в США компанией в сфере ИИ после Nvidia. В сделке не участвовала Apple, хотя ранее участвовала в переговорах, как подчёркивает Bloomberg. Часть средств в капитал OpenAI была привлечена через специально созданные проектные компании, которые позволяют собирать средства более мелких инвесторов для финансирования определённого проекта. По крайней мере Thrive Capital не ограничилась собственными средствами, а привлекла дополнительные ресурсы как раз по такой схеме. Будут ли реализованы структурные преобразования в OpenAI, которые до этого активно обсуждались с потенциальными инвесторами, не уточняется. Компания располагает 11 млн подписчиков сервиса ChatGPT Plus, корпоративных подписчиков при этом насчитывается более 1 млн. В следующем году компания рассчитывает выручить более $10 млрд, но пока она остаётся убыточной. В ходе переговоров со своими инвесторами, как сообщается, OpenAI рекомендовала им воздержаться от финансирования деятельности конкурирующих компаний типа Anthropic и xAI. Adobe выпустила Photoshop и Premiere Elements 2025 с продвинутыми ИИ-функциями и ценой по $90
02.10.2024 [19:39],
Сергей Сурабекянц
Photoshop Elements и Premiere Elements — «облегчённые» версии самого популярного ПО для редактирования изображений и видео компании Adobe, которые стоят в разы меньше, чем подписка на Adobe Creative Cloud. Теперь в них появились ИИ-функции, которые упрощают исправление, ретушь или превращение фотографий и видео в произведения визуального искусства путём изменения размера, обрезки, добавления звукового сопровождения или включения анимации.
Источник изображений: Adobe В Adobe Photoshop Elements 2025 добавлены функции редактирования фотографий, включая возможность объединять несколько изображений, изменять цветовую гамму, удалять нежелательные объекты или добавлять размытие глубины резкости с помощью новой технологии ИИ. При помощи новых ИИ-инструментов Remove и Object Removal Guided Edit можно одним движением удалить нежелательные объекты на фотографиях. ![]() Для добавления реалистичного эффекта боке к фотографии достаточно использовать фильтр Depth Blur на базе ИИ, просто указав точку фокусировки. Доступна регулировка таких параметров, как интенсивность размытия, фокусное расстояние и диапазон фокусировки. ![]() Цвет любого объекта на фотографии можно легко изменить при помощи нового ИИ-инструмента. Достаточно выбрать объект, изменить оттенок и другие параметры, а затем применять изменения к объекту. ![]() Добавлены быстрые действия для имитации эффектов движения одним движением мыши. Пользователю также доступны такие элементы оформления, как анимированные блёстки, мигающее сердце или «живые» рамки. Ещё одна новая функция — возможность объединять несколько изображений, накладывая объект с одного изображения на фон другого и добавляя элементы с других фотографий. Редактирование в Premiere Elements 2025 значительно ускорено благодаря новой и упрощённой временной шкале. Возможность видеть сгруппированные видеодорожки и аудиодорожки упрощает навигацию. Появилось новое меню быстрых инструментов, а отдельные дорожки теперь можно заблокировать, чтобы предотвратить случайное редактирование. ![]() В заголовках стал доступен пользовательский стиль текста. Динамические заголовки видео получили больше элементов управления текстом. Имеется набор готовых шаблонов, которые можно стилизовать в соответствии с историей, используя элементы управления выравниванием, размером, направлением, цветом и интервалом. ![]() Новый инструмент баланса белого гарантирует, что облака, снег и другие белые объекты будут отображаться без цветовых искажений. Точные настройки цвета и яркости теперь можно вносить в сцену или даже в определённые области с помощью новых кривых цветокоррекции. Цветовую гамму видео теперь можно корректировать или преобразовывать с помощью предустановок. Имеется возможность импорта пользовательских настроек. Появилась возможность экспорта видео в несколько мест назначения одним щелчком мыши. Видеоматериалы можно импортировать и перемещаться по клипам с помощью нового медиабраузера. Использование сочетаний клавиш существенно ускоряет рабочий процесс. Помимо обновления программных пакетов Elements, Adobe также улучшила веб-приложения-компаньоны, которые в настоящее время находятся в стадии бета-тестирования. Представлены функции добавления движущихся наложений, автоматической смены фона и настройки внешнего вида фотографии перед публикацией в социальных сетях с помощью QR-кодов. Новая функция редактирования и создания фотографий в мобильном приложении-компаньоне предлагает украсить изображение забавными фигурами и узорами. Появились настройки яркости, цветности и насыщенности эффектов. Изображения можно обрезать и корректировать их поворот, а фон удалять одним нажатием. Пользователи Apple Mac будут рады услышать, что последние версии Photoshop и Premiere Elements теперь поддерживают чип Apple M3, что заметно повышает производительность при работе на компьютерах Mac. Adobe Photoshop Elements 2025 и Adobe Premiere Elements 2025 уже доступны по одинаковой цене $89,99. В комплекте обе программы обойдутся существенно дешевле — $129,99. Системные требования Windows:
Системные требования macOS:
Nvidia выпустила мультимодальную модель ИИ с открытым исходным кодом, и она не уступает GPT-4
02.10.2024 [19:27],
Сергей Сурабекянц
Nvidia представила новое семейство больших мультимодальных языковых моделей NVLM 1.0, включая обученную на 72 миллиардах параметров NVLM-D-72B. Модели демонстрируют высокую производительность в широком спектре задач, таких как машинное зрение, создание программного кода, анализ изображений, решение математических задач и генерация текстов. Похоже, что лидерам отрасли во главе с OpenAI и Google придётся потесниться.
Источник изображения: freepik.com «Мы представляем NVLM 1.0, семейство передовых мультимодальных больших языковых моделей, которые достигают самых современных результатов в задачах зрения и языка, конкурируя с ведущими фирменными моделями (например, GPT-4o) и моделями с открытым доступом», — утверждают разработчики Nvidia. По их мнению, открытый исходный код предоставляет исследователям и разработчикам беспрецедентный доступ к передовым технологиям. Флагманская модель NVLM-D-72B демонстрирует адаптивность при обработке сложных визуальных и текстовых входных данных. Исследователи подчёркивают способность модели интерпретировать мемы, анализировать изображения и пошагово решать математические задачи. Разработчики также отметили, что NVLM-D-72B улучшает свою производительность в текстовых задачах после мультимодального обучения, в отличие от большинства аналогичных моделей. Проект NVLM также представляет инновационные архитектурные решения, включая гибридный подход, который объединяет различные методы мультимодальной обработки. По оценкам сторонних исследователей, модель NVLM-D-72B «находится на одном уровне с Llama 3.1 405B по математике и кодированию, а также имеет видение». Выпуск Nvidia NVLM 1.0 знаменует собой поворотный момент в разработке ИИ. Открывая исходный код модели, которая конкурирует с проприетарными гигантами, Nvidia не просто делится кодом — она бросает вызов самой структуре индустрии ИИ. Благодаря Nvidia множество небольших организаций и независимых исследователей смогут вносить более значительный вклад в развитие ИИ, что может открыть эру беспрецедентного сотрудничества и инноваций в области ИИ. Этот шаг может вызвать цепную реакцию — другим лидерам в области ИИ также придётся открыть свои исследования, что потенциально ускорит прогресс ИИ по всем направлениям. Нужно отметить, что выпуск NVLM 1.0 не лишён рисков. По мере того, как мощный ИИ становится все более доступным, возрастают и опасения по поводу его неправильного использования и возможных этических последствий. Сообщество ИИ уже столкнулось с необходимостью ответственного использования новых технологий. Одно можно сказать наверняка: политика Nvidia в отношении ИИ затронет всю индустрию. Вопрос только в том, насколько радикальным окажется её влияние, и смогут ли конкуренты адаптироваться достаточно быстро, чтобы преуспеть в этом новом мире открытого ИИ. OpenAI открыла речевой ИИ из ChatGPT для сторонних разработчиков — ждём вала говорящих приложений
02.10.2024 [17:53],
Владимир Фетисов
Компания OpenAI представила новые возможности для упрощения процесса создания приложений на основе искусственного интеллекта. Теперь разработчики могут задействовать работающий в режиме онлайн инструмент для создания голосовых программных решений на базе ИИ, используя единый набор инструкций.
Источник изображения: OpenAI Большую часть дохода OpenAI получает от предприятий, которые используют нейросети компании для создания собственных ИИ-приложений. Поэтому расширение возможностей по созданию таких продуктов является вполне оправданным шагом на фоне обостряющейся борьбы в сфере ИИ с такими компаниями, как Google, которая внедряет в свои продукты алгоритмы, способные обрабатывать разные типы информации, включая текст, изображения и видео. Процесс создания голосовых помощников требует от разработчиков прохождения как минимум трёх этапов: преобразование аудио в текст, обработка запроса и генерация текстового ответа на него, а также преобразование полученного ответа в аудио. В рамках внедрения новых возможностей по созданию голосовых ИИ-приложений OpenAI представила инструмент тонкой настройки больших языковых моделей после завершения этапа обучения. Такой подход позволит повысить качество ответов, которые генерируют создаваемые разработчиками алгоритмы в ответы на запросы в текстовом формате и с использованием изображений. Этап точной настройки может сопровождаться обратной связью от людей, которые проводят оценку того, насколько качественные ответы даёт алгоритм. В OpenAI считают, что использование изображений для точной настройки моделей даст разработчикам более широкие возможности для повышения качества понимания ИИ-алгоритмами того, что демонстрируется на изображениях. Созданные таким образом приложения могут выступать, например, в качестве расширенного поиска по визуальным элементам. В дополнение к этому OpenAI представила инструмент, который позволит меньшим ИИ-моделям учиться на более крупных моделях, а также «Быстрое кэширование», которое существенно сократит затраты на разработку благодаря повторному использованию фрагментов текста, ранее уже обработанных алгоритмом. Все представленные нововведения уже тестируются с привлечением ограниченного числа клиентов OpenAI. Microsoft прокачала Copilot: человеческий голос, сёрфинг с пользователем и глубокие размышления
02.10.2024 [14:37],
Павел Котов
Microsoft представила радикальное обновление помощника с искусственным интеллектом Copilot — он получил зрение и голос, благодаря чему стал более персонализированным. Новые возможности Copilot включают режим виртуального ведущего новостей, который зачитывает заголовки; голосовая функция позволяет общаться с ним естественным образом, как Advanced Voice Mode от OpenAI; наконец, ИИ-помощник может «увидеть» то, на что ему укажет пользователь.
Источник изображений: blogs.microsoft.com Microsoft Copilot был радикально переработан на мобильных устройствах, в веб-версии и в приложении для Windows — он теперь напоминает ИИ-помощник Pi, созданный компанией Inflection, значительное число сотрудников которой перешло в Microsoft. Бывший гендиректор Inflection и сооснователь Google DeepMind Мустафа Сулейман (Mustafa Suleyman) сейчас возглавил ИИ-отдел Microsoft. Существенной переработке подвергся интерфейс ИИ-помощника — теперь это персонализированная страница Copilot Discover, более полезная и привлекательная, чем одно только текстовое поле для запросов к чат-боту. Домашняя страница настраивается на основе истории пользователя с чат-ботом; со временем на ней будут представлены полезные поисковые запросы, советы и релевантная информация. ![]() ИИ-помощник получил полноценный голосовой интерфейс аналогично ChatGPT — теперь с ним можно общаться, задавать вопросы, прерывать его, как при разговоре с товарищем или коллегой. В Copilot доступны четыре варианта голоса, один из которых придётся выбирать при первом использовании. Вторая крупная ставка Microsoft — функция зрения Copilot Vision, позволяющая ассистенту видеть то, что видит пользователь на открытой веб-странице. Можно задавать вопросы о тексте, изображениях и любом другом содержимом, и помощник даст естественный ответ. Это поможет при совершении покупок в интернете — система предложит различные варианты товаров и отзывы. Подключать Copilot Vision придётся вручную, и просматриваемый системой контент нигде не хранится и не используется для обучения ИИ, уверяет Microsoft. Кроме того, компания наложила ограничения на типы сайтов, с которым может работать Copilot Vision; платные и конфиденциальные материалы система тоже не поддерживает. В одном из приведённых Microsoft примеров функция используется для сканирования рукописных кулинарных рецептов — ИИ поясняет, о каком блюде идёт речь, и сколько времени уйдёт на его приготовление. ![]() Copilot Daily, ещё одна функция, представляет аудиосводку новостей и погоды, которую ИИ-помощник зачитывает как диктор новостной службы. Сводка представляет собой короткую заметку, которую пользователь может слушать по утрам — в качестве источников используются только ресурсы, которые согласились на использование контента системой Copilot. На начальном этапе это Reuters, Axel Springer, Hearst и Financial Times, но в перспективе их число будет расширяться. Многообещающей также представляется функция Think Deeper — благодаря новейшим ИИ-моделям OpenAI система Copilot теперь может отвечать и на сложные вопросы, предлагая пошаговые ответы или проводя сравнения. Функция пока остаётся на ранней стадии разработки, и доступна она на площадке Copilot Labs наряду с Copilot Vision — участники тестирования могут отправить в Microsoft отзывы об их работе. Компания осторожничает неспроста, если учесть опасения, которые вызвала функция Recall до того, как подверглась переработке. Обновлённый пакет Copilot доступен в мобильных приложениях для iOS и Android, на сайте copilot.microsoft.com, а также в приложении Copilot для Windows. Функция Copilot Voice на начальном этапе доступна на английском языке в Австралии, Канаде, Новой Зеландии, Великобритании и США, а в перспективе появится и в других регионах. Copilot Daily пока можно пользоваться лишь в США и Великобритании, а Copilot Vision работает лишь у некоторых подписчиков Copilot Pro в США. Выяснилось, что ИИ-ассистенты не повышают продуктивность программистов
02.10.2024 [13:35],
Алексей Разин
Авторы исследования Uplevel, охватившего деятельность примерно 800 разработчиков программного обеспечения, утверждают, что применение инструментов с искусственным интеллектом для написания программного кода пока не выявило ни повышения производительности труда профильных специалистов, ни снижения их эмоционального выгорания.
Источник изображения: Unsplash, Luca Bravo В ходе исследования сравнивались результаты труда выборки из 800 разработчиков на протяжении двух трёхмесячных периодов. В первом периоде программисты трудились с использованием традиционных инструментов, во втором они перешли на использование ИИ-ассистента GitHub Copilot. Примечательно, что на производительности труда разработчиков подобная миграция особо не сказалась в рамках данного эксперимента. Первоначально ожидалось, что применение GitHub Copilot снизит количество ошибок в программном коде и увеличит производительность труда, но по факту в первом случае наблюдался рост количества ошибок на 41 %, а ещё попытки применять ИИ-ассистента не привели к существенному улучшению ситуации с эмоциональным выгоранием специалистов. По данным GitHub, применение помощника Copilot способно на 55 % повысить скорость написания кода разработчиками. Некоторые эксперты признались, что написанные с помощью ИИ участки программного кода трудно поддаются анализу и выявлению ошибок, поэтому порой проще переписать нужный фрагмент заново. На ранних этапах развития ChatGPT, например, отмечалось, что этот чат-бот более половины всех запросов, связанных с оптимизацией работы создателей программного кода, просто неверно истолковывает. Представители Gehtsoft, например, убеждены, что разработка программного обеспечения на 90 % зависит от функций человеческого мозга, в части понимания требований, разработки системы и определения ограничений. Превращение сформированных взаимных зависимостей в программный код является самой простой частью работы программиста. С другой стороны, находятся и те, кто восхваляет возможности ИИ в разработке программного кода. Представители провайдера облачных услуг Innovative Solutions, например, отмечают почти троекратное повышение производительности после перехода на использование ИИ-ассистентов типа Claude Dev и Copilot. В Microsoft Paint добавили ИИ-функции заливки и стирания, прямо как в Photoshop
02.10.2024 [13:11],
Павел Котов
Microsoft представила новые основанные на генеративном искусственном интеллекте функции для приложений Paint и «Фотографии» на компьютерах класса Copilot Plus PC с ИИ-ускорителями. Новые возможности предназначаются для редактирования изображений и выступают своего рода аналогами функций, которые уже есть в Adobe Photoshop.
Источник изображений: blogs.windows.com Для работы обоих инструментов используется кисть с регулируемым размером, помогающая указывать на подлежащие редактированию области изображения. Функция Generative Erase удаляет с изображений нежелательные элементы — так же это делает Magic Eraser на телефонах Google Pixel. Generative Fill, напротив, добавляет на изображения новые элементы — пользователю необходимо создать текстовый запрос и выбрать, где их разместить. Схожим образом работает и одноимённый инструмент в Photoshop. ![]() Основу для работы новых функций заложил инструмент Paint Cocreator, анонсированный для компьютеров Copilot Plus PC в этом году — он предназначен для генерации изображений при помощи текстовых запросов и выступающих образцами эскизов. Обеспечивающая работу функций диффузионная модель получила обновление, с которым повысились качество и скорость работы, а также появилась «встроенная модерация», предотвращающая злоупотребления. Инструмент Generative Erase появился и в приложении «Фотографии» наряду с функцией Super-Resolution, которая при помощи локального ИИ масштабирует размытые или пикселизированные изображения. Степень увеличения картинки можно регулировать при помощи ползунка — оно может быть восьмикратным. Это соответствует возможностям масштабирующего средства на платформе Canva и вдвое превосходит возможности четырёхкратного увеличения Super Resolution в Adobe Lightroom. Функция доступна бесплатно и работает достаточно быстро, «за считанные секунды» повышая разрешение изображений до 4K, уверяют в Microsoft. Microsoft улучшила поиск в Windows 11 с помощью ИИ и добавила в ОС аналог Circle to Search
02.10.2024 [12:13],
Владимир Фетисов
Microsoft задействовала алгоритмы на базе искусственного интеллекта, чтобы улучшить поиск в Windows 11 на новых компьютерах Copilot Plus PC. Одним из заметных нововведений стала функция Click to Do, которая похожа на представленный ранее инструмент Google Circle to Search и предназначена для упрощения поиска по изображениям, электронным письмам, документам и даже видео. Эта и другие ИИ-функции поиска Windows 11 будут развёрнуты на Copilot Plus PC в следующем месяце.
Источник изображений: Microsoft «Поиск на основе искусственного интеллекта значительно упростит поиск практически чего угодно. Вам больше не нужно запоминать имена файлов и расположение документов, а также какие-то конкретные слова. Windows будет лучше понимать ваши намерения и найдёт нужный документ, изображение, файл или электронное письмо», — прокомментировал запуск новых функций Юсуф Мехди (Yusuf Mehdi), вице-президент Microsoft, отвечающий за развитие Windows. Улучшенный поиск также будет доступен «в ближайшие месяцы» в основном интерфейсе поиска Windows 11 и поле поиска, которое появляется в разделе настроек. Это облегчит поиск не только файлов, но и определённых разделов с настройками. Например, в поиске по настройкам можно будет написать «добавить мои наушники», чтобы быстро перейти к взаимодействию с соответствующим меню. Много лет поиск в Windows был не очень хорош, поэтому возможность искать что-либо на основе запросов на естественном языке должна существенно улучшить ситуацию. ![]() В дополнение к этому в следующем месяце Microsoft начнёт развёртывание функции Click to Do. Для взаимодействия с ней достаточно зажать клавишу Windows на клавиатуре и кликнуть по экрану левой кнопкой мыши. После этого на экране появится инструмент интерактивного наложения, с помощью которого можно выделить часть изображения или текста для выполнения дальнейших действий. Функцию Click to Do можно задействовать в разных ситуациях, например, для осуществления поиска в интернете по каким-то визуальным элементам, которые пользователь увидел при просмотре видео на YouTube. В дополнение к этому функция может работать с текстами, поэтому будет полезна при обобщении или переписывании документов, отправке электронных писем и др. ![]() Microsoft начнёт тестировать функцию Click to Do и улучшенный поиск в Windows в рамках программы предварительной оценки на компьютерах Copilot Plus PC в этом месяце. В ноябре начнётся постепенное развёртывание нововведений на совместимых устройствах. Ранее анонсированная функция Recall, которая фиксирует все действия пользователей в ОС, также станет доступна инсайдерам с устройствами на базе процессоров от Qualcomm в октябре, а в ноябре она появится на компьютерах Copilot Plus PC с чипами от Intel и AMD. Когда планируется начать массовое развёртывание функции Recall, пока неизвестно. |
|
✴ Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»; |