Опрос
|
Быстрый переход
Microsoft выпустила приложение Seeing AI для Android — ИИ поможет пользователям со слабым зрением
05.12.2023 [15:17],
Павел Котов
Microsoft опубликовала в магазине Google Play Android-версию приложения Seeing AI. Приложение распространяется бесплатно, и его цель — помочь людям с ослабленным зрением ориентироваться в окружающем мире посредством камеры на смартфоне и голосового помощника на базе искусственного интеллекта. ![]() Источник изображения: play.google.com Приложение под Android, заявили в Microsoft, обладает тем же набором функций, что и версия под iOS. Учитывая, что Android-устройствами сегодня пользуются более 3 млрд человек, оно способно улучшить качество жизни очень многим. Важнейшим нововведением приложения стала кнопка «Подробнее»: по умолчанию оно предлагает краткое описание того, что находится в поле зрения камеры, но при желании описание может стать развёрнутым. Пользователь может провести пальцем по экрану, и Seeing AI расскажет о местоположении различных объектов. Поддерживается импорт снимков из других приложений. Ещё одна новая функция — возможность задавать вопросы о сканируемых документах. Можно получить детальную информацию о пунктах меню или уточнить цены позиций в чеке по отдельности. Доступны также звуковые инструкции при сканировании печатных материалов. Осматривая объекты внешнего мира, Seeing AI зачитывает все оказавшиеся в кадре надписи; поддерживается сканирование штрих-кодов на продуктах питания и лекарственных препаратах. Приложение идентифицирует людей, выражения их лиц, распознаёт наличные деньги, цвета и уровень яркости. Поддерживается распознавание рукописного ввода на некоторых языках. Microsoft Seeing AI доступно на чешском, датском, нидерландском, английском, финском, французском, немецком, греческом, венгерском, итальянском, японском, корейском, норвежском (букмол), польском, португальском, русском, испанском, шведском и турецком языках. В 2024 году разработчик расширит число поддерживаемых языков до 36. Стартап Stability AI начал поиск покупателя на фоне финансовых трудностей и давления инвесторов
02.12.2023 [07:50],
Дмитрий Федоров
Британский стартап в области ИИ — Stability AI, известный своим генератором изображений Stable Diffusion, ведёт переговоры с потенциальными покупателями бизнеса. Инициатива по продаже возникла на фоне возрастающего давления со стороны инвесторов, в частности Coatue Management, которые выражают обеспокоенность финансовым состоянием компании. ![]() Источник изображения: stability.ai Стартап Stability AI, расположенный в Лондоне и известный своей генеративной ИИ-моделью Stable Diffusion, в последние недели активно ищет покупателя. Это происходит на фоне усиливающегося давления со стороны инвесторов, особенно со стороны Coatue Management, которая требует отставки главы компании, Эмада Мостака (Emad Mostaque). Требование Coatue Management об отставке Мостака последовало спустя год после того, как они помогли привлечь финансирование для Stability AI, оценив стартап в $1 млрд. Stability AI провела предварительные переговоры с несколькими потенциальными покупателями, но источники, близкие к ситуации, предупреждают, что до заключения сделки ещё далеко и процесс может быть остановлен в любой момент. В то же время представитель Stability AI подчеркнул, что компания сосредоточена на разработке новых продуктов в области ИИ, включая модель генерации видео Stable Video Diffusion, и не стремится к продаже. В августе доходы стартапа составили $1,2 млн, тогда как в текущем месяце ожидается их увеличение до $3 млн. Однако ежемесячные расходы компании на оплату счетов и зарплат достигают $8 млн. В октябре прошлого года стартап привлёк инвестиции в размере примерно $50 млн от корпорации Intel, направленные на дальнейшее развитие бизнеса. Отношения между Stability AI и её инвесторами остаются напряжёнными. Генеральный партнёр Coatue Management, Шри Вишванат (Sri Vishwanath), покинул пост директора в результате инвестиций Intel в Stability, так как Coatue Management владеет значительным пакетом акций конкурента Intel — компании AMD. Партнёр из Lightspeed Venture Partners также ушёл с поста наблюдателя в совете директоров стартапа. Intel, в свою очередь, в сентябре назвала Stability AI «якорным клиентом» для своего нового суперкомпьютера, ориентированного на ИИ. Согласно двум источникам, знакомым с условиями сделки, инвестиции Intel были частично обусловлены использованием процессоров Intel в вычислениях Stability AI. Нейросеть Google придумала 2,2 млн новых кристаллов — тысячи из них можно воплотить в лаборатории
29.11.2023 [22:26],
Николай Фрей
Исследователи Google DeepMind объявили, что им с помощью искусственного интеллекта удалось открыть 2,2 млн ранее неизвестных кристаллических материалов, из которых 380 тыс. признаны стабильными. Многие из них могут быть полезны в разных технологических областях: от батарей до сверхпроводников. Учёные с помощью роботизированной лаборатории смогли воспроизвести части этих материалов. Прежде на это ушли бы годы, а сейчас — полмесяца. ![]() Источник изображения: Google Лаборатория A-Lab с помощью роботов оперирует самыми разными ингредиентами, такими как оксид никеля и карбонат лития, предназначена для получения новых и интересных экспериментальных материалов, некоторые из которых могут найти применения в будущих аккумуляторах. Результаты могут быть непредсказуемыми. Даже ученый-человек обычно не создаёт то, что нужно с первого раза. Поэтому иногда роботы производят просто красивый порошок. В других случаях это расплавленное клейкое месиво, или всё испаряется, и ничего не остаётся. «В этот момент человеку придется принимать решение: Что мне теперь делать?», — говорит Гербранд Седер (Gerbrand Ceder), материаловед из Лаборатории Лоренса Беркли (LBL, Laboratory of Lawrence Berkeley) в Калифорнийском университете Беркли. Роботы должны то же самое. Они анализируют то, что получилось, корректируют рецепт и пробуют снова. И ещё раз. И снова. «Утром вы даёте им несколько рецептов, а когда возвращаетесь домой, у вас может получиться новое прекрасное суфле, — отмечает материаловед Кристин Перссон (Kristin Persson), сотрудница Седера в LBL. — А может быть, вы вернётесь в сгоревший беспорядок! Но, по крайней мере, завтра они сделают суфле намного лучше». Недавно ассортимент «блюд», доступных роботам в LBL, вырос в геометрической прогрессии благодаря программе искусственного интеллекта, разработанной Google DeepMind. Алгоритм, получивший название GNoME, был обучен на основе данных из проекта «Материалы» — бесплатной базы данных, содержащей 150 000 известных материалов, которую курирует Перссон. Используя эту информацию, система искусственного интеллекта предложила проекты материалов, содержащие 2,2 миллиона новых кристаллов, из которых 380 000 были признаны стабильными. Они не разлагаются и не взрываются, а значит, наиболее подходят для синтеза в лаборатории, что расширило диапазон известных стабильных материалов почти в 10 раз. В статье, опубликованной сегодня в Nature, авторы пишут, что в этой расширенной базе данных может скрываться следующий инновационный твердотельный электролит, или материал для солнечных батарей, или высокотемпературный сверхпроводник. Поиск иголок в стоге сена начинается с их изготовления, что является ещё одной причиной для быстрой и непрерывной работы. В ходе недавних экспериментов автономная лаборатория Седера в LBL смогла создать 41 теоретический материал с помощью GNoME за 17 дней, что помогло подтвердить дееспособность как модели ИИ, так и роботизированных методов лаборатории. При принятии решения о том, можно ли на самом деле изготовить материал, будь то человеческими руками или руками робота, одним из первых вопросов является вопрос о его стабильности. Как правило, это означает, что совокупность атомов находится в минимально возможном энергетическом состоянии. В противном случае кристалл захочет превратиться во что-то другое. На протяжении тысячелетий люди постоянно пополняли список стабильных материалов, первоначально наблюдая за теми, что встречаются в природе, или открывая их благодаря элементарной химической интуиции или случайности. В последнее время материалы стали разрабатывать с помощью компьютеров. Проблема, по мнению Перссон, заключается в предвзятости: со временем коллективные знания стали отдавать предпочтение определенным знакомым структурам и элементам. Материаловеды называют это «эффектом Эдисона»: знаменитый изобретатель активно использовал метод проб и ошибок при создании нити накаливания. В ходе подбора материала для неё были испытаны тысячи видов углерода, прежде чем учёный пришел к разновидности, полученной из бамбука. Венгерской группе потребовалось ещё десять лет, чтобы придумать использовать вольфрам. «Он был ограничен своими знаниями, — утверждает Перссон. — Он был предвзят, он был предубеждён». Подход DeepMind призван преодолеть эти предубеждения. Команда начала с 69 000 материалов из базы данных, которая является бесплатной и финансируется Министерством энергетики США. Это было хорошее начало, поскольку база данных содержит подробную энергетическую информацию, необходимую для понимания того, почему одни материалы стабильны, а другие — нет. Но этих данных недостаточно, чтобы преодолеть то, что исследователь Google DeepMind Экин Догус Кубук (Ekin Dogus Cubuk) называет «философским противоречием» между машинным обучением и эмпирической наукой. Как и Эдисон, ИИ борется за то, чтобы генерировать действительно новые идеи, выходящие за рамки того, что он видел раньше. «В физике вы никогда не займётесь изучением того, что уже знаете, — говорит он. — Вы почти всегда хотите обобщить то, что вам уже известно, — будь то открытие другого класса материалов для батарей или новой теории сверхпроводимости». GNoME использует подход, называемый активным обучением. Сначала графовая нейронная сеть (GNN) использует базу данных материалов для изучения закономерностей в стабильных структурах и выяснения того, как минимизировать энергию атомных связей в новых структурах. Используя весь диапазон периодической таблицы Менделеева, она выдает тысячи потенциально стабильных кандидатов в материалы. Следующий шаг — их проверка и корректировка с помощью метода квантовой механики, называемого теорией функционала плотности, или DFT. На следующем этапе эти уточнённые результаты снова подключаются к обучающим датасетам, и процесс повторяется. ![]() Источник изображения: Jenny Nuss/Berkeley Lab Исследователи обнаружили, что при многократном повторении этот подход позволяет генерировать более сложные структуры, чем те, которые изначально были в датасете Materials Project, включая некоторые, состоящие из пяти или шести уникальных элементов. (Датасет, использовавшийся для обучения ИИ, в основном ограничивался четырьмя). Эти типы материалов включают так много сложных атомных взаимодействий, что они обычно не поддаются человеческой интуиции. Но DFT — это только теоретическое обоснование. Следующий шаг — это реальное создание чего-либо. Поэтому команда Седера выбрала 58 теоретически возможных кристаллов для создания в лаборатории A-Lab. Учитывая возможности лаборатории и доступные компоненты, выбор был случайным. И поначалу, как и ожидалось, роботы терпели неудачи, а затем система неоднократно корректировала рецепты. После 17 дней экспериментов A-Lab удалось получить 41 стабильный материал, или 71 % от изначально выбранного перечня, причём иногда после опробования десятка различных рецептов. Тейлор Спаркс (Taylor Sparks), материаловед из Университета Юты, не принимавший участия в исследовании, говорит, что видеть, как автоматика работает над синтезом новых типов материалов, многообещающе. Но использование искусственного интеллекта для предложения тысяч новых гипотетических материалов, а затем погоня за ними с помощью автоматики, просто нецелесообразна, добавляет он. GNN широко используются для разработки новых идей для материалов, но обычно исследователи хотят направить свои усилия на создание материалов с полезными свойствами, а не на слепое воспроизведение сотен тысяч таких материалов. «У нас уже есть слишком много вещей, которые мы хотели бы исследовать, но физически не смогли, — говорит он. — Я думаю, проблема в том, приближается ли этот масштабный синтез к количеству предсказанных материалов? Даже близко нет». Лишь часть из 380 000 материалов, описанных в статье Nature, может быть создана на практике. Некоторые из них включают радиоактивные элементы, слишком дорогие или редкие. Некоторые потребуют синтеза в экстремальных условиях, которые невозможно создать в лаборатории, а каким-то нужны составляющие, которые учёным просто неоткуда взять. Это, скорее всего, относится даже к материалам, которые могут стать потенциально полезными при создании фотоэлектрического элемента или батареи следующего поколения. «Мы придумали много классных материалов, – утверждает Перссон. – Их изготовление и тестирование неизменно оказываются узким местом, особенно если речь идет о материале, который ещё никто не делал. Число людей, которым я могу позвонить из своего круга друзей и сказать: «Конечно, давайте я займусь этим для вас», – всего лишь один или два человека». «Действительно, неужели так много?» – с улыбкой спрашивает Седер. Даже если материал может быть создан, предстоит долгий путь превращения базового кристалла в продукт. Перссон приводит в пример электролит внутри литийионного аккумулятора. Предсказания об энергии и структуре кристалла могут быть применены для решения таких задач, как определение того, насколько легко ионы лития могут перемещаться по нему – это ключевой аспект производительности. Но что не так легко предсказать, так это то, вступит ли этот электролит в реакцию с соседними материалами и не разрушит ли он всё устройство? К тому же, как правило, полезность новых материалов становится очевидной только в сочетании с другими материалами или при манипулировании ими с помощью химических добавок. Тем не менее, расширение спектра материалов увеличивает возможности синтеза, а также предоставляет больше данных для будущих программ искусственного интеллекта, говорит Анатоль фон Лилиенфельд (Anatole von Lilienfeld), материаловед из Университета Торонто, который также не принимал участия в исследовании. Кроме того, это помогает материаловедам отвлечься от своих предубеждений и устремиться к неизведанному. «Каждый новый шаг, который вы делаете, – это фантастика, – восхищается он. – Этот шаг может открыть новый класс соединений». Google также заинтересована в изучении возможностей новых материалов, созданных GNoME, говорит Пушмит Кохли (Pushmeet Kohli), вице-президент по исследованиям в Google DeepMind. Он сравнивает GNoME с AlphaFold, программным обеспечением компании, которое поразило структурных биологов своим успехом в предсказании того, как складываются белки. Обе программы решают фундаментальные проблемы, создавая архив новых данных, которые ученые могут изучать и расширять. Далее компания планирует заняться более конкретными проблемами, такими как поиск интересных свойств материалов и использование искусственного интеллекта для ускорения синтеза. Обе эти задачи являются сложными, поскольку для начала обычно имеется гораздо меньше данных, чем для прогнозирования стабильности. Кохли говорит, что компания изучает возможности более непосредственной работы с физическими материалами, будь то привлечение сторонних лабораторий или продолжение академического партнерства. Он также добавил, что компания может создать собственную лабораторию, ссылаясь на Isomorphic Labs, подразделение DeepMind, занимающееся разработкой лекарств и основанное в 2021 году после успеха AlphaFold. Всё может стать сложнее для исследователей, пытающихся применить материалы на практике. Проект «Материалы» популярен как среди академических лабораторий, так и среди корпораций, поскольку он допускает любой тип использования, включая коммерческие предприятия. Кандидаты в материалы, созданные Google DeepMind, выпускаются под отдельной лицензией, которая запрещает коммерческое использование. «Они выпускаются для академических целей, – поясняет Кохли. – Если люди захотят исследовать и изучить возможность коммерческого партнерства, мы будем рассматривать их заявки индивидуально в каждом конкретном случае». Многие ученые, работающие с новыми материалами, отметили, что неясно, какое право голоса будет иметь компания, если тестирование в академической лаборатории приведет к возможному коммерческому использованию материала, созданного GNoME. Идея нового кристалла, не имеющая конкретного применения, как правило, не подлежит патентованию, и отследить её происхождение по базе данных может быть непросто. Кохли также говорит, что, хотя данные и публикуются, в настоящее время нет планов выпускать модель GNoME. Он ссылается на соображения безопасности – по его словам, программное обеспечение теоретически может быть использовано для создания опасных материалов, – а также на неопределенность стратегии Google DeepMind в отношении материалов. «Трудно делать прогнозы относительно того, каким будет коммерческий эффект», – поясняет Кохли. Спаркс ожидает, что его коллеги-ученые будут возмущаться отсутствием кода для GNoME в открытом доступе, как это делали биологи, когда AlphaFold была первоначально опубликована без полной модели. (Позже компания выпустила ее). «Это неприемлемо», – возмущается он. Другие материаловеды, вероятно, захотят воспроизвести полученные результаты и изучить способы улучшения модели или её адаптации к конкретным условиям использования. Но без модели они не смогут сделать ни того, ни другого. Тем временем исследователи Google DeepMind надеются, что сотен тысяч новых материалов будет достаточно, чтобы теоретики и синтезаторы — как люди, так и роботы — не остались без дела. «Любая технология может быть улучшена с помощью лучших материалов. Это узкое место, – поясняет Кубук. – Вот почему мы должны развивать эту область, открывая новые материалы и помогая людям производить их ещё больше». Amazon представила мощные ускорители Trainium2 для обучения больших ИИ-моделей, а также Arm-процессоры Graviton4
28.11.2023 [22:26],
Николай Фрей
Рост спроса на генеративный искусственный интеллект, который зачастую обучается и запускается на специализированных ускорителях на графических процессорах (GPU), во всём мире наблюдается дефицит таких ускорителей. На этом фоне облачные гиганты создают свои чипы. И Amazon сегодня на ежегодной конференции re:Invent продемонстрировала новейшие собственные ускорители для обучения нейросетей — Trainium2. А ещё были представлены серверные процессоры Graviton4. ![]() Источник изображения: Unsplash Первый из двух представленных чипов, AWS Trainium2, способен обеспечить в четыре раза более высокую производительность и в два раза более высокую энергоэффективность по сравнению с первым поколением Trainium, представленным в декабре 2020 года. Trainium2 будет доступен клиентам Amazon Web Services в инстансах EC Trn2 в кластерах из 16-ти чипов. В решении AWS EC2 UltraCluster клиенты смогут получить в своё распоряжении до 100 000 чипов Trainium2 для обучения больших языковых моделей. К сожалению, Amazon не уточнила, когда Trainium2 станут доступны клиентам AWS, предположив лишь, что это произойдёт «где-то в следующем году». По заявлению Amazon, 100 000 чипов Trainium2 обеспечат теоретическую вычислительную мощность в 65 Эфлопс (квинтиллионов операций в секунду), что в пересчёте на одно ядро составляет 650 Тфлопс (триллионов операций). Конечно, это лишь теоретические показатели, и стоит брать во внимание факторы, усложняющие расчёты. Однако, если предположить, что одно ядро Trainium2 сможет обеспечивать реальную производительность около 200 Тфлопс, то это значительно превысит возможности чипов того же Google для обучения моделей ИИ. В Amazon также подчеркнули, что кластер из 100 000 чипов Trainium2 способен обучить большую языковую модель ИИ (LLM – large language model) с 300 миллиардами параметров всего за несколько недель. Раньше на такие задачи уходили месяцы обучения. Отметим, что параметры в парадигме LLM — это элементы модели, полученные на обучающих датасетах и, по сути, определяющие мастерство модели в решении той или иной задачи, к примеру, генерации текста или кода. 300 миллиардов параметров — это примерно в 1,75 раза больше, чем у GPT-3 от OpenAI. «Чипы лежат в основе всех рабочих нагрузок клиентов, что делает их критически важной областью инноваций для AWS, — отметил в пресс-релизе вице-президент AWS по вычислениям и сетям Дэвид Браун (David Brown). — Учитывая всплеск интереса к генеративному ИИ, Trainium2 поможет клиентам обучать их ML-модели быстрее, по более приемлемой цене и с большей энергоэффективностью». ![]() Слева — процессор Graviton4, справа — ускоритель Trainium2. Источник изображения: Amazon Второй чип, анонсированный Amazon сегодня — Arm-процессор Graviton4. Amazon утверждает, что он обеспечивает на 30 % более высокую производительность, на 50 % больше ядер и на 75 % более высокую пропускную способность памяти, чем процессор предыдущего поколения Graviton3 (но не более современный Graviton3E), применяемый в облаке Amazon EC2. Таким образом Graviton4 предложат до 96 ядер (но будут и другие конфигурации) и поддержку до 12 каналов оперативной памяти DDR5-5600. Ещё один апгрейд по сравнению с Graviton3 состоит в том, что все физические аппаратные интерфейсы Graviton4 зашифрованы. По заявлению Amazon, это должно надёжнее защищать рабочие нагрузки клиентов по обучению ИИ и клиентские данные с повышенными требованиями к конфиденциальности. «Graviton4 — это четвёртое поколение процессоров, которое мы выпустили всего за пять лет, и это самый мощный и энергоэффективный чип, когда-либо созданный нами для широкого спектра рабочих нагрузок, — говорится в заявлении Дэвида Брауна. — Затачивая наши чипы на реальные рабочие нагрузки, которые очень важны для клиентов, мы можем предоставить им самую передовую облачную инфраструктуру». Graviton4 будет доступен в массивах Amazon EC2 R8g, которые уже сегодня открыты для пользователей в предварительной версии. Нехудожественные писатели подали в суд на OpenAI и Microsoft за обучение ИИ по их книгам
22.11.2023 [22:34],
Николай Фрей
Писатели подали в суд на компании OpenAI и Microsoft за использование их книг для обучения интеллектуального чат-бота ChatGPT. В иске утверждается, что Microsoft «глубоко вовлечена» в процесс обучения ChatGPT, поэтому она несёт полную ответственность за любые нарушения наряду с OpenAI. ![]() ChatGPT и аналогичные ИИ, использующие в своей основе большие языковые модели (Large Language Model, LLM), «тренируются» на огромных массивах данных. При этом OpenAI загружает значительную часть информации из интернета, а некоторые данные поступают из таких источников, как нехудожественная литература. Поэтому авторы таких книг теперь требуют компенсации в новом судебном процессе. По сообщениям Reuters, автор Джулиан Санктон (Julian Sancton) заявляет, что OpenAI без разрешения скопировала десятки тысяч нехудожественных книг для обучения ChatGPT. Автор возглавляет коллектив, подавший в минувший вторник иск в федеральный суд Манхэттена. В иске заявители отмечают, что «модели ответчиков были откалиброваны (обучены) путём воспроизведения огромного массива материалов, защищённых авторским правом, включая десятки или даже сотни тысяч нон-фикшн книг». Иск подан в очень «удачный» для OpenAI момент, когда компания столкнулась с рядом других юридических и внутренних проблем. На компанию уже поданы другие иски, касающиеся частных данных, использования авторского контента. Кроме того, в минувшие выходные OpenAI столкнулась с кризисом управления, когда совет директоров уволил генерального директора компании Сэма Альтмана (Sam Altman), но затем компания отказалась от этого решения, пообещав под давлением сотрудников набрать новый состав совета директоров. Новый иск отличается от предыдущих заявлений тем, что в нём наряду с OpenAI впервые фигурирует технологический гигант Microsoft, который к тому же является крупным инвестором OpenAI. ИИ-чат-бот в Microsoft Bing, поиск на основе искусственного интеллекта и новая функция Copilot в значительной степени опираются на технологии OpenAI. Фигурально выражаясь, это почти что ChatGPT, но со вкусом Microsoft. Несмотря на то, что OpenAI и Microsoft не комментируют этот последний иск, OpenAI ранее заявляла, что контент, генерируемый ChatGPT, не является «производным произведением» и, следовательно, не нарушает чьих бы то ни было авторских прав. В течение текущего года произошёл буквально взрыв в развитии LLM, и многие вопросы, затрагивающие тему авторских прав, ещё не решены в судах. Вероятно, судебные иски так ни к чему и не приведут или заставят изменить порядок выплат авторам контента, используемого при тренировке LLM. Однако, пока говорить об этом несколько преждевременно. Представлен ИИ-генератор коротких видео Stable Video Diffusion
22.11.2023 [10:52],
Павел Котов
Компания Stability AI представила генеративную модель искусственного интеллекта Stable Video Diffusion, предназначенную для создания видеороликов по текстовому описанию. В её основу легла модель Stable Diffusion, которая генерирует статические изображения на основе текстовых запросов. ![]() Источник изображения: stability.ai Исходный код Stable Video Diffusion разработчик опубликовал на GitHub, а необходимые для локального запуска модели веса доступны для скачивания на платформе Hugging Face. Компания также опубликовала исследовательский материал, в котором подробно изложила информацию о технических возможностях модели. Stable Video Diffusion свободно адаптируется для различных задач, например, её можно настроить для генерации видео по одному изображению в качестве образца. Она станет базовой платформой для целого семейства производных моделей, которые будут выходить позже — компания намеревается выстроить целую экосистему. В обозримом будущем Stability AI предложит возможность генерировать видео по текстовому описанию в веб-интерфейсе — чтобы оказаться в числе первых пользователей сервиса, нужно оформить заявку на включение в список ожидания. Stable Video Diffusion выпущена в виде двух моделей преобразования изображений в видео — они генерируют 14 (SVD) и 25 (SVD-XT) кадров видео с настраиваемой частотой от 3 до 30 кадров в секунду. Сейчас проект находится на ранней стадии, и в своём теперешнем виде модель не предназначается для создания полнофункциональных или коммерческих приложений — пока это исключительно научный проект, о работе которого собираются отзывы. В будущем, конечно, планируется выпуск полной версии Stable Video Diffusion. Microsoft готова принять сотрудников OpenAI с сохранением их уровня зарплат
21.11.2023 [22:19],
Николай Фрей
В минувший понедельник генеральный директор Microsoft Сатья Наделла (Satya Nadella) заявил, что Сэм Альтман (Sam Altman), Грег Брокман (Greg Brockman) и их коллеги из OpenAI присоединятся к Microsoft в составе новой исследовательской группы по искусственному интеллекту (ИИ). После более 700 сотрудников OpenAI подписали письмо к совету директоров компании и пригрозили присоединиться к своему бывшему начальнику в Microsoft, если члены совета не уйдут в отставку. Теперь же в Microsoft заявили, что работники OpenAI в случае перехода в Microsoft, сохранят прежний уровень зарплат. ![]() Во вторник технический директор Microsoft Кевин Скотт (Kevin Scott) предложил выплатить компенсацию сотням сотрудников OpenAI, которые угрожают переходом в Microsoft после внезапного скандального смещения Сэма Альтмана с поста генерального директора. «Моим партнерам из OpenAI: мы видели ваше заявление и ценим ваше желание присоединиться к Сэму Альтману в новой исследовательской лаборатории Microsoft по изучению искусственного интеллекта, – заявил Скотт во вторник в сообщении в социальной сети X (бывший Twitter). – Знайте, что в случае необходимости у вас будет место в Microsoft, с соответствующим уровнем зарплат и подходящее для дальнейшего выполнения нашей общей миссии». Данный комментарий вносит некоторую ясность в вопрос о том, сколько Microsoft готова платить перешедшим сотрудникам и какое их количество она готова принять. Вместе с тем, будущее самой OpenAI по-прежнему не определено, и пока неясно, где в итоге будет работать Альтман. Вчера Сатья Наделла в своем интервью для CNBC: «На данный момент, я думаю, совершенно ясно, что в OpenAI необходимо что-то менять в управлении». В ходе интервью Наделла не стал утверждать, что Альтман и Брокман переходят в Microsoft, показав, что ситуация изменилась по сравнению с заявлениями, сделанными ранее в этот же день. «Мы решили сотрудничать с OpenAI и хотим продолжать это делать, – пояснил Наделла в интервью CNBC. – Очевидно, что это зависит от того, останутся ли люди из OpenAI там или придут в Microsoft. Так что я открыт для обоих вариантов, но одного я не сделаю – не перестану внедрять инновации». Напомним, что совет директоров OpenAI уволил Альтмана в пятницу, мотивировав своё решение тем, что он «не был последовательно откровенен в общении» с советом. После долгих переговоров, в ходе которых рассматривалась возможность восстановления Альтмана в компании, бывший генеральный директор компании Twitch Эммет Шир (Emmett Shear) объявил, что он назначен временным руководителем. В настоящее время в совет директоров OpenAI входят всего четыре человека: Главный научный сотрудник OpenAI Илья Суцкевер (Ilya Sutskever), подписавший письмо с угрозой ухода в Microsoft, Адам Д'Анджело (Adam D’Angelo), Таша МакКоули (Tasha McCauley) и Хелен Тонер (Helen Toner). Они не сообщили о причинах отстранения Альтмана от должности. Humane пришлось исправлять видео о заменителе смартфона AI Pin — на нём ChatGPT опять ответил не то
16.11.2023 [12:41],
Павел Котов
Стартап Humane, анонсировавший на минувшей неделе футуристический коммуникатор AI Pin, был вынужден заменить демонстрационное видео устройства на своём сайте. Гаджет плотно интегрирован с платформой искусственного интеллекта ChatGPT, которая при всех своих широких возможностях иногда выдаёт дезинформацию. Так случилось и на сей раз. ![]() Источник изображений: hu.ma.ne Humane позиционирует AI Pin как заменитель смартфона. Устройство лишено экрана, вместо которого здесь голосовой интерфейс на основе ChatGPT. На демонстрационном видео устройство используется для телефонных звонков, перевода в реальном времени и воспроизведения музыки. Но даже демонстрация показала несовершенство устройства — на официальном видео AI Pin дало два неправильных ответа. Сначала у гаджета поинтересовались, когда произойдёт ближайшее солнечное затмение, и где его лучше наблюдать. Он ответил, что событие произойдёт 8 апреля 2024 года, и это действительно так. Вот только, по версии AI Pin, для наблюдения за ним нужно отправляться в Австралию и Восточный Тимор, хотя в реальности затмение будет видно только в Центральной и Северной Америке. Во втором эпизоде AI Pin показали горстку миндаля и просили, сколько в ней белка. В кадре было около 12 косточек, на которые в реальности приходятся 3 грамма белка, но гаджет отвечает, что в этом количестве 15 граммов белка — столько приходится на полстакана миндаля. Инцидент несколько смутил руководство стартапа, пытающееся продать своё первое устройство, а ошибки списали на «предварительную версию ПО», с которой создавали демонстрационное видео. «В первом случае произошла ошибка, при которой некорректно сообщалось место наблюдения предыдущего (а не предстоящего) затмения. Во втором — мы спрашивали о количестве белка на полстакана миндаля, а не на объём на руке Имрана (Imran)», — рассказал глава подразделения Humane по работе с новыми медиа Сэм Шеффер (Sam Sheffer). К настоящему моменту видео на сайте производителя отредактировано. Произошедшее в очередной раз подтверждает, что ИИ-помощники не всегда надёжны: при ответах они не ссылаются на источники и иногда дезинформируют пользователей. «Наша ИИ-архитектура постоянно развивается, мы регулярно будем выпускать обновления по беспроводной сети, чтобы повысить качество обслуживания клиентов в рамках подписки», — добавил Шеффер. Продажи Humane AI Pin стартуют сегодня: стоимость устройства составляет $699 плюс $24 в месяц за сотовую связь и доступ к ИИ-платформе. Intel инвестировала миллионы долларов в Stability AI — разработчика ИИ-художника Stable Diffusion
10.11.2023 [17:38],
Павел Котов
Ответственная за генератор изображений Stable Diffusion компания Stability AI привлекла немногим менее $50 млн в рамках последнего раунда финансирования, главным инвестором которого оказалась Intel. Раунд закрылся в октябре, сообщает Bloomberg со ссылкой на собственные источники. ![]() Источник изображения: stability.ai Интерес к компании проявили как представители венчурного капитала, так и стратегические инвесторы, сообщил представитель Stability AI. В Intel об инвестициях в стартап говорить отказалось, но в сентябре компания сообщила, что строит суперкомпьютер для системы искусственного интеллекта — он работает на процессорах Xeon и располагает 4000 ИИ-ускорителями Gaudi2, а Stability AI была названа «основным клиентом». Сейчас стартап переживает не самые простые времена. Компания была вынуждена уволить ряд сотрудников на старших должностях, хотя и назвала эту меру нормальной для стартапа. Кроме того, у Stability AI возникли сложности с членами собственного совета директоров — его покинул представитель Coatue Management, которая выступает основным спонсором и владеет долей в компании на $50 млн. Как выяснилось, у Coatue также есть доля в AMD на $50 млн, и причиной конфликта стали инвестиции со стороны конкурирующей Intel. Должность наблюдателя в совете директоров оставил и Гаурав Гупта (Gaurav Gupta) из Lightspeed Venture Partners из-за разногласий с гендиректором Stability AI Эмадом Мостаком (Emad Mostaque). Свой первый раунд финансирования компания провела в октябре прошлого года при оценке в $1 млрд, намереваясь выручить $101 млн, но этой цели тогда достичь не удалось. Сейчас расходы стартапа составляют около $8 млн в месяц — средства уходят на вычислительную технику и зарплату работникам, утверждают источники Bloomberg, а уровень доходов у Stability AI значительно ниже. Но состоянию на октябрь 2022 года годовой доход компании должен был достичь $10 млн, но этот показатель снизился из-за акцента на направление исследований и разработки. В минувшую среду компания заявила, что за год нарастила выручку десятикратно и дополнительно увеличит её за счёт выпуска новых продуктов к концу года. Загадочный заменитель смартфона Humane Ai Pin будет стоить $1000 и получит ИИ-модель GPT — анонс состоится 9 ноября
28.10.2023 [16:51],
Николай Хижняк
Загадочное носимое устройство Ai Pin на базе искусственного интеллекта может получить ценник в $1000 и, возможно, будет требовать дополнительной ежемесячной подписки за услуги сотовой связи, сообщает издание The Information. Напомним, что разработкой данного гаджета занимается стартап Humane, созданный выходцами из Apple. ![]() Источник изображения: TED Разработка устройства ведётся уже несколько лет. Однако первые детали о нём стали известны в апреле этого года, в рамках конференции TED. Тогда соучредитель компании Humane Имран Чаудри (Imran Chaudhri) мельком показал загадочное устройство в нагрудном кармане своей куртки и продемонстрировал его работу. Он ответил на телефонный звонок своей жены и соучредителя компании Бетани Бонджорно (Bethany Bongiorno), для чего не пришлось нажимать никаких кнопок — достаточно было простого «алло». Гаджет перевёл произнесённую своим владельцем фразу на французский язык, озвучив перевод его же голосом. Наконец, устройство показало, что умеет следить за электронной почтой, сообщениями и событиям календаря, правда, изобретатель тогда не уточнил, как именно это работает. Предполагалось, что больше деталей об Ai Pin будет раскрыто 14 октября. Однако дата презентации устройства была перенесена на 9 ноября. Теперь выяснились свежие подробности. ![]() Источник изображения: The Information Судя по всему, это Ai Pin будет представлять собой не кольцо, как можно было предположить исходя из фотографий с апрельской презентации TED. Издание описывает гаджет, как «небольшое устройство без экрана размером с солёный крекер». Гаджет «получит камеру, микрофон и динамик, множество сенсоров, а также лазерный проектор». В начале октября устройство показывали на Неделе моды в Париже. Гаджет предполагается крепить к одежде. Устройство работает на базе мобильного процессора Qualcomm Snapdragon, «который обеспечивает производительность, скорость беспроводного соединения и возможности камеры, а также безопасности, уровня смартфона». Humane планирует стать виртуальным оператором сотовой связи (то есть будет работать на базе инфраструктуры другого оператора связи) для предоставления сотового подключения для Ai Pin. Другой соучредитель компании Бетани Бонджорно (Bethany Bongiorno) описала устройство, как «телефон, контекстуальный компьютер и программная платформа». ![]() Источник изображения: Time По данным The Information, работа ИИ-функций Ai Pin будут обеспечиваться проприетарной большой языковой моделью. Согласно статье издания Time, это будет GPT-модель от компании OpenAI. К слову, крупнейшим инвестором компании Humane является Сэм Альтман (Sam Altman), гендиректор OpenAI. К разработке самого устройства, предположительно, приложил руку Джони Айв (Jony Ive), бывший главный дизайнер продуктов Apple, покинувший её в 2019 году и после этого основавший свою собственную дизайнерскую фирму LoveFrom. В изначальной версии статьи Time утверждалось, что Ai Pin будет использовать GPT-4, однако в отредактированной версии статьи версия языковой модели была убрана. Публикация Time также описывает наличие у устройства индикатора, который включается при активации камеры, микрофона и «сенсоров ввода». Многие детали об Ai Pin, а также о планах самой Humane по-прежнему неизвестны. По мнению источников The Information, у компании грандиозное видение технологий и её цели не ограничиваются одним Ai Pin. «Они предполагают, что Humane надеется добиться полной смены парадигмы в сегменте потребительских вычислений», — пишет издание. Как бы то ни было, больше подробностей об Ai Pin можно будет узнать 9 ноября. NVIDIA из соображений безопасности отменила AI Summit, который должен был пройти в Израиле
08.10.2023 [16:42],
Владимир Фетисов
В конце прошлого месяца компания NVIDIA анонсировала конференцию AI Summit, посвящённую последним наработкам в сфере искусственного интеллекта. Это мероприятие должно было пройти в Тель-Авиве с 15 по 16 октября и предполагало выступление с докладом главы NVIDIA Дженсена Хуанга (Jensen Huang). Однако в свете последних событий на фоне обострения палестино-израильского конфликта NVIDIA приняла решение об отмене этого мероприятия. ![]() Основной причиной отмены AI Summit является стремление NVIDIA уделить приоритетное внимание безопасности и благополучию всех участников мероприятия. На данный момент компания не публиковала никакой информации касательно возможности переноса AI Summit, а также не уточнила, будет ли конференция проведена в онлайн-формате, если так и не удастся организовать очный саммит. «Мы надеемся, что это сообщение застало вас в целости и сохранности. С сожалением сообщаем вам, что в связи со сложившейся в Израиле ситуация мы приняли решение отменить AI Summit, который был запланирован на 15 и 16 октября. Мы от всей души сочувствуем всем, кого затронула эта ситуация. Безопасность и благополучие наших участников — наш главный приоритет, и мы считаем, что это лучший вариант для обеспечения безопасности», — говорится в сообщении NVIDIA. Предполагалось, что двухдневное мероприятие NVIDIA соберёт более 2500 разработчиков и исследователей в сфере искусственного интеллекта. NVIDIA выбрала Израиль для проведения AI Summit из-за того, что в стране сформирована процветающая стартап-экосистема с более 6000 стартапов, многие из которых работают в сфере искусственного интеллекта. NVIDIA проведёт в октябре AI Summit — на нём выступит Дженсен Хуанг
28.09.2023 [18:35],
Николай Хижняк
Компания NVIDIA анонсировала мероприятие AI Summit, посвящённое последним наработкам в области искусственного интеллекта. Саммит пройдёт в Тель-Авиве с 15 по 16 октября. Принять участие в саммите смогут любые компании из активно развивающейся отрасли ИИ. Однако главным событием конференции станет доклад главы NVIDIA Дженсена Хуанга (Jensen Huang), запланированный на 16 октября. ![]() Источник изображений: Intel Запланированное выступление главы NVIDIA не означает, что компания собирается представить какие-то новые продукты в рамках AI Summit 2023. На данный момент вообще не известно, о чём будет докладывать Хуанг менее чем через месяц. Возможно, он просто снова кратко пробежится по последним технологиям генеративного ИИ, нейросетей и ускоренных вычислений, которые NVIDIA представляла в рамках своих предыдущих конференций и мероприятий. Однако сюрпризы не исключены. После доклада Хаунг примет участие в разговоре с Дэвидом Розенталем, ведущим подкаста Acquired. Посетители AI Summit смогут пообщаться с авторитетными отраслевыми экспертами и инженерами NVIDIA, дабы набраться опыта в сфере разработки приложений на базе CUDA. С полным списком запланированных сессий в рамках мероприятия можно ознакомиться на сайте NVIDIA. Представлен ИИ-генератор музыки Stable Audio, который творит по текстовым описаниям
13.09.2023 [22:10],
Сергей Сурабекянц
Stability AI, разработавшая технологию искусственного интеллекта Stable Diffusion для преобразования текста в изображение, объявила о публичном релизе нейросети Stable Audio для генерации коротких аудиоклипов на основе текстовых описаний. Stable Audio базируется на тех же основных методах работы ИИ, которые используются Stable Diffusion при создании изображений. ![]() Источник изображения: Pixabay «Stability AI наиболее известен своей работой с изображениями, но теперь мы запускаем наш первый продукт для создания музыки и аудио, который называется Stable Audio, — рассказал вице-президент по звуку в Stability AI Эд Ньютон-Рекс (Ed Newton-Rex). — Идея очень проста: вы описываете музыку или аудио, которые хотите услышать, в тексте, и наша система генерирует их для вас». Эд не новичок в мире компьютерной музыки: в 2011 году он создал стартап Jukedeck, который в 2019 был куплен TikTok. Однако технология, лежащая в основе Stable Audio, уходит корнями не в Jukedeck, а во внутреннюю исследовательскую студию Stability AI по созданию музыки под названием Harmonai, созданную Заком Эвансом (Zach Evans). Эванс объяснил, что текстовая модель использует технику, известную как предварительная подготовка аудиоконтрастного языка (CLAP). Модель Stable Audio имеет около 1,2 миллиарда параметров, что примерно соответствует исходной версии Stable Diffusion для генерации изображений. Возможность генерировать базовые звуковые дорожки с помощью технологии не является чем-то новым. В прошлом использовался метод так называемой символьной генерации, которая обычно используется при работе с форматом MIDI (цифровой интерфейс музыкальных инструментов). Генеративные возможности ИИ Stable Audio позволяют пользователям создавать новую музыку, выходящую за рамки повторяющихся последовательностей нот, характерных для MIDI и символьной генерации. ![]() Источник изображения: Atomic Heart Stable Audio работает напрямую с необработанными аудиосэмплами для обеспечения более высокого качества вывода. Модель обучалась на более чем 800 000 фрагментах лицензионной музыки из аудиотеки AudioSparks. «Одна из самых сложных задач при создании текстовых моделей — получение аудиоданных, которые не только являются высококачественным звуком, но и имеют соответствующие метаданные» — пояснил Эванс. Одна из распространённых задач, которые пользователи ставят перед моделями генерации изображений — стилизация под конкретного художника. Однако в случае Stable Audio пользователи не смогут обратиться к ИИ с подобным запросом — по мнению создателей Stable Audio, большинство музыкантов скорее захотят проявить больше творчества. Модель Stable Audio будет доступна как бесплатно, так и по тарифному плану Pro за $12 в месяц. Бесплатная версия позволяет создавать 20 треков в месяц продолжительностью до 20 секунд, а версия Pro увеличивает число треков до 500, а время их звучания до 90 секунд. Ещё последняя позволяет коммерческое использование произведений. В рамках запуска Stable Audio Stability AI также выпустит руководство по текстовым подсказкам. Новая статья: Практикум по ИИ-рисованию, часть четвёртая: ComfyUI, или Приручение макаронного монстра
13.09.2023 [00:22],
3DNews Team
Данные берутся из публикации Практикум по ИИ-рисованию, часть четвёртая: ComfyUI, или Приручение макаронного монстра Руководители всех крупнейших технологических компаний встретятся с властями США 13 сентября
29.08.2023 [18:29],
Сергей Сурабекянц
Источники Axios сообщают, что в следующем месяце руководители самых влиятельных технологических компаний США отправятся на Капитолийский холм на первый форум лидера сенатского большинства Чака Шумера (Chuck Schumer). Ожидается, что встреча продлится 2–3 часа и будет посвящена последствиям внедрения ИИ. Форумы AI Insight, организованные Шумером, призваны знакомить законодателей с развивающимися технологиями и закладывать правовые основы для их регулирования. ![]() Источник изображения: Pixabay В закрытой встрече, запланированной на 13 сентября, примут участие множество влиятельных игроков, в том числе Илон Маск (Elon Musk) из X, Марк Цукерберг (Mark Zuckerberg) из Meta✴, Сундар Пичаи (Sundar Pichai) из Google, Сэм Альтман (Sam Altman) из OpenAI, Дженсен Хуанг (Jensen Huang) из NVIDIA, Сатья Наделла (Satya Nadella) из Microsoft, бывший генеральный директор Google Эрик Шмидт (Eric Schmidt), соучредитель Microsoft Билл Гейтс (Bill Gates), группы гражданского общества и представители профсоюзов. В организации форума приняли участие представители обеих крупнейших партий США. Законодатели обеих сторон озабочены последствиями быстрого внедрения новых технологий. Помимо Шумера, форумы проведут сенаторы Мартин Генрих (Martin Heinrich), Тодд Янг (Todd Young) и Майк Раундс (Mike Rounds). Не так давно Сэм Альтман произвёл сильное впечатление на заинтересованных лиц, призвав Конгресс заняться регулированием сектора ИИ. Многие наблюдатели выражают скептицизм по поводу того, что быстро развивающиеся технологические компании действительно готовы иметь дело с правительственными барьерами. Некоторые эксперты считают встречи, подобные форуму AI Insight бессмысленными, так как интересы участников порой диаметрально противоположны, их совместные усилия напоминают героев басни «Лебедь, Рак и Щука», а встречи руководителей конкурирующих компаний лицом к лицу могут послужить основой для сценария следующей части «Рокки Бальбоа» или продолжения «Кулака Ярости». |
✴ Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»; |