Китайская компания Baidu представит собственный чат-бот на основе нейросети 16 марта. За неделю до этого сотрудники компании работают не покладая рук, чтобы уложиться в срок, поскольку алгоритм всё ещё с трудом выполняет некоторые основные функции. Об этом пишет The Wall Street Journal со ссылкой на собственные осведомлённые источники.
В сообщении сказано, что над проектом по созданию чат-бота, который получил имя Ernie Bot, круглосуточно работают сотни людей. Другим подразделениям Baidu также было предложено задействовать в этой работе часть своих сотрудников, а также вычислительных мощностей. Это связано с тем, что из-за американских санкций у китайской компании возникли трудности с покупкой производительных процессоров, необходимых для обучения алгоритма.
Несмотря на то, что до запуска Ernie Bot осталось всего несколько дней, ИИ-модель всё ещё находится на стадии обучения. Некоторые сотрудники отметили, что у них не было достаточно времени, чтобы создать хорошо функционирующий продукт. Согласно имеющимся данным, Baidu будет поэтапно открывать доступ к новому продукту. В первую очередь будет запущено публичное тестировании чат-бота с привлечением ограниченного числа пользователей. Ранее Baidu заявляла, что Ernie Bot дебютирует в поисковой системе компании и станет доступен всем желающим в марте этого года.
Спешка Baidu с запуском чат-бота на базе нейросети обусловлена желанием компании обогнать конкурентов на внутреннем китайском рынке, которые занимаются разработкой аналогичных алгоритмов. Ранее компании объявила о подписании соглашения с более чем 400 китайскими предприятиями, которые смогут использовать Ernie Bot в своих продуктах и услугах. За счёт этого чат-бот получит опыт работы в разных сферах, что поможет повысить его производительность. Несмотря на то, что Baidu заручилась поддержкой местных властей, компании необходимо учитывать, что чат-бот должен соответствовать всем действующим в Поднебесной законам и правилам, включая регламенты по сбору и обработке данных, а также строгим правилам государственной интернет-цензуры.
Baidu в течение многих лет инвестировала значительные средства в разработку больших языковых моделей — технологий, лежащих в основе чат-ботов вроде ChatGPT. Китайские разработчики адаптировали англоязычные версии языковых моделей от Google и Open AI для местного рынка. Первая языковая модель Baidu под названием Ernie была выпущена в 2019 году, вскоре после того, как Google представила собственный аналог под названием Bert.
В начале января руководство Baidu поручило соответствующему подразделению компании ускорить разработку аналога ChatGPT. Однако разработчики столкнулись с рядом проблем. Одна из них заключается в том, чтобы заставить языковую модель давать более точные ответы, научив её различать имеющие несколько значений слова и фразы, имена, относящиеся к разным людям, и др. Ещё одна сложность состоит в том, чтобы научить чат-бота отвечать языком, максимально похожим на человеческую речь. Другой существенный вопрос заключается в повышении точности выдаваемых чат-ботов ответов, поскольку генеративные нейросети зачастую строят предложения на основе вероятности появления разных слов вместе, а не на основе достоверной информации. Для решения каждой из этих задач требуется время. Исследователи в сфере ИИ считают, что полноценное обучение столь масштабной языковой модели может занять недели или даже месяцы.
По данным источника, на этой неделе инженеры Baidu спешно работали над улучшением основных функций чат-бота, таких как скорость реакции на запросы и способ обобщения результатов поиска. Отмечается, что последнее время инженеры работают без перерывов, они также были задействованы во время новогодних праздников в конце января. Несмотря на это, им пришлось отказаться от первоначальной идеи по созданию чат-бота, понимающего английский и китайский языки, сосредоточившись на том, чтобы алгоритм качественно обрабатывал запросы на китайском языке.