В преддверии праздников Microsoft заявила, что обновляет модель искусственного интеллекта, лежащую в основе Bing Image Creator, инструмента для редактирования изображений на основе искусственного интеллекта, встроенного в поисковую систему Bing компании. Microsoft пообещала, что новая модель — последняя версия модели OpenAI DALL-E 3 под кодовым названием «PR16» — позволит пользователям создавать изображения «в два раза быстрее, чем раньше» с «более высоким качеством».
Но это не помогло. Жалобы быстро заполонили X и Reddit.
«DALL-E, который мы любили, ушел навсегда», — сказал один из пользователей Reddit. «Сейчас я использую ChatGPT, потому что Bing стал для меня бесполезен», — написал другой.
Реакция была настолько велика, что Microsoft заявила, что восстановит предыдущую модель Bing Image Creator до тех пор, пока не сможет решить проблемы.
верните старую далле 3! Качество изображения на старой модели намного лучше. как эти изображения, например. изображение, созданное новой моделью, отстой 🙁 pic.twitter.com/BjIM8MS4ng
— ze ᡣ𐭩ྀིྀི (@riegrowl) 28 декабря 2024 г.
«Мы смогли (воспроизвести) некоторые из обнаруженных проблем и планируем вернуться к (DALL-E 3) PR13, пока не сможем их исправить», — заявил Хорди Рибас, руководитель отдела поиска Microsoft, в сообщении на X. Во вторник вечером. «К сожалению, процесс развертывания идет очень медленно. Это началось больше недели назад, и потребуется еще 2-3 недели, чтобы достичь 100%».
Так что же пошло не так?
Трудно сравнивать результаты моделей с отдельными отчетами, особенно если подсказки не стандартизированы. Но многие пользователи заявили, что PR16 делает изображения менее реалистичными и «безжизненными». Маянк Пармар, пишущий для Windows Latest, отметил, что изображениям, созданным с помощью PR16, не хватало деталей и полировки, и они выглядели странно мультяшными.
Я не знаю, кого ты думаешь этим шутить. DALL-E объективно хуже, чем когда-либо после этого «обновления», и вас опережают другие компании, такие как Google. Сравнивать качество изображения сейчас и всего пару месяцев назад — это день и ночь. pic.twitter.com/EdSdk7aign
— наружу (@roccynoxy) 19 декабря 2024 г.
Это не первый случай, когда имиджевая модель, предположительно прошедшая внутреннюю проверку, не была хорошо принята публикой. Еще в феврале Google была вынуждена приостановить способность своего искусственного чат-бота Gemini создавать изображения людей после того, как пользователи пожаловались на исторические неточности.
Ошибки показывают, насколько сложно измерить улучшения модели в реальном мире. По словам Рибаса, сравнительный анализ Microsoft показал, что качество PR16 «в среднем немного лучше» по сравнению с предыдущей моделью Bing Image Creator.
Какие бы внутренние показатели ни использовала компания, очевидно, что они не соответствуют предпочтениям большинства людей.