Openai объясняет, почему Chatgpt стал слишком сикофантичным

RU News — Служба новостей на русском языке

Актуальная информация и анализ событий на русском языке. Широкий спектр тем, включая политику, экономику, культуру, спорт и другие важные области. Новости предлагаются в текстовом и мультимедийном формате, включая видео и аналитические материалы.

Дмитрий Павлов30.04.2025

OpenAI опубликовал посмертные проблемы с недавними проблемами сикофантности с по умолчанию модели ИИ, питающей CHATGPT, GPT-4O-выпуски, которые заставили компанию отменить обновление модели, опубликованной на прошлой неделе.

На выходных, после обновления модели GPT-4O, пользователи в социальных сетях отметили, что CHATGPT начал отвечать чрезмерно проверенным и приятным способом. Это быстро стало мемом. Пользователи опубликовали скриншоты CHATGPT, аплодирующие все виды проблемных, опасных решений и идей.

В сообщении на X в воскресенье генеральный директор Сэм Альтман признал проблему и сказал, что Openai будет работать над исправлениями «как можно скорее». Два дня спустя Альтман объявил, что обновление GPT-4O откатится, и что Openai работает над «дополнительными исправлениями» для личности модели.

Согласно Openai, обновление, которое было предназначено для того, чтобы сделать личность по умолчанию «чувствовать себя более интуитивной и эффективной», было слишком много информировано «кратковременными отзывами» и «не в полной мере объяснило, как взаимодействие пользователей с CHATGPT развивается с течением времени».

Мы отказались от обновления GPT-4O на прошлой неделе в CHATGPT, потому что оно было чрезмерно лестным и приятным. Теперь у вас есть доступ к более ранней версии с более сбалансированным поведением.

Подробнее о том, что случилось, почему это важно и как мы обращаемся к сикофантности:

— Openai (@openai) 30 апреля 2025 года

«В результате GPT -4O искажался на ответы, которые были чрезмерно поддерживающими, но неискренними», — написал Openai в посте в блоге. «Сикофтические взаимодействия могут быть неудобными, тревожными и вызвать расстройство. Мы потерпели неудачу и работаем над тем, чтобы сделать это правильно».

Openai говорит, что внедряет несколько исправлений, включая уточнение своих основных методов обучения моделей и системных подсказок, чтобы явно убрать GPT-4O от Sycophancy. (Системные подсказки являются первоначальными инструкциями, которые направляют всеобъемлющее поведение и тон модели во взаимодействиях.) Компания также создает больше охраны безопасности для «повышения честности и прозрачности модели)» и продолжает расширять свои оценки, чтобы «помочь выявить проблемы за пределами сикофанности», говорится в нем.

OpenAI также говорит, что он экспериментирует с способами, чтобы пользователи давали пользователям «обратную связь в реальном времени», чтобы «напрямую влиять на их взаимодействие» с CHATGPT и выбирать из нескольких личностей CHATGPT.

«(W) E'Re, изучая новые способы включения более широкой демократической обратной связи в поведение CATGPT по умолчанию», — написала компания в своем блоге. «Мы надеемся, что отзывы помогут нам лучше отразить различные культурные ценности по всему миру и понять, как вы хотели бы развиваться CHATGPT (…), мы также считаем, что пользователи должны иметь больше контроля над тем, как ведет себя CHATGPT, и в той степени, в которой это безопасно и возможно, вносить коррективы, если они не согласны с поведением по умолчанию».

Джейкоб Бетелл и Олли Папа: Люк Райт не дает никаких гарантий на Англии номер три

British Airways владелец IAG готовился к турбулентности в отношении оплаты | Денежные новости

Seatunique Harry Kane Seatunique, чтобы забить с финансированием 10 миллионов фунтов стерлингов | Денежные новости

Бандеслига рыночные ценности: Гарри Кейн значительно падает — Майкл Олиз присоединяется к клубу 100 млн евро

Рекити Мааси-Уайт: Центр продажи и Англии по сравнению с Ману-Туилаги

Основатель DeviantArt выпускает дисплей в 22 000 долларов для цифрового искусства

Трамп и Си провели телефонный звонок в четверг, сообщают китайские государственные СМИ

Франция Euro 2025 Squad: Венди Ренард и Евгений Ле Соммер ушли

Голосовые агенты Тома взлетели в автосалонах — и привлекли финансирование от A16Z

ЕЦБ снова сокращается, когда он направляется в неопределенное будущее — политико

Торговая война: что означает ослабление доллара для Трампа — и Великобритании | Денежные новости

Fife Flyers: новое владение старейшим хоккейным клубом в Великобритании