Openai объясняет, почему Chatgpt стал слишком сикофантом

RU News — Служба новостей на русском языке

Актуальная информация и анализ событий на русском языке. Широкий спектр тем, включая политику, экономику, культуру, спорт и другие важные области. Новости предлагаются в текстовом и мультимедийном формате, включая видео и аналитические материалы.

Дмитрий Павлов30.04.2025

OpenAI опубликовал посмертные проблемы с недавними проблемами сикофантности с по умолчанию модели ИИ, питающей CHATGPT, GPT-4O-выпуски, которые заставили компанию отменить обновление модели, опубликованной на прошлой неделе.

На выходных, после обновления модели GPT-4O, пользователи в социальных сетях отметили, что CHATGPT начал отвечать чрезмерно проверенным и приятным способом. Это быстро стало мемом. Пользователи опубликовали скриншоты CHATGPT, аплодирующие все виды проблемных, опасных решений и идей.

Согласно Openai, обновление, которое было предназначено для того, чтобы сделать личность по умолчанию «чувствовать себя более интуитивной и эффективной», было слишком много информировано «кратковременными отзывами» и «не в полной мере объяснило, как взаимодействие пользователей с CHATGPT развивается с течением времени».

«В результате GPT -4O искажался на ответы, которые были чрезмерно поддерживающими, но неискренними», — написал Openai в посте в блоге. «Сикофтические взаимодействия могут быть неудобными, тревожными и вызвать расстройство. Мы потерпели неудачу и работаем над тем, чтобы сделать это правильно».

Openai говорит, что внедряет несколько исправлений, включая уточнение своих основных методов обучения моделей и системных подсказок, чтобы явно убрать GPT-4O от Sycophancy. Компания также строит больше охраны безопасности для «повышения честности и прозрачности» (модели) ».

Openai также говорит, что это изучение способов позволить пользователям дать «обратную связь в реальном времени», чтобы «напрямую влиять на их взаимодействие» с CHATGPT и выбирать из нескольких «личностей» CHATGPT.

«(W) E'Re, изучая новые способы включения более широкой демократической обратной связи в поведение CATGPT по умолчанию», — написала компания в своем блоге. «Мы также считаем, что пользователи должны иметь больший контроль над тем, как ведет себя Chatgpt, и, в той степени, в которой он безопасен и осуществится, вносить коррективы, если они не согласны с поведением по умолчанию».

Больше территории не принесет безопасности Израиля

Рекити Мааси-Уайт: Центр продажи и Англии по сравнению с Ману-Туилаги

Основатель DeviantArt выпускает дисплей в 22 000 долларов для цифрового искусства

Трамп и Си провели телефонный звонок в четверг, сообщают китайские государственные СМИ

Лагарде настаивает на том, что она завершит свой срок в ECB — Politico

Рассел Мартин: Первая медиа -конференция главного тренера Рейнджерс — что мы узнали?

Верховный суд со стороны женщины Огайо по делу о дискриминации обратной дискриминации

Anpropic открывает пользовательские модели искусственного интеллекта для клиентов национальной безопасности США

Чтобы освободить Россию от Путина, нам нужно сначала спасти Украину, российская оппозиция рассказывает ЕС — Политико

Бывший чемпион Darts Darts Роб Кросс запретил директору на налогах

Запрет на поездки Трампа подпитывает беспокойство в Южной Африке, хотя его нет в списке

Apple сообщает, что его App Store помог принести 1,3 долл. США в счетах и продажах, большинство без комиссии