
В связи с критикой по поводу недоумения своих продуктов искусственного интеллекта, особенно в таких областях, как резюме уведомлений, Apple в понедельник подробно описала, как он пытается улучшить свои модели ИИ, анализируя пользовательские данные в частном порядке с помощью синтетических данных.
Используя подход, называемый «дифференциальная конфиденциальность», компания заявила, что сначала будет генерировать синтетические данные, а затем опросить устройства пользователей (при условии, что они решили поделиться аналитикой устройств с Apple) с фрагментами сгенерированных синтетических данных, чтобы сравнить, насколько точны ее модели, и впоследствии улучшили их.
«Синтетические данные создаются для имитации формата и важных свойств пользовательских данных, но не содержат какого -либо фактического контента, сгенерированного пользователем», — написала компания в сообщении в блоге. «Чтобы курировать репрезентативный набор синтетических электронных писем, мы начнем с создания большого набора синтетических сообщений на различные темы (…), мы затем выбираем представление, называемое встраиванием каждого синтетического послания, которое отражает некоторые из ключевых размеров сообщения, как язык, тема и длину».
Компания заявила, что эти встраивания отправляются в небольшое количество пользовательских устройств, которые выбрали аналитику устройств, и затем устройства сравнивают их с образцом электронных писем, чтобы сообщить Apple, что встраивание наиболее точнее.
Компания заявила, что использует этот подход для улучшения своих моделей Genmoji, и в будущем будет использовать синтетические данные для изображений Playground, Image Wand, создания воспоминаний и инструментов написания, а также для визуального интеллекта. Apple заявила, что также опросит пользователей, которые выбирают, чтобы обмениваться аналитикой устройств с синтетическими данными для улучшения резюме электронной почты.