Новости

Новая модель искусственного интеллекта намеренно искажает тренировочные изображения, чтобы обойти авторские права

Новая модель ИИ намеренно искажает обучающие изображения, чтобы обойти авторские права

Большая проблема с генераторами текста в изображение заключается в их способности копировать оригинальные произведения, использованные для их обучения, тем самым нарушая авторские права художника. Согласно законодательству США, если вы создаете оригинальное произведение и «исправляете» его в материальной форме, вы владеете авторскими правами на него – буквально, правом копировать его. Изображение, защищенное авторским правом, в большинстве случаев нельзя использовать без разрешения создателя.

В мае на материнскую компанию Google, Alphabet, был подан коллективный иск о нарушении авторских прав со стороны группы художников, утверждавших, что она использовала их работы без разрешения для обучения своего генератора изображений на базе искусственного интеллекта Imagen. Stability AI, Midjourney и DeviantArt (все они используют инструмент Stable Diffusion) столкнулись с аналогичными исками.

Чтобы избежать этой проблемы, исследователи из Техасского университета (Юта) в Остине и Калифорнийского университета (Калифорния) в Беркли разработали систему генеративного искусственного интеллекта на основе диффузии, которая обучается только на изображениях, которые были повреждены до неузнаваемости, удаляя вероятность того, что ИИ запомнит и воспроизведет оригинальное произведение.

Диффузионные модели — это усовершенствованные алгоритмы машинного обучения, которые генерируют высококачественные данные путем постепенного добавления шума в набор данных, а затем учатся обращать этот процесс вспять. Недавние исследования показали, что эти модели могут запоминать примеры из своего обучающего набора. Это имеет очевидные последствия для конфиденциальности, безопасности и авторских прав. Вот пример, не связанный с произведениями искусства: ИИ, который должен быть обучен работе с рентгеновскими снимками, но не запоминать изображения конкретных пациентов, что нарушило бы конфиденциальность пациента. Чтобы избежать этого, создатели моделей могут искажать изображения.

Исследователи продемонстрировали с помощью своей среды Ambient Diffusion, что модель диффузии можно обучить генерировать высококачественные изображения только с использованием сильно поврежденных образцов.

Новая модель ИИ намеренно искажает тренировочные изображения, чтобы обойти авторские права

Результаты Ambient Diffusion созданы на основе «чистых» (слева) и поврежденных (справа) обучающих изображений Daras et al. На изображении выше показана разница в выводе изображения при использовании повреждения. Исследователи сначала обучили свою модель 3000 «чистых» изображений из CelebA-HQ, базы данных высококачественных изображений знаменитостей. При появлении запроса он генерировал изображения, почти идентичные оригиналам (левая панель). Затем они переобучили модель, используя 3000 сильно поврежденных изображений, где до 90% отдельных пикселей были замаскированы случайным образом. Хотя модель создавала реалистичные человеческие лица, результаты были гораздо менее похожими (правая панель).

«Эта структура может оказаться полезной и для научных и медицинских приложений», — сказал Адам Кливанс, профессор информатики в Университете. UT Остин и соавтор исследования. «Это справедливо практически для любого исследования, в котором дорого или невозможно получить полный набор неповрежденных данных, от изображений черной дыры до определенных типов МРТ-сканирования».

Как и в случае с существующим преобразованием текста в текст. генераторы изображений, результаты не всегда идеальны. Дело в том, что художники могут быть немного спокойнее, зная, что такая модель, как Ambient Diffusion, не запомнит и не воспроизведет их оригинальные работы. Помешает ли это другим моделям ИИ запомнить свои исходные изображения и воспроизвести их? Нет, но для этого и существуют суды.

Исследователи сделали свой код и модель Ambient Diffusion открытыми, чтобы стимулировать дальнейшие исследования. Оно доступно на GitHub.

Исследование было опубликовано на сайте препринтов arXiv.

Источник

Похожие статьи

Кнопка «Наверх»