Раніше вже було встановлено, що генератори зображень можна змусити генерувати приклади з даних, захищених авторським правом. Нове дослідження Google показує, що ChatGPT теж схильний до такого.
ChatGPT розкриває особисту інформацію
Команда дослідників Google оприлюднила нове дослідження, яке свідчить, що популярний чат-бот OpenAI зі штучним інтелектом ChatGPT розкриває особисту інформацію реальних людей.
Як зазначає Tech Policy Press, модель машинного навчання, на якій базується ChatGPT і всі звані великі мовні моделі (LLM), була навчена на величезних обсягах даних, зібраних з інтернету. Завдяки цьому вона вправно генерує нові рядки текстів, не повторюючи оригінальні тексти, які вона поглинула.
Однак раніше вже було встановлено, що генератори зображень можна змусити генерувати приклади з даних, захищених авторським правом. Нове дослідження Google показує, що ChatGPT теж схильний до такого.
Команда вчених з Університетів Вашингтона, Корнелла, Карнегі-Меллона, Каліфорнійського університету в Берклі та ETH Zurich вилучила частину навчальних даних і встановила, що деякі з них містять ідентифікаційну інформацію реальних людей: імена, адреси електронної пошти та номери телефонів тощо.
Експеримент ґрунтувався на пошуку ключових слів, які виводили чатбот із ладу й змушували його розголошувати навчальні дані. Так, дослідники попросили ChatGPT повторювати до нескінченності певні слова, зокрема "поема".
Їхня мета полягала в тому, щоб змусити ChatGPT "відхилитися" від свого завдання бути чатботом і "повернутися до початкової мети моделювання мови". Хоча велика частина згенерованого тексту була нісенітницею, але дослідкики Google кажуть, що в деяких випадках ChatGPT відхилявся, щоб скопіювати вихідні інформацію безпосередньо зі своїх навчальних даних.
Атака була здійснена проти версії GPT 3.5 AI, яка безкоштовна для користувачів.
Більше по темі
- Категорія
- Технології
- Дата публікації
- Додати до обраного
- Категорія
- Технології
- Дата публікації
- Додати до обраного
- Категорія
- Технології
- Дата публікації
- Додати до обраного