Розробники з OpenAI додали до своєї найбільш популярної моделі штучного інтелекту ChatGPT змогу аналізувати відеопотоки і реагувати на дії користувачів.
Головні тези:
- ChatGPT від OpenAI тепер зможе аналізувати відеопотоки та реагувати на дії користувачів у режимі реального часу.
- Розгортання візуального розпізнавання ChatGPT стає конкурентним кроком у порівнянні з Google та Meta.
- Нова функція відкриває нові можливості для інтерактивного навчання та творчої допомоги, але нагадує про виклики у розвитку ШІ.
- Google також розвиває власну технологію візуального аналізу відеопотоків через проект Project Astra.
- Оновлення ChatGPT відкриває шлях до більш інтерактивного спілкування з штучним інтелектом, що піднімає його можливості взаємодії з користувачами.
Що відомо про оновлені можливості ChatGPT
Зокрема, ШІ отримав змогу обробляти потокове відео з смартфонів, комп'ютерних камер та екранів пристроїв.
В OpenAI вперше анонсували здатність ChatGPT реагувати на відео під час спілкування з користувачем в травні 2024 року, однак впровадження нової функції зіткнулось із численними труднощами.
Офіційно вона стала доступною лише 12 грудня 2024 року. Наразі доступ до неї отримали лише платні підписники планів ChatGPT Plus, Team і Pro.
Користувачам ChatGPT Enterprise і Edu доведеться почекати до січня 2025 року.
Нова функція була нещодавно продемонстрована в програмі CNN "60 хвилин ". Під час ефіру президент OpenAI Грег Брокман протестував технологію з телеведучим Андерсоном Купером. Купер намалював на дошці анатомічні частини тіла, які ChatGPT успішно розпізнала.
Однак, коли перед ним постала геометрична задача, ChatGPT зробив помилку, продемонструвавши свою схильність до галюцинацій — відоме обмеження моделей штучного інтелекту.
Що відомо про зростаючу конкуренцію між ChatGPT та Google
Розгортання можливостей візуального розпізнавання ChatGPT розглядається як конкурентний крок проти Google і Meta, які працюють над аналогічними функціями для своїх чат-ботів.
Цікаво, що Google оголосив про випуск Project Astra, інструменту ШІ, здатного аналізувати відеопотоки в реальному часі, який наразі доступний для обраної групи довірених тестувальників на Android.
Для OpenAI надати можливість "бачити" своєму інструменту означає значний розвиток інтерактивності ChatGPT, виводячи його за рамки текстового та голосового спілкування в простір, де він може взаємодіяти з користувачами візуально.
Ця функція може відкрити нові можливості для інтерактивного навчання, творчої допомоги та завдань підтримки, хоча помилки, що трапляються в ній, підкреслюють постійні виклики в розвитку ШІ.
Більше по темі
- Категорія
- Технології
- Дата публікації
- Додати до обраного
- Категорія
- Технології
- Дата публікації
- Додати до обраного
- Категорія
- Технології
- Дата публікації
- Додати до обраного