Нова технологія Nvidia Maxine перетворює відеодзвінок між двома людьми на комунікацію штучних інтелектів. Це дозволяє значно зменшити обсяги використаного трафіку. Однак при цьому користувачі бачитимуть не реального співрозмовника, а вигаданого.
Відеодзвінки сьогодні – це відео, яке записане камерою гаджета. Такий контент, особливо високої роздільної здатності та якості, потребує значної пропускної спроможності. Наприклад, Zoom використовує 0,54-1,62 ГБ трафіку за годину при дзвінку один на один та 0,81-2,4 ГБ на годину при груповому дзвінку. Відеодзвінок у Skype споживає 60-800 МБ за годину.
Технологія Nvidia Maxine пропонує відмовитися від передачі відеопотоку і натомість пересилати лише опис обличчя юзера перед камерою. Для створення такого опису використовуватиметься штучний інтелект. Інший штучний інтелект на комп’ютері отримувача буде «додумувати» зображення за таким описом.
У Nvidia кажуть, що технологія Maxine зменшує кількість споживаного трафіку до 10 разів, якщо порівнювати з наявними технологіями стиснення у відеодзвінках.
Розробники також кажуть, що штучні інтелекти Maxine можуть змінювати обличчя учасників відеорозмов. Наприклад, вони можуть переміщувати обличчя так, щоб співрозмовникам здавалося, ніби людина дивиться точно в камеру.
Технологія також дозволяє замінити реальне обличчя на анімований аватар.
Навіть якщо користувачі не будуть замінювати своє обличчя на анімацію, все одно учасники бесіди бачитимуть не реальні обличчя, а вигадані.
Штучний інтелект може відбудувати якісне фото навіть за кількома пікселями, проте воно лише видаватиметься схожим на реальне. Адже алгоритм по суті «додумує» і домальовує дрібні риси і деталі обличчя, мімічні зморшки, вії тощо.
У здатності нейромереж вигадувати реалістичні обличчя можна легко переконатися, зайшовши на сайт ThisPersonDoesNotExist.com. Кожен раз на ньому відображається дуже якісне фото людського обличчя. Однак цих людей в реальності не існує – фото згенеровані нейромережею.