Разработчики из Google научили нейросеть Imagic редактировать фото по текстовому описанию. Результаты работы опубликованы на репозитории препринтов arXiv.

Созданный алгоритм не требует никаких самостоятельных редакторских манипуляций и работает только по текстовому описанию правок. Например, исследователи использовали изображение сидящей собаки. Нейросеть попросили исправить фотографию так, чтобы животное стояло, при этом не затрагивая остальных элементов. Компьютер применяет для этого дифузионный метод, постепенно улучшая кадр на протяжении десятков стадий.

Основное нововведение заключается в работе алгоритма с «прекурсорами». В этом случае текст попадает на генеративную нейросеть не сразу. Сначала он подается на кодировщик, который превращает его в сжатое векторное представление (эмбеддинг), кодирующее идею так, что похожие по смыслу предложения содержат аналогичные эмбеддинги. Нейросеть изменяет не сам кадр, а работает конкретно с текстовыми эмбеддингами.

Ранее сотрудники Университета Калифорнии в Беркли (США) представили четвероногого робота-футбольного вратаря. Устройство способна самостоятельно анализировать траекторию полета и отбивать мяч при его направлении в сторону ворот.

Источник: lenta.ru

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Другие новости

Россиянам дадут доступ к спутниковой связи с обычных смартфонов

Спутниковая связь станет доступна абонентам в России, даже при отсутствии поблизости сотовых…

Россияне заметили на «Госуслугах» новые данные о себе

Объясняем, почему на портале есть информация о вашем фактическом месте проживания, откуда…

У россиян начались проблемы с покупками на AliExpress

Пользователи жалуются на проблемы с покупкой коптеров от популярных компаний DJI и Autel. Новые заказы оформить…

Появился новый способ вернуть «Сбербанк Онлайн» на айфон: подробности

Мобильное приложение можно установить на устройства Apple в отделениях «Сбера». Новая функция работает по всей…