Исследователи из факультета компьютерных наук Университета Бар-Илан и исследовательского центра искусственного интеллекта NVIDIA в Израиле разработали новый метод, который значительно улучшает понимание моделями искусственного интеллекта пространственных инструкций при создании изображений — без переподготовки или модификации самих моделей. Системы генерации изображений часто сталкиваются с трудностями при работе с простыми подсказками, такими как «кошка под столом» или «стул справа от стола», часто неправильно размещая объекты или вообще игнорируя пространственные соотношения. Исследовательская группа Bar-Ilan представила креативное решение, которое позволяет моделям искусственного интеллекта более точно следовать таким инструкциям в режиме реального времени.
Новости от techxplore


