Большие языковые модели (LLM), такие как ChatGPT и Gemini, изначально были разработаны для работы только с текстом. Сегодня они превратились в системы, которые могут работать со многими типами информации одновременно (мультимодальные системы), а также понимать и генерировать изображения, аудио, речь и музыку.
Новости от techxplore
