OpenAI представила обновлённые возможности генерации изображений в ChatGPT. В основе апдейта лежит модель GPT Image 1.5, которая работает до четырёх раз быстрее предыдущей версии и заметно точнее следует инструкциям пользователя.
В компании позиционируют ChatGPT Images как полноценный инструмент для творчества, ориентированный не только на любителей, но и на профессионалов. Пользователю больше не нужно разбираться в сложных настройках графических редакторов: достаточно описать задачу обычным языком, и система сама выполнит визуальную работу.
Одновременно с обновлением модели в ChatGPT появился отдельный раздел Images, где собраны инструменты для создания и редактирования изображений. В этом хабе доступны готовые фильтры, подборки актуальных стилей и шаблоны, позволяющие генерировать изображения вообще без текстового запроса. Например, можно выбрать оформление в стиле ретро-журнала или «фуд-съёмку» одним кликом.
GPT Image 1.5 лучше справляется с плотным текстом, корректнее отображает группы людей и сохраняет целостность изображения при последовательных правках. Теперь можно менять отдельные элементы картинки, не опасаясь, что нейросеть случайно исказит остальные детали — проблема, с которой часто сталкивались пользователи прошлых версий.
ChatGPT теперь умеет переносить объекты между сценами, смешивать стили, изолировать отдельные элементы и помещать их в новое окружение. При этом система точнее рассчитывает расстояния между объектами и избегает визуальных ошибок.
В OpenAI признают, что инструмент всё ещё не идеален: иногда модель неверно интерпретирует формулировки или слишком буквально понимает запрос. Однако такие случаи, по заявлению компании, стали редкими исключениями.
Источник: TechRadar
