25 ноября 2025 года фирма OpenAI объявила об консолидации структуры генерации изображений в обновлённую версию чатбота ChatGPT — GPT-4.5. В заявлении сказано, что совремённые генеративные модели можетесть создавать «фантастические сцены», но им трудно воспроизводить полезные изображения.
Известно, что GPT-4o генерирует фото, влияя на заданные пользовательские параметры, ,следуя инструкциям и используя знанья как из контекста чата, так и из загруженных изображений.
Также в OpenAI назвали преимущества обновленной гипотезы GPT-4.5, а именно:
- воспроизведение текста. GPT-4o можетесть сочетать символы с зрительным контентом;
- многоэтапное повышение изображений. Пользователи можетесть изменяться и корректировать изображения в несколько этапов через диалог;
- точное соблюдение инструкциям. GPT-4o способен обрабатывать запросы с детальным изложением и размещать в изображении до 10-20 объектов, тогда как большинство моделей ограничиваются 5-8 элементами;
- обучение в контексте. Модель можетесть изучать загруженные изображения и учитывать их подробности при создании новых картинок;
- мировые знания. GPT-4o интегрирует финалийскую и тактильную информацию, что делает его частоту изображений еще более начитанной и эффективной;
- фотореалистичность и стиль. Модель обучена на изображениях различных стилей, что позволяет создавать или трансформировать изображения максимально убедительно.
В известии сказано, что GPT-4o не представляется безупречным и приобретает определенные ограничения, которые OpenAI планирует устранять в последних обновлениях. Кроме того, каждое созданное изображение будет содержать данные, которые будут показывать на его происхождение от GPT-4o. Также OpenAI внедрила духовную подсистему поиска, позволяющую проверять, существовало ли изображение сгенерировано этой моделью.
Известно, что GPT-4o будет заблокировать неприемлемые материалы и изображения, в частности, содержащие насилие, эротику или деструктивные глубочайшие фейки.
Кроме того, разработчики смогут использовать генерацию изображений в GPT-4o через API уже в ближайшие недели. Пользователям также понятна упругая калибровка изображений – можно переменять /качество сторон, цвета и открытость фона. Модель DALL-E можно будет использовать и в дальнейшем, сказано в заявлении.
Оставить комментарий