Отима.ру Отима.ру

ИИ от создателей TikTok потеснил GPT-4o в рейтинге генераторов изображений

ИИ от создателей TikTok потеснил GPT-4o в рейтинге генераторов изображений
18:33

Несколько дней назад загадочная модель Mogao неожиданно возглавила рейтинг Artificial Analysis Image Arena. Несколько дней сообщество строило предположения о происхождении таинственной модели. Наконец интрига раскрылась: ведущие генераторы изображений обошла Seedream 3.0 — новейшая разработка китайской компании ByteDance.

The Mogao Reveal: Congratulations to ByteDance Seed on launching Seedream 3.0, the new leading model on the Artificial Analysis Image Leaderboard, beating out GPT-4o, HiDream-I1-Dev, and Recraft V3

Seedream 3.0 is the latest in the Seedream family of bilingual image diffusion… pic.twitter.com/k5WK1x5zJp

— Artificial Analysis (@ArtificialAnlys) April 15, 2025

На момент публикации новости рейтинг изменился и GPT-4o, которая ранее взорвала интернет возможностями создавать изображения в стиле мультфильмов Хаяо Миядзаки, вернула себе первую позицию в общем рейтинге с минимальным отрывом. Тем не менее Seedream 3.0 сохраняет первое место в генерации фотореалистичных снимков и картинок в стиле аниме.

Изображение Изображение Рейтинг в категориях фотореалистичных снимков и картинок в стиле аниме

Seedream 3.0 пока не доступна для тестирования, но согласно техническому описанию, опубликованному на платформе arXiv, модель генерирует изображения с разрешением до 2048×2048 пикселей. Разработчики ByteDance заявляют, что решили проблемы с обработкой сложных запросов и созданием мелкозернистой типографики, характерные для предыдущей версии модели.

[Prompt 3/4] A group of young professionals at a rooftop networking event in a metropolitan city, wearing smart casual attire. They are holding cocktails and engaging in animated discussions with a skyline view in the background. pic.twitter.com/RK8J6UOial

— Artificial Analysis (@ArtificialAnlys) April 15, 2025

«Мы удвоили набор данных, используя парадигму обучения с учетом дефектов и двухосевую совместную структуру выборки данных», — отмечается в техническом описании модели. Среди других инноваций — новая парадигма ускорения, которая позволяет достичь 4-8-кратного ускорения при сохранении качества изображения.

ИзображениеСравнение разных моделей. Изображение: Yu Gao et al., arXiv

Разработчики также отмечают способность Seedream 3.0 корректно отображать сложные типографические элементы, включая китайские иероглифы. Модель пока находится в закрытом бета-тестировании. Записаться на ранний доступ можно на сайте.


Источник: hightech.fm
Нет комментариев. Ваш будет первым!