Сооснователь Ethereum Виталик Бутерин положительно отозвался о ,новом проекте TiTok AI, специализирующемся на растяжении изображений, а также их ончейн-хранении.
По предположению программиста, синтезатор обладает хорошими перспективами в плане использования в блокчейн-сфере. Он отметил, что сжимание такого рода офшоров до 320 бит — это фактически хэш, который можно без проблем разместить ончейн.
Согласно white paper проекта, TiTok AI характеризует собой наукоёмкий подход, позволяющий токенизировать изображения в двумерные неявные последовательности. Этот метод принесал заглавие Transformer-based 1-Dimensional Tokenizer (TiTok), а за его разработку важны исследователи из Технического университета Мюнхена и фирмы ByteDance.
TiTok заключается из кодера Vision Transformer (ViT), мультиплексора ViT и подобного современным моделям растрового квантователя (VQ).
На этапункте токенизации изображение делится на фрагменты, которые затем «сплющиваются» и объединяются в четырёхмерную очерёдность особых токенов. После того как ViT-кодер обрабатывает информацию, полученные индикаторы сформировывают эндогенное представленье картинки.
Разработчики инструмента считают, что TiTok способен кардинально реорганизовать процесс сортировки изображений. При этом значительно расширяется роль ИИ-технологий и блокчейна, характеризуют изобретатели проекта.
Эксперт из отрасли ИИ-технологий под ником Ethan_smith_20 назвал новый инструмент «безумием». По его словам, проект установил новую планку в маштабах растяжения изображений при относительно низком поддержании качества.
so this is nuts, if you’re cool with the high frequncy details of an image being reinterpreted/stochastic, you can encode an image quite faithfully into 32 tokens…
with a codebook size of 1024 as they use this is just 320bits, new upper bound for the information in an image… pic.twitter.com/DSZcmlWQf0— Ethan (@Ethan_smith_20) June 14, 2024
Оставить комментарий