Нейронки. 24.11.24

Нейронки. 24.11.24
Photo by Google DeepMind / Unsplash

Всем добрый день! Cегодня поговорим про новинки в мире нейросетей. Обсудим что вышло свежего, насколько оно хорошо работает и где это можно применить. Начнем!

Qwen 2.5 Coder Ноябрь 2024. Новая SOTA?

Долгожданный релиз обновления нейросети Qwen 2.5 Coder, обещающий нам уверенный прирост качества. Так что же поменялось в ней с первой версии?

Главное изменение - это новые размеры релизнутых сетей. Изначально для Coder были доступны только версии 7B и 1.5B. Разумеется, для более сложных задач таких маленьких моделей не хватало. И наконец, спустя полгода, Qwen решили до конца расширить линейку нейросетей до стандартных 0.5B, 1.5B, 3B, 7B, 14B, 32B и 72B, подобно основной модели Qwen 2.5. Обновленные веса дадут возможность мигрировать разработчикам с 9+ ГБ видеопамяти с нейросетевых провайдеров (OpenAI и подобные) на полностью локальные решения.

Говоря про тесты, их результаты превзошли все ожидания юзеров. Модель 32B порвала llm арены, обойдя занимающего прошлые топы Deepseek Coder V2 и вплотную приближаясь к большим моделям GPT 4o и Claude Sonnet 3.5

Результаты бенчмарка для 32B модели

Из обещаных скилов модели, Qwen заявляют написание, фикс, а также reasoning кода. Должно быть очень полезно для большинства разработчиков, но только время покажет насколько инструмент эффективен.

Кстати, про большинство разработчиков это не просто громкие слова. Заявляется поддержка огромного количества ЯП, начиная от массовых Python и JS, и заканчивая Fortran

Посмотрим, чем ответит на это Meta в начале 2025 года с новой LLaMa 4


Omnivision

Релиз модели от компании NexaAI дал нам достаточно интересный продукт. Это Vision моделька для edge устройств с весом в 531 MB в квантизованном виде, обгоняет предыдущего лидера NanoLLaVa, при этом увеличив скорость обработки данных в 9 раз.

Разработчик провел текстирование на своем MacBook M4 Pro:

Обработка этого изображения размером 1046×1568 заняла менее 2х секунд и гигабайта памяти

Похоже, микромодели будут все больше интегрироваться в нашу жизнь, и гпт в каждом утюге уже не кажется такой ненормальной идеей. Интересно, а как эту нейронку можно встроить в устройства УД?....


Flux.1 Tools или как Midjourney заменяется открытыми моделями

Релиз от Black Forest Labs дал рывок энтузиастам из сферы нейросетей. Был выпущен тулкит для модификации картинок Flux.1 Tools. Ранее похожие инструменты существовали у Stable Diffusion и активно использовались сообществом. Теперь они выходят на новый уровень, потому что Блэк Форесты сломали барьер качества SD. Так что у нас входит в этот набор?

Ин/аутпейтинг — FLUX.1 Fill (https://github.com/black-forest-labs/flux)

Flux.1 Fill

Конролнет — FLUX.1 Depth (https://huggingface.co/black-forest-labs/FLUX.1-Depth-dev) и FLUX.1 Canny (https://huggingface.co/black-forest-labs/FLUX.1-Canny-dev), которые также идут в формате LoRA.

Flux.1 Depth

IP-адаптер — FLUX.1 Redux (https://huggingface.co/black-forest-labs/FLUX.1-Redux-dev)

Flux.1 Redux

Качество моделек очень приятно удивило, а учитывая что сообщество делало даже с устаревшим SD 1.5 в ближайшее время мы можем ждать революцию в T2I и I2I генерации.


LLaMa Mesh

Под завершение, поговорим про очень интересную наработку китайцев LLaMa Mesh. Ребята зафайнтюнили LLaMa 3.1 и теперь она умеет генерировать код для OBJ файлов по текстовому запросу.

0:00
/1:04

Модельку можно потыкать на HuggingFace. Пока это скорее баловство, но похоже скоро не только картинки, но и геометрию получится генерировать. Будем наблюдать за успехами ребят и смотреть как это все можно применить в наших задачах


На этом все, к концу года планируется несколько крупных релизов, но самый сок стоит ожидать в начале 2025 года. Всем спасибо за прочтение данного материала, и хороших Вам выходных!

silver tabby cat sleeping on white blanket

Read more

Нейронки 12.01

Коллеги, всех уже с наступившим (уже как 12 дней) Новым 2025 годом! Надеюсь вы хорошо отдохнули, поднабрались сил и идей, и готовы дальше работать и достигать новых успехов! Итак, начнем! Deepseek V3 Начнем мы с прошлогоднего крупного релиза от компании Deepseek, который называется Deepseek V3. На настоящий момент это самая

By Евгений Мухсан

Нейронки 22.12.24

Добрый день, уважаемые читатели! Это новый выпуск нашего дайджеста про нейронки. Сегодня мы сделаем акцент на новом развивающемся виде нейросетей - T2V. Удивительно, насколько быстро они развиваются, и похоже тормозить они не планируют. Итак, приступим! Свежак: нейросеть Trellis t23d Однако, стоит начать с отдельной звездочки последних двух недель - нейросети

By Евгений Мухсан

Нейронки. 08.12.24

Нейросети продолжают революционизировать мир технологий, открывая новые возможности для решения сложных задач и улучшения нашей жизни. На этой неделе мы снова стали свидетелями прорывов и достижений в области искусственного интеллекта. От новейших разработок в области обработки естественного языка до инновационных решений в области компьютерного зрения, я представляю Вам сжатую подборку

By Евгений Мухсан

Нейронки. 02.11.24

Приветствую всех слушателей нашего подкаста! Сегодня мы отправимся в захватывающий мир нейросетей — технологий, которые уже меняют и продолжат трансформировать наш мир в ближайшие годы. Мы разберемся, как нейросети учатся, что позволяет им решать задачи, ранее доступные только человеку, и какие перспективы они открывают. Поговорим о том, как эти алгоритмы становятся

By Евгений Мухсан