Нейронки. 24.11.24

Евгений Мухсан

Nov 24, 2024 — 3 min read

Всем добрый день! Cегодня поговорим про новинки в мире нейросетей. Обсудим что вышло свежего, насколько оно хорошо работает и где это можно применить. Начнем!

Qwen 2.5 Coder Ноябрь 2024. Новая SOTA?

Долгожданный релиз обновления нейросети Qwen 2.5 Coder, обещающий нам уверенный прирост качества. Так что же поменялось в ней с первой версии?

Главное изменение - это новые размеры релизнутых сетей. Изначально для Coder были доступны только версии 7B и 1.5B. Разумеется, для более сложных задач таких маленьких моделей не хватало. И наконец, спустя полгода, Qwen решили до конца расширить линейку нейросетей до стандартных 0.5B, 1.5B, 3B, 7B, 14B, 32B и 72B, подобно основной модели Qwen 2.5. Обновленные веса дадут возможность мигрировать разработчикам с 9+ ГБ видеопамяти с нейросетевых провайдеров (OpenAI и подобные) на полностью локальные решения.

Говоря про тесты, их результаты превзошли все ожидания юзеров. Модель 32B порвала llm арены, обойдя занимающего прошлые топы Deepseek Coder V2 и вплотную приближаясь к большим моделям GPT 4o и Claude Sonnet 3.5

Из обещаных скилов модели, Qwen заявляют написание, фикс, а также reasoning кода. Должно быть очень полезно для большинства разработчиков, но только время покажет насколько инструмент эффективен.

Кстати, про большинство разработчиков это не просто громкие слова. Заявляется поддержка огромного количества ЯП, начиная от массовых Python и JS, и заканчивая Fortran

Посмотрим, чем ответит на это Meta в начале 2025 года с новой LLaMa 4

Omnivision

Релиз модели от компании NexaAI дал нам достаточно интересный продукт. Это Vision моделька для edge устройств с весом в 531 MB в квантизованном виде, обгоняет предыдущего лидера NanoLLaVa, при этом увеличив скорость обработки данных в 9 раз.

Разработчик провел текстирование на своем MacBook M4 Pro:

Обработка этого изображения размером 1046×1568 заняла менее 2х секунд и гигабайта памяти

Похоже, микромодели будут все больше интегрироваться в нашу жизнь, и гпт в каждом утюге уже не кажется такой ненормальной идеей. Интересно, а как эту нейронку можно встроить в устройства УД?....

Flux.1 Tools или как Midjourney заменяется открытыми моделями

Релиз от Black Forest Labs дал рывок энтузиастам из сферы нейросетей. Был выпущен тулкит для модификации картинок Flux.1 Tools. Ранее похожие инструменты существовали у Stable Diffusion и активно использовались сообществом. Теперь они выходят на новый уровень, потому что Блэк Форесты сломали барьер качества SD. Так что у нас входит в этот набор?

Ин/аутпейтинг — FLUX.1 Fill (https://github.com/black-forest-labs/flux)

Конролнет — FLUX.1 Depth (https://huggingface.co/black-forest-labs/FLUX.1-Depth-dev) и FLUX.1 Canny (https://huggingface.co/black-forest-labs/FLUX.1-Canny-dev), которые также идут в формате LoRA.

IP-адаптер — FLUX.1 Redux (https://huggingface.co/black-forest-labs/FLUX.1-Redux-dev)

Качество моделек очень приятно удивило, а учитывая что сообщество делало даже с устаревшим SD 1.5 в ближайшее время мы можем ждать революцию в T2I и I2I генерации.

LLaMa Mesh

Под завершение, поговорим про очень интересную наработку китайцев LLaMa Mesh. Ребята зафайнтюнили LLaMa 3.1 и теперь она умеет генерировать код для OBJ файлов по текстовому запросу.

0:00

/1:04

Модельку можно потыкать на HuggingFace. Пока это скорее баловство, но похоже скоро не только картинки, но и геометрию получится генерировать. Будем наблюдать за успехами ребят и смотреть как это все можно применить в наших задачах

На этом все, к концу года планируется несколько крупных релизов, но самый сок стоит ожидать в начале 2025 года. Всем спасибо за прочтение данного материала, и хороших Вам выходных!

silver tabby cat sleeping on white blanket

Нейронки. 24.11.24

Евгений Мухсан

Qwen 2.5 Coder Ноябрь 2024. Новая SOTA?

Omnivision

Flux.1 Tools или как Midjourney заменяется открытыми моделями

LLaMa Mesh

Read more

Нейронки 12.01

Нейронки 22.12.24

Нейронки. 08.12.24

Нейронки. 02.11.24