Нейронки. 08.12.24
Нейросети продолжают революционизировать мир технологий, открывая новые возможности для решения сложных задач и улучшения нашей жизни. На этой неделе мы снова стали свидетелями прорывов и достижений в области искусственного интеллекта. От новейших разработок в области обработки естественного языка до инновационных решений в области компьютерного зрения, я представляю Вам сжатую подборку наиболее интересных и значимых событий в мире ИИ. Давайте вместе осмотрим самые интересные новости и достижения последних двух недель и узнаем, как нейросети меняют наш мир.
Новая ЛЛаМа?
Начнем с неожиданного релиза от Meta. Meta Llama 3.3 - это многоязычная большая языковая модель (LLM) с 70 миллиардами параметров, оптимизированная для диалоговых задач и доступная для коммерческого и исследовательского использования. Отличительная ее особенность от предыдущих моделей это новый датасет, основанный на новой смеси публично доступных онлайн-данных, которая включает в себя более 15 триллионов токенов.
Говоря про тесты, Meta обещают большой прирост качества генерации, близкий к LLaMa 3 405B. Однако, по части тестов, в том числе и в кодинге, модель уступает недавно вышедшей Qwen 2.5 Coder.
Релиз немного странный, потому что была выпущена только старшая 70B модель без ее младших вариаций. Печально, потому что вероятно даже дистиллированная 8B модель могла показать хорошие результаты генерации текста. Будем надеятся, что релиз Llama 4 в следующем году оправдает свои ожидания. Потестировать модель можно тут.
Неожиданный Reasoning от Qwen.
Похоже, модели со встроенным CoT будут очень быстро захватывать рынок нейросетей. Qwen выпустили новую концептуальную 32B модель QwQ-32B-Preview. Эта экспериментальная модель демонстрирует перспективные аналитические способности, и она фокусируется на улучшении возможностей искусственного интеллекта в области рассуждений, но однако имеет привычку менять языки рассуждения налету и иногда попадает в рекурсию.
Но даже учитывая все ее минусы, очень интересно наблюдать за ее рассуждениями. Моделька не просто отвечает на вопрос, а рассуждает, подходит к задаче с разных сторон и старается проверить свой ответ сложными и ветвистыми методами. Очень интересный релиз, вероятно в ближайший год качество reasoning моделей, а в следствии и качество выходной генерации моделей, резко вырастет. Приятно, будем наблюдать за ними.
Новый оптический агент?
В заключение, кратко поговорим про новую легковесную модельку ShowUI.
Это T2T модель, которая на вход получает изображение и текстовый запрос. На выходе мы получаем последовательность действий в интерфейсе для достижения требуемого результата. Моделька состоит из 2B парамтеров, потому достаточно легковесная и может использовать в большинстве автономных систем. Демо
Новый год все ближе, еще один дайджест и мы все перейдем в новый 2025 год. И с каждым новым дайджестом мы будем все глубже погружаться в удивительный мир нейросетей. Всем хорошей рабочей недели!