JetBrains выпустила Mellum 2 — специализированную AI-модель — в открытый доступ. Это даёт разработчикам и инженерным командам новый высокопроизводительный инструмент, оптимизированный для быстрых повторяющихся задач, из которых складываются современные AI-воркфлоу в разработке ПО.
Анонс: сфокусированная модель для инженерной разработки
В недавнем посте на блоге JetBrains объявила об открытии исходного кода Mellum 2 — модели, изначально спроектированной для production-систем ИИ. Ключевые детали из источника говорят сами за себя: 12 миллиардов параметров, лицензия Apache 2.0. Главное новшество — не только масштаб, но и архитектура вместе с узкой специализацией. По словам компании, модель создана для решения «самых сложных задач production AI: задержек, пропускной способности и стоимости».
JetBrains позиционирует Mellum 2 как развитие их ранней модели автодополнения кода. Теперь она работает как с естественным языком, так и с кодом, что делает её универсальной для маршрутизации запросов, суммаризации контекста и промежуточных рассуждений в сложных AI-пайплайнах. Модель рассчитана на интеграцию в IDE, RAG-системы и воркфлоу с агентами.
Под капотом: эффективность через специализацию
В основе ценностного предложения Mellum 2 лежит её технический дизайн. Модель использует архитектуру Mixture-of-Experts (MoE).
Mixture-of-Experts (MoE): архитектура, в которой нейросеть разделена на множество «экспертных» подсетей. Для каждого входного токена активируется лишь часть из них, что позволяет сохранять большой общий объём параметров при низких вычислительных затратах на инференс.
При 12 млрд общих параметров и всего 2.5 млрд активных на токен модель стремится обеспечить высокую пропускную способность с минимальной задержкой — именно то, что критически важно для интерактивных инструментов разработки. Кроме того, JetBrains делает акцент на специализации. В отличие от крупных универсальных мультимодальных моделей, Mellum 2 обучена исключительно на тексте и коде. Такой фокус призван сделать её компактной и исключительно быстрой в своей нише — на отдельных задачах программирования она способна превосходить даже менее специализированные модели бо́льшего размера.
Компания утверждает, что такой дизайн сокращает время инференса «более чем вдвое» по сравнению с моделями аналогичного размера — решающий показатель для интерактивных приложений.
Что это значит для self-hosted AI и создателей агентов
Открытие модели вроде Mellum 2 особенно важно для команд, строящих собственную AI-инфраструктуру, — особенно для тех, кто делает ставку на self-hosted-решения и автономных агентов. В исходной статье описано несколько напрямую релевантных сценариев.
Во-первых, это идеальный вариант для оркестрации. В многомодельной агентной системе нужен быстрый роутер, который решит, какая из более крупных и дорогих моделей должна обработать сложный запрос. Mellum 2 может выступать именно таким дешёвым и быстрым диспетчером.
Во-вторых, она способна питать субагентов и промежуточные шаги воркфлоу. Например, в кодирующем агенте, который планирует, извлекает контекст и генерирует код, Mellum 2 может эффективно закрывать этапы планирования и суммаризации, оставляя финальный синтез кода для более мощной модели.
В-третьих, и это важнее всего для тех, кому важны контроль и приватность, JetBrains подчёркивает возможность «запустить Mellum 2 локально или развернуть на своей инфраструктуре, чтобы сохранить полный контроль над кодом и данными». Это ключевой энаблер для бизнеса, который не может или не хочет отправлять конфиденциальный код и данные сторонним API.
Такая философия проектирования идеально совпадает с подходом систем вроде OfficeForge, где команда специализированных self-hosted AI-агентов работает сообща над задачами. Быстрая сфокусированная модель типа Mellum 2 — именно тот компонент, который способен эффективно обрабатывать маршрутизацию и подзадачи внутри такой оркестрированной команды, целиком на инфраструктуре компании.
Купить — 15 400 ₽Философия «фокусной модели» и будущее AI-стеков
JetBrains в своём анонсе формулирует более широкую индустриальную тенденцию: переход от единой монолитной AI к координированным системам. Компания выступает за гибридный стек, в котором массивные «граничные» модели дополняются более мелкими и быстрыми «фокусными моделями», экономно закрывающими высокочастотные задачи с жёсткими требованиями к задержке.
Такой подход снижает операционные расходы на AI-функции. Вместо того чтобы направлять каждый запрос на простое автодополнение кода или суммаризацию контекста к дорогостоящему API-эндпоинту, команды могут развернуть модель вроде Mellum 2 локально за копейки. Это делает масштабирование AI-функций в продуктах и внутренних инструментах экономически жизнеспособным.
Для руководителей инженерных команд и DevOps-специалистов это открывает понятный путь к созданию более сложных и отзывчивых AI-инструментов без пропорционального роста затрат. Возможность дообучить и развернуть такую модель на собственной инфраструктуре даёт сочетание производительности, контроля расходов и суверенитета данных, которое всё настойчивее требуется в корпоративной среде.
С чего начать и более широкие последствия
JetBrains публикует технический отчёт и приглашает разработчиков опробовать Mellum 2 для интеграции в IDE, RAG-пайплайны и агентные воркфлоу. Лицензия Apache 2.0 снимает значительные барьеры как для коммерческого, так и для экспериментального использования.
Выход Mellum 2 обогащает растущую экосистему специализированных open-source моделей, которые компании могут использовать для построения собственного приватного AI-стека. Это подчёркивает будущее, в котором возможности ИИ определяются не только «сырым интеллектом», но и способностью организовать подходящий инструмент под конкретную задачу — эффективно и в собственной контролируемой среде.
Для команд, оценивающих варианты внедрения AI-автоматизации, модели вроде Mellum 2 снижают порог входа для создания быстрых и отзывчивых систем. Это развитие дополнительно подтверждает модель построения с разнообразной командой AI-специалистов — будь то сборка из open-source компонентов или использование готового интегрированного решения, как могло бы показать сравнение OfficeForge vs ChatGPT Teams, — работающих на инфраструктуре, которой вы владеете и управляете.
FAQ
Что такое Mellum 2?
Mellum 2 — это открытая AI-модель на 12 миллиардов параметров от JetBrains, разработанная специально для высокоскоростных задач в разработке ПО: автодополнения кода, маршрутизации запросов и питания субагентов.
Под какой лицензией выпущена Mellum 2?
Модель выходит под либеральной лицензией Apache 2.0, допускающей свободное использование, модификацию и распространение, в том числе в коммерческих продуктах.
Как Mellum 2 достигает высокой производительности при большом числе параметров?
Используется архитектура Mixture-of-Experts (MoE): при 12 млрд общих параметров на каждый токен активируется лишь 2.5 млрд, что резко снижает вычислительные затраты.
Можно ли запустить Mellum 2 локально?
Да, JetBrains явно называет «приватный локальный AI-деплоймент» одним из ключевых сценариев — это позволяет полностью сохранять контроль над кодом и данными.
