пн. - пт.: 10.00 - 19.00, сб., вс. - выходной
Наши центры
Оставить заявку

Машинное обучение

Привет, Хабр! Февраль 2026 года. За один месяц вышли: Gemini 3.1 Pro от Google, Claude Sonnet 4.6 и Opus 4.6 от Anthropic, GPT-5.3 и GPT-5.4 от OpenAI (5.4 — через два дня после 5.3, без каких-либо объяснений), Grok 4.20 от xAI, Qwen 3.5 от Alibaba, DeepSeek V4, GLM-5 от Zhipu, Seed 2.0 от ByteDance. Семь […]

Что происходит, когда ваши собственные исследователи называют вас пропагандистским рупором, почему CEO Anthropic признаёт, что 50% рабочих мест могут исчезнуть, и данные, которые OpenAI отчаянно хочет похоронить. Ведущие исследователи только что покинули OpenAI. Не ради более высоких зарплат. Не чтобы присоединиться к Google или *Meta. Они ушли, потому что отказались участвовать в том, что считали […]

Google DeepMind объявил о публикации предварительного прототипа SIMA-2 (Scalable Instructable Multiworld Agent) — следующего поколения агента, который, по словам создателей, «переходит за рамки простого исполнения инструкций, чтобы понимать и взаимодействовать с окружающей средой». SIMA-1, представленный в марте 2024 года, обучался на сотнях часов видеоигр и смог выполнять простые команды во множестве 3-D игр, но в сложных […]

Nvidia официально присоединилась к Индийскому альянсу глубоких технологий (IDTA) в качестве сооснователя. Этот альянс объединяет крупнейших инвесторов и венчурные фонды, чтобы поддерживать развитие экосистемы стартапов в области ИИ, робототехники, биотехнологий и полупроводников в Индии. По данным CNBC, IDTA планирует инвестировать около 2 миллиардов долларов в молодые компании, работающие на стыке науки и технологий. Nvidia не […]

Учёные из Meta* FAIR и Эдинбургского университета создали метод, который позволяет не только определить, насколько корректно рассуждает языковая модель, но и вмешаться в процесс, чтобы исправить ошибку. Подход получил название Circuit-based Reasoning Verification (CRV) и основан на анализе «вычислительных цепей» — подграфов нейронов, которые реализуют скрытые алгоритмы внутри модели. CRV строит граф вычислений модели и […]

Всем привет! Меня зовут Анастасия Рысьмятова, я руковожу юнитом LLM в Авито.В этой статье я расскажу, как мы с командой создали и адаптировали нашу большую языковую модель A-vibe: зачем решили развивать собственную LLM, как построили токенизатор, собрали датасеты, провели SFT и RL и что получили в итоге. Поделюсь основными экспериментами и покажу наши результаты. Сегодня […]

Команды учёных из Техасского университета в Остине (University ofTexas at Austin), Техасского университета A&M (Texas A&M University) и Университета Пердью (Purdue University представили доклад, в котором показали: большие языковые модели (LLM) при обучении на вирусных, низкосодержательных постах из соцсетей обнаруживают устойчивый спад способности к мышлению, пониманию длинных текстов и соблюдению этических норм. Учёные сформулировали гипотезу […]

В начале октября 2025 года в социальных сетях разгорелся скандал вокруг заявления OpenAI о возможностях их новейшей модели GPT-5. Компания сообщила, что ИИ «нашёл» решения десяти открытых задач из знаменитого списка математических проблем, сформулированных математиком Полом Эрдёшем. Однако вскоре выяснилось, что GPT-5 не создала новых доказательств, а лишь смогла обнаружить в научной литературе, оставленной десятилетия назад, […]