пн. - пт.: 10.00 - 19.00, сб., вс. - выходной
Наши центры
Оставить заявку

большие языковые модели

SoftBank объявил о полной продаже своего пакета акций Nvidia на сумму $5,83 млрд, сделав ещё один шаг в стратегии «монетизации активов» и наращивания инвестиций в сферу искусственного интеллекта. Согласно отчётности компании, в октябре она реализовала 32,1 млн акций американского производителя чипов. Параллельно SoftBank сократила долю в T-Mobile, выручив ещё $9,17 млрд. Финансовый директор SoftBank Ёсимицу Гото […]

Учёные из Meta* FAIR и Эдинбургского университета создали метод, который позволяет не только определить, насколько корректно рассуждает языковая модель, но и вмешаться в процесс, чтобы исправить ошибку. Подход получил название Circuit-based Reasoning Verification (CRV) и основан на анализе «вычислительных цепей» — подграфов нейронов, которые реализуют скрытые алгоритмы внутри модели. CRV строит граф вычислений модели и […]

Команды учёных из Техасского университета в Остине (University ofTexas at Austin), Техасского университета A&M (Texas A&M University) и Университета Пердью (Purdue University представили доклад, в котором показали: большие языковые модели (LLM) при обучении на вирусных, низкосодержательных постах из соцсетей обнаруживают устойчивый спад способности к мышлению, пониманию длинных текстов и соблюдению этических норм. Учёные сформулировали гипотезу […]

В рамках соглашения, подписанного в октябре, компания Anthropic получила доступ к более чем миллиону ИИ-чипов Google — Tensor Processing Units (TPU). Этот контракт на 10 миллиардов долларов позволит компании увеличить вычислительные мощности для разработки и обучения своих языковых моделей, в первую очередь — Claude. Договор предполагает поставку до миллиона TPU к 2026 году, что в […]

Исследователи из Университета штата Аризона опубликовали работу, бросающую вызов распространённому мнению о способностях больших языковых моделей (LLM) к логическому рассуждению. В последние месяцы индустрия ИИ активно развивает так называемые рассуждающие модели, использующие «цепочку мыслей» (chain of thought) для решения сложных задач в несколько логических шагов. Однако недавние исследования ставят под сомнение наличие у этих моделей […]

Недавнее исследование некоммерческой исследовательской группы METR (Model Evaluation & Threat Research) ставит под сомнение заявления о повышении производительности разработчиков программного обеспечения благодаря инструментам на основе искусственного интеллекта, таким как Cursor и GitHub Copilot. В ходе рандомизированного контролируемого эксперимента, в котором приняли участие 16 опытных разработчиков, выполнявших 246 реальных задач в крупных репозиториях, исследователи обнаружили неожиданный результат. […]

Команда исследователей из Университета Лугано и Женевского университета разработала способ использовать большие языковые модели — такие как GPT-4o — для оценки справедливости поисковых систем. Новая методика позволяет выявлять гендерные перекосы в ранжировании результатов поиска, даже если они не выражены напрямую в тексте и остаются незаметны традиционным метрикам. Это может быть особенно важно в тех случаях, […]

Компания Meta* продолжает активно переманивать специалистов из OpenAI. На этой неделе стало известно о переходе влиятельного исследователя OpenAI, Трапита Бансала (согласно сообщению TechCrunch), а также ещё трёх исследователей (по данным The Wall Street Journal). Издание The Information сообщило о найме ещё четырёх специалистов из OpenAI: исследователей Шенгцзя Чжао, Цзяхуэй Ю, Шучао Би и Хунъю Рэнь. Этот […]