Стремительное распространение искусственного интеллекта (ИИ) во всех сферах жизни, от медицины до религии, вызывает всё больше вопросов о принципах его работы. Даже эксперты в области ИИ признают, что внутренние процессы, происходящие в этих «чёрных ящиках», остаются во многом непонятными, несмотря на их применение в критически важных областях. В качестве решения этой проблемы учёные разрабатывают новые […]
большие языковые модели
Исследовательская группа из Кембриджского университета и Google DeepMind разработала первый научно обоснованный метод оценки и формирования «личности» у больших языковых моделей (LLM), лежащих в основе популярных чат-ботов, таких как ChatGPT. Используя психологические тесты, обычно применяемые для оценки личности человека, учёные показали, что ИИ не только имитирует человеческие черты характера, но и что его «личность» можно […]
SoftBank объявил о полной продаже своего пакета акций Nvidia на сумму $5,83 млрд, сделав ещё один шаг в стратегии «монетизации активов» и наращивания инвестиций в сферу искусственного интеллекта. Согласно отчётности компании, в октябре она реализовала 32,1 млн акций американского производителя чипов. Параллельно SoftBank сократила долю в T-Mobile, выручив ещё $9,17 млрд. Финансовый директор SoftBank Ёсимицу Гото […]
Учёные из Meta* FAIR и Эдинбургского университета создали метод, который позволяет не только определить, насколько корректно рассуждает языковая модель, но и вмешаться в процесс, чтобы исправить ошибку. Подход получил название Circuit-based Reasoning Verification (CRV) и основан на анализе «вычислительных цепей» — подграфов нейронов, которые реализуют скрытые алгоритмы внутри модели. CRV строит граф вычислений модели и […]
Команды учёных из Техасского университета в Остине (University ofTexas at Austin), Техасского университета A&M (Texas A&M University) и Университета Пердью (Purdue University представили доклад, в котором показали: большие языковые модели (LLM) при обучении на вирусных, низкосодержательных постах из соцсетей обнаруживают устойчивый спад способности к мышлению, пониманию длинных текстов и соблюдению этических норм. Учёные сформулировали гипотезу […]
В рамках соглашения, подписанного в октябре, компания Anthropic получила доступ к более чем миллиону ИИ-чипов Google — Tensor Processing Units (TPU). Этот контракт на 10 миллиардов долларов позволит компании увеличить вычислительные мощности для разработки и обучения своих языковых моделей, в первую очередь — Claude. Договор предполагает поставку до миллиона TPU к 2026 году, что в […]
Исследователи из Университета штата Аризона опубликовали работу, бросающую вызов распространённому мнению о способностях больших языковых моделей (LLM) к логическому рассуждению. В последние месяцы индустрия ИИ активно развивает так называемые рассуждающие модели, использующие «цепочку мыслей» (chain of thought) для решения сложных задач в несколько логических шагов. Однако недавние исследования ставят под сомнение наличие у этих моделей […]
Недавнее исследование некоммерческой исследовательской группы METR (Model Evaluation & Threat Research) ставит под сомнение заявления о повышении производительности разработчиков программного обеспечения благодаря инструментам на основе искусственного интеллекта, таким как Cursor и GitHub Copilot. В ходе рандомизированного контролируемого эксперимента, в котором приняли участие 16 опытных разработчиков, выполнявших 246 реальных задач в крупных репозиториях, исследователи обнаружили неожиданный результат. […]







