Новости

Китайский искусственный интеллект DeepSeek завоевал золотую медаль на международной математической олимпиаде

DeepSeek стремится снизить барьеры для исследователей и разработчиков, желающих экспериментировать с передовым ИИ.

DeepSeek открыла исходный код Math-V2 — первой модели ИИ, которая достигла золотого уровня на Международной математической олимпиаде.
DeepSeek демонстрирует, что ИИ может самостоятельно проверять ответы для решения сложных математических задач. Матеус Бертелли/Pexels

По словам исследователя искусственного интеллекта из Гарварда Хуана Ичена и профессора компьютерных наук Калифорнийского университета в Лос-Анджелесе Ян Линя, Международная математическая олимпиада (ММО), которая проводится ежегодно с 1959 года, по праву считается самым престижным в мире математическим соревнованием, проверяющим участников, решая задачи, требующие глубокого понимания, креативности и строгого рассуждения.

Теперь китайский стартап в области искусственного интеллекта DeepSeek сделал свою модель Math-V2 общедоступной, выложив ее исходный код в открытый доступ на Hugging Face и GitHub по разрешительной лицензии, которая позволяет разработчикам адаптировать и перепрофилировать систему.

Math-V2 продемонстрировал результаты, соответствующие золотым медалям на IMO, что требует не только правильных ответов, но и четкого обоснования их — стандарт, которого достигают лишь около 8 процентов участников-людей.

Снижение глобальных барьеров для углубленной математики

Компания заявляет, что её модель Math-V2 достигла «золотого» уровня по задачам как Международной математической олимпиады этого года, так и Китайской математической олимпиады 2024 года. Открывая исходный код модели, DeepSeek стремится снизить барьеры для исследователей и разработчиков, стремящихся экспериментировать с передовым искусственным интеллектом, способным решать сложные математические задачи, — областью, в которой традиционно доминируют проприетарные системы, сообщает South China Morning Post.

В публикации Hugging Face исследователи DeepSeek подчеркнули, что дальнейшее развитие математических возможностей ИИ может оказать преобразующее влияние на научные исследования — от сложного моделирования до теоретического решения проблем.

Однако они предупредили, что многие из современных систем искусственного интеллекта были в первую очередь оптимизированы для хороших результатов на стандартных математических тестах, достигая высоких результатов, но не обязательно улучшая базовые способности к рассуждению и решению проблем, которые являются движущей силой настоящих инноваций.

Чтобы усилить строгость математических рассуждений своего ИИ, DeepSeek сосредоточился на том, чтобы модель могла «самопроверять» свои ответы, даже для задач без заранее известных решений, пояснили исследователи. Эта способность самопроверки позволяет ИИ оценивать последовательность и обоснованность своих рассуждений, помогая гарантировать, что его выводы не только верны при наличии известных решений, но и надёжны при решении новых или нерешённых математических задач.

Самопроверяемые рассуждения открывают новые возможности для продвинутого математического ИИ

Подход DeepSeek устраняет давнее ограничение в разработке ИИ: большинство систем демонстрируют улучшение только в задачах, решения которых легко проверить. Благодаря поддержке самопроверяемых рассуждений модель может расширить свои возможности для решения более сложных задач с открытым исходным кодом. Исследователи отметили, что, несмотря на значительный объём работы, полученные результаты свидетельствуют о том, что самопроверяемые математические рассуждения — перспективное направление исследований, которое может проложить путь к созданию более продвинутых и эффективных систем ИИ в математике и других областях.

Получив золотую медаль на Международной математической олимпиаде, Google DeepMind предоставила свою собственную модель подписчикам премиум-тарифа Ultra, предоставив избранной группе разработчиков ранний доступ к передовому ИИ. В свою очередь, генеральный директор OpenAI Сэм Альтман объявил, что экспериментальная модель компании, также получившая золотую медаль на IMO, останется недоступной для широкой публики в течение многих месяцев, добавили в SCMP.

В то же время такие шаги подчеркивают различия в стратегиях ведущих компаний в области ИИ: некоторые выбирают контролируемый доступ для защиты интеллектуальной собственности и обеспечения ответственного использования, в то время как другие сосредотачиваются на постепенном расширении доступности для исследователей и разработчиков.

Sourse: interestingengineering.com

Похожие статьи

Кнопка «Наверх»