Новая модель OpenAI o1 очень умна, но иногда старый-добрый ChatGPT-4o оказывается удобнее
Новая модель OpenAI o1 очень умна, но иногда старый-добрый ChatGPT-4o оказывается удобнее

В середине сентября компания OpenAI представила новую языковую модель со скромным названием o1. Несмотря на то, что многие уже догадывались о предстоящем релизе и ожидали настоящего фурора в мире искусственного интеллекта, ничего такого не произошло. Разработчик хоть и заявил, что новый продукт способен к рассуждению на уровне экспертов в различных областях, проверить это на практике оказалось не так-то просто. Неожиданно выяснилось, что o1 не только требует особого подхода к промптингу, но и думает заметно дольше, чем ChatGPT-4o. Так что же делает эту модель такой уникальной и какие перспективы на самом деле она открывает для будущего ИИ? Давайте разбираться.

Что такое OpenAI o1

OpenAI o1 – это новейшая языковая модель, разработанная компанией OpenAI. Ее ключевой особенностью является способность к сложным рассуждениям. Эта модель использует алгоритмы обучения, основанные на реальных рассуждениях и причинно-следственных связях. Такой подход позволяет o1 не просто выдавать готовые ответы, а последовательно выстраивать логические цепочки, имитируя процесс человеческого мышления.

Новая модель представлена в двух версиях: o1-preview и o1-mini. Модель o1-preview предназначена для решения сложных задач, на которые тратится больше времени и токенов, в то время как o1-mini представляет собой более быстрое и экономичное решение. Несмотря на различия, они обе оптимизированы для областей STEM, особенно в программировании и математике.

Посмотрите, насколько ChatGPT-4o отстает от o1 в точных дисциплинах

Несмотря на то что o1 тоже может ошибаться, она буквально рассуждает над вашими запросами. Это требует существенно больше вычислительных ресурсов. Поэтому разработчики установили лимит по количеству обращений. Для o1-mini это 50 запросов в день (в первые дни было 50 запросов в неделю), а для o1-preview - 50 запросов в неделю (было 30 запросов в неделю).

o1 vs ChatGPT-4o: ключевые различия

При сравнении o1 с ChatGPT-4o выявляется ряд существенных отличий:

  • Улучшенные навыки логического мышления и анализа у o1

  • Специализация o1 на точных науках и программировании

  • Более длительное время обработки запросов у o1

  • Превосходство o1 в решении сложных задач программирования

OpenAI заявляет, что база знаний, доступная модели o1, сравнима с уровнем докторов наук в различных научных дисциплинах. Модель не только в курсе сложных концепций в физике, химии, биологии и других науках, но и обладает пониманием их глубинной природы, что позволяет использовать эти знания на практике. Это делает ее полезным инструментом не только для студентов и преподавателей, но и для профессиональных исследователей и ученых.

Другие модели справляются с решением математических задач хуже, чем o1
Другие модели справляются с решением математических задач хуже, чем o1

В математике o1 показывает особенно выдающиеся результаты. Она способна решать задачи уровня американского математического конкурса AIME, входя в топ-500 лучших студентов США. Такой уровень математической подготовки открывает широкие возможности для применения o1 в научных исследованиях и инженерных разработках. А в тестировании по программированию на платформе Codeforces модель o1 достигла рейтинга Эло 1673.

Как работает нейросеть OpenAI o1

Мыслительный процесс o1 не бесплатен. Он основан на использовании токенов, которые модель использует для формирования своих рассуждений. Они расходуются, когда o1 сталкивается с задачей, которая требует не просто готового ответа, а нескольких этапов анализа и рассуждений.

Сначала модель разбивает проблему на составные части, затем исследует каждую из них, используя свою базу знаний. И только после этого она выстраивает логическую цепочку, связывая различные аспекты задачи и формируя последовательное решение.

Из этого проистекают и задачи, которые подходят для выполнения при помощи o1 и которые для этой модели не годятся совсем. Так, если вам нужно расписать план терроформирования на Марсе с учетом научно-обоснованной информации, которая уже изучена человечеством, o1 однозначно подойдет. Но, если вы хотите, чтобы нейросеть расписала план сочинения для 10-классника, то за этим лучше обращаться к ChatGPT-4o.

Тексты ChatGPT-4o по-прежнему пишет лучше, чем o1-preview и o1-mini
Тексты ChatGPT-4o по-прежнему пишет лучше, чем o1-preview и o1-mini

o1 решительно не подходит для простых запросов и творческих задач по следующим причинам:

  • Более длительное время обработки запросов

  • Высокая стоимость эксплуатации

  • Наличие лимитов на использование

  • Склонность к усложнению ответов

  • Неэффективность при решении простых задач

Впрочем, есть и более серьезные недостатки o1, которые могут существенно влиять на применимость модели в определенных сценариях использования.

Во-первых, база знаний моделей o1-preview и o1-mini ограничена временными рамками. Доступная им информация актуальна только до октября 2023 года, что может создавать проблемы при работе с более свежими данными или событиями.

Во-вторых, модели o1 не обладают доступом в интернет. Это означает, что они не могут в реальном времени обращаться к веб-страницам или обновлять свою базу знаний, что ограничивает их способность работать с актуальной информацией.

В-третьих, они неспособны к анализу файлов. В отличие от некоторых других моделей, таких как GPT-4o, o1 не может обрабатывать загруженные пользователем документы или извлекать из них информацию, что может быть критичным для некоторых задач. Вы не сможете загрузить в чат картинку, текстовый документ, таблицу или другой объект. Поэтому попросить дать описание изображению или вычленить необходимые данные из файла в принципе не получится.

В-четвертых, модели o1 не интегрированы с системой генерации изображений DALL-E. Это означает, что пользователи не могут использовать o1 для создания или редактирования изображений, что ограничивает возможности модели в области визуального контента.

Кто умнее: ChatGPT-4o или OpenAI o1

Для простых запросов продолжайте использовать модель ChatGPT-4o: она быстрее и лучше умеет в творческие задачи
Для простых запросов продолжайте использовать модель ChatGPT-4o: она быстрее и лучше умеет в творческие задачи

Безусловно, по части интеллекта модель o1 продвинулась гораздо дальше ChatGPT-4o. Но, чтобы ее потенциал раскрылся вам полностью, необходимо уметь правильно обращаться с ней. Если вы просто предоставите нейросети финансовый отчет и напишете что-то вроде “обобщи этот отчет”, скорее всего, вы просто впустую потратите токены, которых и так не очень много. Чтобы ответ нейросети получился по-настоящему ценным, нужны соответствующие уточнения.

Несмотря на то что o1 и ChatGPT-4o - это модели, которые были разработаны OpenAI на базе одних и тех же принципов, по сути, это два совсем разных продукта. Классический чат-бот, который уже знаком нам достаточно давно, представляет собой универсальное решение с ориентацией на самые разные задачи, включая творческие. При этом надо отдавать себе отчет, что ChatGPT-4o закроет потребности 95% пользователей.

Комментарии (1)


  1. Hardcoin
    15.10.2024 09:34

    Ни 4o, ни o1 и близко не стоят, что бы закрыть потребности 95% пользователей. Их потребности, что бы ИИ делал их работу и решал их жизненные задачи, до этого пока далеко. Даже до того, что бы каждый пользовался ИИ так же, как пользуется телефоном, еще пара лет, не меньше.