Новая модель OpenAI o1 очень умна, но иногда старый-добрый ChatGPT-4o оказывается удобнее
Новая модель OpenAI o1 очень умна, но иногда старый-добрый ChatGPT-4o оказывается удобнее

В середине сентября компания OpenAI представила новую языковую модель со скромным названием o1. Несмотря на то, что многие уже догадывались о предстоящем релизе и ожидали настоящего фурора в мире искусственного интеллекта, ничего такого не произошло. Разработчик хоть и заявил, что новый продукт способен к рассуждению на уровне экспертов в различных областях, проверить это на практике оказалось не так-то просто. Неожиданно выяснилось, что o1 не только требует особого подхода к промптингу, но и думает заметно дольше, чем ChatGPT-4o. Так что же делает эту модель такой уникальной и какие перспективы на самом деле она открывает для будущего ИИ? Давайте разбираться.

Что такое OpenAI o1

OpenAI o1 – это новейшая языковая модель, разработанная компанией OpenAI. Ее ключевой особенностью является способность к сложным рассуждениям. Эта модель использует алгоритмы обучения, основанные на реальных рассуждениях и причинно-следственных связях. Такой подход позволяет o1 не просто выдавать готовые ответы, а последовательно выстраивать логические цепочки, имитируя процесс человеческого мышления.

Новая модель представлена в двух версиях: o1-preview и o1-mini. Модель o1-preview предназначена для решения сложных задач, на которые тратится больше времени и токенов, в то время как o1-mini представляет собой более быстрое и экономичное решение. Несмотря на различия, они обе оптимизированы для областей STEM, особенно в программировании и математике.

Посмотрите, насколько ChatGPT-4o отстает от o1 в точных дисциплинах

Несмотря на то что o1 тоже может ошибаться, она буквально рассуждает над вашими запросами. Это требует существенно больше вычислительных ресурсов. Поэтому разработчики установили лимит по количеству обращений. Для o1-mini это 50 запросов в день (в первые дни было 50 запросов в неделю), а для o1-preview - 50 запросов в неделю (было 30 запросов в неделю).

o1 vs ChatGPT-4o: ключевые различия

При сравнении o1 с ChatGPT-4o выявляется ряд существенных отличий:

  • Улучшенные навыки логического мышления и анализа у o1

  • Специализация o1 на точных науках и программировании

  • Более длительное время обработки запросов у o1

  • Превосходство o1 в решении сложных задач программирования

OpenAI заявляет, что база знаний, доступная модели o1, сравнима с уровнем докторов наук в различных научных дисциплинах. Модель не только в курсе сложных концепций в физике, химии, биологии и других науках, но и обладает пониманием их глубинной природы, что позволяет использовать эти знания на практике. Это делает ее полезным инструментом не только для студентов и преподавателей, но и для профессиональных исследователей и ученых.

Другие модели справляются с решением математических задач хуже, чем o1
Другие модели справляются с решением математических задач хуже, чем o1

В математике o1 показывает особенно выдающиеся результаты. Она способна решать задачи уровня американского математического конкурса AIME, входя в топ-500 лучших студентов США. Такой уровень математической подготовки открывает широкие возможности для применения o1 в научных исследованиях и инженерных разработках. А в тестировании по программированию на платформе Codeforces модель o1 достигла рейтинга Эло 1673.

Как работает нейросеть OpenAI o1

Мыслительный процесс o1 не бесплатен. Он основан на использовании токенов, которые модель использует для формирования своих рассуждений. Они расходуются, когда o1 сталкивается с задачей, которая требует не просто готового ответа, а нескольких этапов анализа и рассуждений.

Сначала модель разбивает проблему на составные части, затем исследует каждую из них, используя свою базу знаний. И только после этого она выстраивает логическую цепочку, связывая различные аспекты задачи и формируя последовательное решение.

Из этого проистекают и задачи, которые подходят для выполнения при помощи o1 и которые для этой модели не годятся совсем. Так, если вам нужно расписать план терроформирования на Марсе с учетом научно-обоснованной информации, которая уже изучена человечеством, o1 однозначно подойдет. Но, если вы хотите, чтобы нейросеть расписала план сочинения для 10-классника, то за этим лучше обращаться к ChatGPT-4o.

Тексты ChatGPT-4o по-прежнему пишет лучше, чем o1-preview и o1-mini
Тексты ChatGPT-4o по-прежнему пишет лучше, чем o1-preview и o1-mini

o1 решительно не подходит для простых запросов и творческих задач по следующим причинам:

  • Более длительное время обработки запросов

  • Высокая стоимость эксплуатации

  • Наличие лимитов на использование

  • Склонность к усложнению ответов

  • Неэффективность при решении простых задач

Впрочем, есть и более серьезные недостатки o1, которые могут существенно влиять на применимость модели в определенных сценариях использования.

Во-первых, база знаний моделей o1-preview и o1-mini ограничена временными рамками. Доступная им информация актуальна только до октября 2023 года, что может создавать проблемы при работе с более свежими данными или событиями.

Во-вторых, модели o1 не обладают доступом в интернет. Это означает, что они не могут в реальном времени обращаться к веб-страницам или обновлять свою базу знаний, что ограничивает их способность работать с актуальной информацией.

В-третьих, они неспособны к анализу файлов. В отличие от некоторых других моделей, таких как GPT-4o, o1 не может обрабатывать загруженные пользователем документы или извлекать из них информацию, что может быть критичным для некоторых задач. Вы не сможете загрузить в чат картинку, текстовый документ, таблицу или другой объект. Поэтому попросить дать описание изображению или вычленить необходимые данные из файла в принципе не получится.

В-четвертых, модели o1 не интегрированы с системой генерации изображений DALL-E. Это означает, что пользователи не могут использовать o1 для создания или редактирования изображений, что ограничивает возможности модели в области визуального контента.

Кто умнее: ChatGPT-4o или OpenAI o1

Для простых запросов продолжайте использовать модель ChatGPT-4o: она быстрее и лучше умеет в творческие задачи
Для простых запросов продолжайте использовать модель ChatGPT-4o: она быстрее и лучше умеет в творческие задачи

Безусловно, по части интеллекта модель o1 продвинулась гораздо дальше ChatGPT-4o. Но, чтобы ее потенциал раскрылся вам полностью, необходимо уметь правильно обращаться с ней. Если вы просто предоставите нейросети финансовый отчет и напишете что-то вроде “обобщи этот отчет”, скорее всего, вы просто впустую потратите токены, которых и так не очень много. Чтобы ответ нейросети получился по-настоящему ценным, нужны соответствующие уточнения.

Несмотря на то что o1 и ChatGPT-4o - это модели, которые были разработаны OpenAI на базе одних и тех же принципов, по сути, это два совсем разных продукта. Классический чат-бот, который уже знаком нам достаточно давно, представляет собой универсальное решение с ориентацией на самые разные задачи, включая творческие. При этом надо отдавать себе отчет, что ChatGPT-4o закроет потребности 95% пользователей.

Комментарии (10)


  1. Hardcoin
    15.10.2024 09:34

    Ни 4o, ни o1 и близко не стоят, что бы закрыть потребности 95% пользователей. Их потребности, что бы ИИ делал их работу и решал их жизненные задачи, до этого пока далеко. Даже до того, что бы каждый пользовался ИИ так же, как пользуется телефоном, еще пара лет, не меньше.


    1. saponchik
      15.10.2024 09:34

      А как пользуются телефоном и могли бы пользоваться ии?

      На работе я каждый день использую чатжпт, например


    1. dilukhin
      15.10.2024 09:34

      Речь, видимо, идёт об удовлетворительном решении задачи в 95% случаев обращения пользователя к модели. Не всех мыслимых потребностей.


  1. PDEMON
    15.10.2024 09:34

    4о иногда так мозг делает, что переклбчаешься на о1 и вопрос моментально решается. Потом делаешь всё на о1 и думаешь что уж лучше обратно на 4о)))


    1. Glen5
      15.10.2024 09:34

      У меня такой опыт был, когда с автокадом и солидворкс работал. Сначала делаешь на одном, думаешь второй вообще надо удалять, пока не сталкиваешься с задачей которую можно решить только на втором и так постоянно... Так что это видимо со всеми инструментами/продуктами работает или в каждой нише не было бы по несколько конкурентов.


  1. michael108
    15.10.2024 09:34

    Интересно, а можно ли, например, попросить о1 рассказать, какие рецепторы находятся на поверхности тучных клеток и как эти рецепторы у клеток появляются в процессе их специализации в разных органах?
    В принципе, это все должно быть в существующей научной литеретуре (по крайней мере, значительная часть информации). Соответственно -- вопрос: сможет ли о1 предоставить хотя бы вменяемый набор ссылок на источники, чтобы я смог пройтись по ним? В идеале -- собрать из них информацию в виде отчета.
    В свое вермя я пытался задавать вопросы ChatGPT 3 с просьбой указать ссылки на источники, и там выпадал всякий мусор -- или ссылки были не на то,или вообще не работали.


    1. krote
      15.10.2024 09:34

      Мне кажется что для реально полезных результатов в отдельных областях модель должна проходить файн-тюнинг под нужную специализацию, в данном случае с повышенным содержанием в датасете научных статей и книг, подобно тому как небольшие модели на 7-13b параметров удается улучшить в плане написания кода, дотренировав на данных stackoverflow и т.п.

      Во всяком случае это то, что может быть сделано и делается уже сейчас, не касаясь новых архитектур ИИ которые в разработке.


    1. ngromyko
      15.10.2024 09:34

      Уважаемый пользователь,

      Тучные клетки (мастоциты) являются ключевыми элементами иммунной системы, участвующими в аллергических реакциях, защите от патогенов и заживлении ран. На их поверхности присутствует множество рецепторов, которые позволяют им реагировать на различные стимулы и взаимодействовать с другими клетками.

      Основные рецепторы на поверхности тучных клеток:

      1. Высокоаффинный рецептор к IgE (FcεRI):

      Функция: Связывает иммуноглобулин E (IgE), играя центральную роль в аллергических реакциях типа I.

      Механизм: При повторном контакте с аллергеном связанный IgE приводит к активации тучной клетки и высвобождению медиаторов воспаления.

      2. Рецептор стволового фактора (c-Kit, CD117):

      Функция: Является тирозинкиназным рецептором, необходимым для роста, выживания и дифференцировки тучных клеток.

      Механизм: Взаимодействие со стволовым фактором (SCF) стимулирует пролиферацию и миграцию клеток.

      3. Толл-подобные рецепторы (TLRs):

      Функция: Распознают патогенные микроорганизмы и запускают врожденный иммунный ответ.

      Механизм: Активация TLR приводит к секреции цитокинов и хемокинов.

      4. Рецепторы к цитокинам и хемокинам:

      Функция: Позволяют тучным клеткам реагировать на сигналы от других клеток иммунной системы.

      Примеры: Рецепторы к интерлейкину-4 (IL-4), интерлейкину-5 (IL-5), фактору некроза опухоли α (TNF-α).

      5. Комплементные рецепторы (например, C3aR, C5aR):

      Функция: Участвуют в воспалительных реакциях, связанных с системой комплемента.

      Механизм: Связывание с компонентами комплемента приводит к активации тучных клеток.

      Появление рецепторов в процессе специализации:

      Тучные клетки дифференцируются из предшественников костного мозга и мигрируют в различные ткани, где завершают свое созревание. Экспрессия рецепторов на их поверхности регулируется множеством факторов:

      Генные регуляторы и транскрипционные факторы: Определяют базовую экспрессию рецепторов в зависимости от стадии развития клетки.

      Микроокружение тканей: Локальные цитокины и факторы роста могут усиливать или подавлять экспрессию определенных рецепторов.

      Антигенная нагрузка: В органах, подверженных воздействию аллергенов, может наблюдаться повышенная экспрессия FcεRI.

      В различных органах тучные клетки адаптируются к специфическим функциональным требованиям, что отражается в вариациях экспрессии рецепторов. Например, в коже тучные клетки могут иметь более высокую экспрессию рецепторов, связанных с защитой от внешних патогенов.

      Рекомендуемая литература для дальнейшего изучения:

      1. Galli, S. J., Grimbaldeston, M., & Tsai, M. (2008). Immunomodulatory mast cells: negative, as well as positive, regulators of immunity. Nature Reviews Immunology, 8(6), 478–486.

      https://doi.org/10.1038/nri2320

      2. Metcalfe, D. D., Mekori, Y. A., & Rottem, M. (1997). Mast cell ontogeny and apoptosis. Experimental Dermatology, 6(5), 233–239.

      https://doi.org/10.1111/j.1600-0625.1997.tb00171.x

      3. Gilfillan, A. M., & Beaven, M. A. (2011). Regulation of mast cell responses in health and disease. Critical Reviews in Immunology, 31(6), 475–529.

      https://doi.org/10.1615/CritRevImmunol.v31.i6.20

      4. Rao, K. N., & Brown, M. A. (2008). Mast cells: multifaceted immune cells with diverse roles in health and disease. Annals of the New York Academy of Sciences, 1143, 83–104.

      https://doi.org/10.1196/annals.1443.023

      5. Theoharides, T. C., & Kalogeromitros, D. (2006). The critical role of mast cells in allergy and inflammation. Annals of the New York Academy of Sciences, 1088, 78–99.

      https://doi.org/10.1196/annals.1366.058

      Заключение:

      Предоставленная информация и литература помогут вам глубже понять, какие рецепторы присутствуют на поверхности тучных клеток и как их экспрессия регулируется в процессе специализации в различных органах. Для более детального изучения рекомендуется ознакомиться с указанными научными статьями.

      Если вам нужна до

      полнительная помощь в составлении отчета или разборе материалов, пожалуйста, сообщите.


      1. Dialogus
        15.10.2024 09:34

        Как и стоило ожидать, все описания к ссылкам и авторы выдуманы нейросетью, достаточно открыть любой URL.


    1. dilukhin
      15.10.2024 09:34

      GPT в принципе не рассчитана на поиск, это сочинялка. Её можно попросить не сочинять, но это как попросить лошадь не трясти. Она постарается, но получится плохо. Для поиска источников, для выдачи достоверной информации нужна другая архитектура, типа Bert например.