Это самое крупное обновление ChatGPT
Это самое крупное обновление ChatGPT

В середине мая компания OpenAI представила новую версию самой популярной и хайповой нейросети в мире. Продукт получил название ChatGPT-4o, сохранив порядковый номер своего предшественника. Несмотря на это, чат-бот не только стал быстрее обрабатывать информацию, но и получил поддержку мультимодальности, и это буквально все изменило.

Буква "o" в названии ChatGPT-4o расшифровывается как "omni" и указывает на универсальность нейросети. Теперь чат-бот способен воспринимать информацию различных типов одновременно и отвечать пользователю, генерируя текст, озвучивая его, создавая изображения и т.д.

Благодаря поддержке мультимодальности нейросеть ChatGPT-4o получила целый ряд новых интересных функций.

Работа с изображениями

  • Распознавание и детальное описание содержимого изображений

  • Перевод текста, присутствующего на изображениях

  • Ответы на вопросы, связанные с визуальным контентом

  • Генерация изображений по текстовому описанию

Работа с видео

  • Понимание происходящего на видео без звука по визуальному ряду

  • Распознавание отдельных предметов на видео

  • Умение генерировать видео, включая трехмерные, по текстовому описанию

  • Способность комментировать то, что снимает камера, в реальном времени (актуально для незрячих)

  • Сжимание видео и пересказ

Работа с аудио

  • Распознавание и транскрибирование речи в реальном времени (задержка около 0,3 сек)

  • Генерация речи с разными эмоциональными оттенками и интонациями

  • Определение эмоций по голосу человека

Совмещение модальностей

  • Одновременная работа с текстом, изображением, аудио в рамках одного запроса

  • Например, можно задать вопрос по картинке, а ответ получить в виде аудиосообщения

Контекстное понимание

  • Модель учитывает предыдущий контекст беседы при обработке новых данных

  • Способна вести последовательный диалог на протяжении нескольких минут

Продвинутая работа с языками

  • GPT-4o может помочь вам в изучении более 50 иностранных языков

  • Может работать в качестве синхронного переводчика в диалоге

  • Понимает шутки на разных языках и определяет контекст беседы по интонации, например, иронию или сарказм

Распознавание текста на картинках в ChatGPT-4o

Мне стало интересно, насколько хорошо нейросеть умеет в распознавание. Поэтому на первом этапе я решил не жестить и попросил нейросеть перевести меню ресторана, данное на иврите, на русский язык. Я обращался к ней с компьютера, который вы всегда можете купить в магазине XCOM-SHOP.RU.

Разобраться в меню без переводчика будет проблематично
Разобраться в меню без переводчика будет проблематично

Результат не заставил себя ждать. Спустя всего несколько секунд я получил полный перечень блюд с разбивкой по разделам:

Все меню не уместилось в один экран
Все меню не уместилось в один экран

Затем я попросил нейросеть посоветовать мне что-то из блюд, указав, что я очень голоден, и получил вот такой ответ:

Хороший совет, принимается
Хороший совет, принимается

Достойно, но и задача, прямо скажем, была не очень сложной. Мне захотелось проверить, сможет ли ChatGPT-4o распознать врачебный почерк. 

В целом, даже без нейросети понять врачебный почерк можно без особого труда: тут он довольно разборчив
В целом, даже без нейросети понять врачебный почерк можно без особого труда: тут он довольно разборчив

Поэтому я взял первую попавшуюся справку из интернета и предложил расшифровать ее двум конкурирующим нейросетям - ChatGPT-4o и Claude3.

Вот что из этого получилось:

Результат расшифровки мог быть и получше
Результат расшифровки мог быть и получше

К сожалению, обе нейросети практически не справились, или справились, но плохо. ChatGPT-4o правильно определил ФИО и возраст пациента, понял, что он здоров, и на этом все. Номер справки, дату выписки, специализацию врача, проводившего осмотр, и т.д., и т.п. он либо не определил, либо определил неверно.

Расшифровщик из Claude3 так себе
Расшифровщик из Claude3 так себе

Claude3, который так все хвалят, впрочем, справился еще хуже. Он почему-то решил предложить расшифровку в описательном виде, но оставим это на его усмотрение. Куда важнее, что он не смог определить верно ни одного факта, описанного в справке, кроме ФИО пациента. Мало того, что в ряде случаев он неверно распознал информацию, так часть еще и просто додумал самостоятельно.

Я хотел, чтобы получилось примерно вот так
Я хотел, чтобы получилось примерно вот так

В пресс-релизе OpenAI уделяет большое значение способности ChatGPT-4o совмещать изображения с текстом. Якобы поэтому теперь текстовое содержимое на генерируемых нейросетью картинках выглядит полноценно как с точки зрения грамотности, так и начертания. Например, теперь вы можете попросить ее нарисовать рисунок и разместить внутри конкретный текст.

Я попросил ChatGPT-4o нарисовать робота, который пишет этот самый текст. Вот что у меня получилось в итоге:

Так себе рисунок, будем честны, но и промпт, который я использовал, очень ограничен
Так себе рисунок, будем честны, но и промпт, который я использовал, очень ограничен

Справедливости ради, я составлял запросы по-разному, переходя с русского на английский и наоборот, но ничего не получилось. Из-за этого может сложиться впечатление, что обновление не является таким уж масштабным. Но на самом деле все эти проверки - полная глупость, потому что произошедшие изменения куда более глобальны и не сводятся только к распознаванию врачебного почерка.

Скорость генерации контента в ChatGPT-4o

Бенчмарки не всегда бесполезны
Бенчмарки не всегда бесполезны

Несмотря на вялое начало знакомства с ChatGPT-4o, могу подтвердить, что скорость ответов нейросети возросла очень и очень заметно. Она будет отвечать вам примерно так же быстро, как отвечал бы живой человек, если бы вы строили диалог с ним. Причем очевиднее всего это становится при вербальном общении, то есть голосом.

По заявлениям OpenAI, средняя задержка при распознавании ChatGPT-4o голосовых запросов составляет всего 0,3 секунды. Ускорение произошло за счет унификации методики распознавания. Сильнее всего это заметно на примере взаимодействия голосом. Правда, проверить это можно исключительно в приложении на смартфонах, которые вы можете купить в XCOM-SHOP.RU.

Две предыдущие итерации ChatGPT использовали последовательность из трех отдельных моделей для преобразования речи в текст, обработки текста и обратного преобразования в речь. В отличие от них, GPT-4o представляет собой единую модель, обученную на тексте, изображениях и аудио одновременно.

Такой подход позволяет ChatGPT не терять значительные объемы информации на этапе обработки, как это происходило с GPT-3.5 и GPT-4, которые не могли напрямую учитывать интонации, фоновые шумы, а также генерировать смех, пение или эмоциональную речь. GPT-4o решает эту проблему благодаря единой архитектуре в рамках целостной нейронной сети.

Повышение скорости обработки данных произошло на всех уровнях и привело к тому, что ChatGPT-4o стал расходовать меньше токенов - базовой единицы, на которую разбиваются текстовые запросы для обработки нейросетью. Например, русский язык теперь тратит примерно вдвое меньше токенов, а хинди - втрое.

При этом сохраняется возможность работы с большими объемами данных. На практике это выливается в способность нейросети поддерживать голосовой диалог в течение 7 минут, оставаясь в контексте. Обычные голосовые ассистенты, с которыми мы знакомы, обычно теряют нить разговора уже после 3-4 вопросов и замолкают.

ChatGPT-4o как замена Siri, Google Assistant и Алисы

Выберите голос и тембр, которые вам по вкусу
Выберите голос и тембр, которые вам по вкусу

Фактически OpenAI уже сделала первый шаг в сторону превращения чат-бота в полноценного ассистента вроде Siri или Google Assistant, только более высокого уровня. Уже на этом этапе уровень распознавания речи и генерация голосовых ответов в реальном времени делает из GPT-4o невероятно полезного помощника.

  • Во-первых, мне очень понравилась возможность выбрать голос, которым нейросеть будет со мной разговаривать.

  • Во-вторых, сама методика генерации речи сильно напоминает то, как говорит человек. Если Алиса от Яндекса - при всех ее плюсах - говорит где-то даже слишком академично, ChatGPT-4o нарочито растягивает слова, из-за чего создается полное впечатление, что говоришь с реальным человеком.

  • В-третьих, ChatGPT-4o почти не задумывается над ответами. Мне кажется, это как раз та длительность пауз, которая оптимальна для имитации человеческой речи. Они не слишком длинные, но и не слишком короткие. Чат-бот не перебивает вас.

Я разговаривал с ChatGPT-4o на разные темы, просил посоветовать мне машину, спрашивал, что приготовить на ужин, как помочь ребенку с уроками, и ни одна из тем не вызвала у него затруднений. Я как будто реально общался с живым человеком, который не только рад со мной поболтать, но еще и отлично разбирается в предмете.

Но он может не только вести диалог, улавливая контекст, но и самым непосредственным образом способствовать решению многих задач.

Тот самый черный кружок в окне - это и есть ChatGPT-4o. В таком режиме он сможет видеть все, что происходит на экране
Тот самый черный кружок в окне - это и есть ChatGPT-4o. В таком режиме он сможет видеть все, что происходит на экране

В этом смысле наиболее широкие возможности для взаимодействия предлагает приложение. Оно есть как для мобильных платформ, так и для для macOS. Помимо интуитивного и удобного интерфейса для взаимодействия с чат-ботом, программа предлагает ряд дополнительных возможностей, которых нет в веб-версии:

  1. Возможность поделиться экраном и обрабатывать визуальную информацию, которая на нем отображается.

  2. Синхронизация истории диалогов между устройствами, так что можно продолжить общение с ChatGPT с того места, где остановились на другом девайсе.

  3. Быстрое и своевременное распространение обновлений с новыми моделями и возможностями ChatGPT.

  4. Распознавание голосовых команд и ведение вербальных диалогов.

  5. Возможность загружать различные файлы, документы, таблицы, куски программного кода и т.д.

Причем зачастую вы можете даже не загружать данные в GPT. Возможность видеть содержимое экрана является главной фишкой приложения независимо от платформы. Просто у десктопной версии есть ориентация на работу с видимой частью рабочего стола, и это очень облегчает многие задачи. На презентации нам даже показали, как ChatGPT-4o анализирует некий проект и помогает разработчику. Нейросеть ищет ошибки, закрывает скобки и делает всю ту грязную работу, пренебрегать которой нельзя и от которой зависит успех конечного продукта.

ChatGPT-4o в iOS 18

Доступ к приложениям позволяет подключать нейросеть к совместной работе над документами, презентациями и другим мультимедийным контентом. Именно этими навыками чат-бота, по слухам, и хочет воспользоваться Apple, которая якобы уже заключила договор с OpenAI об использовании ChatGPT в iOS 18. Это должно сделать общение с Siri более естественным и человекоподобным. Ассистент Apple сможет лучше понимать контекст вопросов, давать более осмысленные и развернутые ответы.

Кроме Siri, возможности GPT-4o можно интегрировать и в другие стоковые приложения iOS: Заметки, Почта, Фото и т.д. К примеру, в Заметках GPT-4o может помочь с написанием и редактированием текстов, в Почте - с умной сортировкой и ответами, в Фото - с распознаванием объектов и описанием изображений.

С внедрением GPT-4o Apple также сможет реализовать совершенно новые функции с элементами искусственного интеллекта в iOS. Например, универсальный мультимодальный переводчик, помощник с распознаванием объектов дополненной реальности, генератор контента и многое другое.

Стоимость ChatGPT-4o: сколько стоит подписка

Одной из радостных новостей, связанных с релизом ChatGPT-4o, стало снижение его цены. Однако, если открыть сайт chat.openai.com и перейти в раздел оформления подписки, то довольно быстро станет ясно, что она стоит те же самые 20 долларов, которые просили за доступ к нейросети и раньше. 

Обычная подписка на один аккаунт ChatGPT-4o стоит 20 долларов
Обычная подписка на один аккаунт ChatGPT-4o стоит 20 долларов

Все потому, что снижение цены затронуло только API для сторонних разработчиков, которые используют чат-бота в своих сервисах. Они не платят фиксированную стоимость. Для них она рассчитывается, исходя из количества потраченных токенов, которые исчисляются миллионами. Раньше OpenAI брала за каждый миллион токенов 14 долларов США. Теперь эта цифра уменьшилась вдвое, и разработчики будут должны платить всего 7 долларов.

Тут, в общем-то, все просто. Выше мы говорили о том, что ChatGPT-4o стал тратить меньше токенов на обработку команд на многих языках мира. В ряде случаев затраты снизились в 2-3 раза. Такой подход позволяет OpenAI экономить ресурсы, а значит, компания может позволить себе распространять свой продукт дешевле.

Комментарии (107)


  1. Zara6502
    23.05.2024 06:23
    +2

    расскажите есть ли какой-то доступ бесплатный для рядового пользователя из РФ к этому чуду, пусть даже с ограничением запросов в сутки? Мне писали про РОЕ и еще какие-то варианты, то ничего не сработало.


    1. AlexB17
      23.05.2024 06:23
      +1

      Любой VPN и логин через гугл аккаунт.


      1. Zara6502
        23.05.2024 06:23

        С разных провайдеров, с разными VPN и без VPN


        1. me21
          23.05.2024 06:23
          +1

          Только что проверил с телефона Хуавей, с аккаунтом, зарегистрированным на яндексовскую почту:

          Hidden text

          Единственное но - вместо более-менее известных провайдеров VPN был личный на арендованном сервере.

          Попробуйте почистить куки.


          1. Zara6502
            23.05.2024 06:23

            а chatgpt.com это же совсем не chat.openai.com


            1. GennPen
              23.05.2024 06:23
              +1

              chat.openai.com сейчас редиректит на chatgpt.com


              1. Zara6502
                23.05.2024 06:23

                хм, а мне сказали что это что-то левое, типа проверяй по ответу "какая модель используется", мол у реального chatgpt формат ответа другой. в общем я как-то подзапутался уже со всем этим, современный интернет без поллитра не разобрать.


                1. GennPen
                  23.05.2024 06:23

                  Ну, можно работать напрямую с API OpenAI, например поставить LibreChat. Но нужно заморачиваться с оплатой сервиса(есть способы). Нужно один раз заморочиться с установкой LibreChat на VPS/VDS.

                  Но зато будет полный контроль над выбором модели и прочих параметров. Не будет часовых лимитов.


                  1. Zara6502
                    23.05.2024 06:23

                    с оплатой

                    я же про бесплатно пишу

                    Но зато будет полный контроль над выбором модели и прочих параметров

                    мне это не нужно


                    1. GennPen
                      23.05.2024 06:23

                      Бесплатно могу посоветовать https://groq.com/, там бесплатные лимиты очень даже неплохие, llama3 очень хороша. Но не работает в РФ, на бесплатных VPN не знаю как будет работать.


                      1. Zara6502
                        23.05.2024 06:23

                        https://groq.com/

                        это не работает


                      1. jhas7
                        23.05.2024 06:23

                        Эммм, если даже лама сойдет тогда полно вариантов. В телеграме пиши боту https://t.me/kun4sun_bot


                      1. Zara6502
                        23.05.2024 06:23

                        нет, нужен именно chatgpt4 от openai


                  1. RingilNill
                    23.05.2024 06:23

                    А вот раз упомянули LibreChat…
                    Вопрос такой, если им пользуетесь

                    Насколько осмысленно развернуть его и платить за API?
                    Я просто в раздумьях за Claude или ChatGPT заплатить, так как и на бесплатных версиях убедился, что они могут эффективно мне помогать
                    Но учитывая мою работу(админ старой школы, девопс, SRE) мне развернуть LibreChat не сложно, благо своих серверов у меня хватает именно своих для личных проектов

                    И вот тут вопрос и вылезает
                    Нужно ли сильно будет вникать в игру с весами и прочим, или можно просто поставить LibreChat, купить запросы к API и спокойно юзать 4ку не думая ни о чем
                    Понятно, что скорее всего финансово это выгодней, не так много я делаю запросов, что бы сжирать токенов больше чем на 20ку в месяц, скорее выйдет меньше. Но вопрос в том придется ли вникать дополнительно(на что может просто не быть времени) или дефолты вполне рабочие?


                    1. GennPen
                      23.05.2024 06:23

                      Работать напрямую с API в любом случае выгодней, даже не смотря на комиссию примерно 30% на пополнение через другие сервисы. Платишь за фактическое использование запросов, даже если пара запросов в месяц - остаток не сгорает на балансе. Ну, если вы не будете кормить его огромными ветками истории сообщений.

                      Дефолтные параметры вполне рабочие. Основное что меняется: температура - влияет на разнообразность ответов, промпт - от него очень сильно зависит как будет работать модель (на счет этого проще в инете почитать), кол-во токенов - для ограничения контекста и ответа.

                      Ну и плюс LibreChat в том, что он все запросы пропускает через себя, можно поставить на зарубежный хостинг и не возиться с переключением VPN. Естественно в таком случае нужно получше настроить авторизацию.


                    1. jhas7
                      23.05.2024 06:23

                      Если 4ка это гпт4 то для чата через апи это вообще не вариант, слишком дорого получается, что то типа 50 центов за каждый запрос, даже за простое привет-пока, а если в нее большие куски текста кидать(код например) то за 1 запрос может и 2 бакса получится.

                      Если покупать и активно юзать то более менее терпимые только самые дешевые модели, хайку и джемени флеш.

                      При этом все эти боты так или иначе доступны абсолютно бесплатно на своих сайтах или поблизости. ГПТ4 турбо например дают на сайте coze.com


                      1. GennPen
                        23.05.2024 06:23
                        +1

                        что то типа 50 центов за каждый запрос

                        Что то вы переборщили с ценами.

                        Даже на максимальном кол-ве токенов: gpt-4, максимум 8192 токена, 30 баксов за 1млн. исходящих токенов - около 24 центов за максимальный запрос.
                        И это не "за каждый запрос", а за запрос с огромным контекстом. Для примера, у меня беседа примерно на 10 страниц русского текста заняла примерно 4к токенов, а русский текст занимает примерно в 2 раза больше токенов чем английский.

                        Да и gpt-4o стоит гораздо дешевле.


                      1. jhas7
                        23.05.2024 06:23

                        Моделька gpt4-8к для чата это очень мало.

                        Gpt4-32k стоит 60 долларов за миллион токенов. Это 1.92$ за 32к токенов запрос, не учитывая исходящие а они стоят в 2 раза дороже, но их мало обычно.

                        В чате такие цифры достигаются легко, кидаешь в чат код размером 10к символов и просишь исправить, получаешь в ответ что то, потом кидаешь обратно лог с ошибкой на 10т символов, получаешь в ответ что то и вот ты сделал всего 2 запроса а в памяти уже торчит почти 32т символов. Это еще не 32т токенов но близко.

                        Gpt-4о дешевле но это опасная дешевизна, там окно намного больше и отвечает(жрет токены) он намного быстрее.


                      1. GennPen
                        23.05.2024 06:23

                        Не мне вас переубеждать.

                        Я не вижу смысла использовать дорогой gpt-4, когда есть лучше и дешевле gpt-4o, к тому же у него более свежая база.

                        И да, нужно ограничивать ответ в кол-ве токенов чтобы он не выдавал длиннющую портянку текста в ответ.


                      1. jhas7
                        23.05.2024 06:23

                        Про гпт-4о я согласен.Он намного дешевле и быстрее. С ним каждый запрос в чатик будет стоить около 10 центов (если в памяти торчит ~20т символов). По мне так это тоже очень много.

                        У гугл джемини в бесплатных апи ключах сейчас лимит 1млн токенов в... минуту. И 1500 запросов в сутки на один ключ.


                      1. GennPen
                        23.05.2024 06:23

                        У гугл джемини в бесплатных апи ключах сейчас лимит 1млн токенов в... минуту. И 1500 запросов в сутки на один ключ.

                        Да, только Gemini 1.5 недоступен в EU:

                        *Free tier is not available in EEA (including EU), UK and CH.

                        Да и он отмечен как "Preview", так что может поменяться в любую сторону.


                1. Dolios
                  23.05.2024 06:23

                  В левом нижнем углу кнопку "Upgrade plan" нажмите, там написано, какая модель используется.

                  Скрин

                  Бесплатный ГптЧо работает до какого-то количества запросов в сутки.


                  1. Zara6502
                    23.05.2024 06:23

                    у меня нажимать нечего так как просто ничего не работает.


                    1. Dolios
                      23.05.2024 06:23
                      +2

                      Вы мне напоминаете бухгалтера с моей первой работы эникеем. Что именно у вас не работает? Вы зарегистрировались на chatgpt.com, зашли и у вас нет этой кнопки? Или она не нажимается?


                      1. Zara6502
                        23.05.2024 06:23

                        а вы мне напоминаете человека который открывает книгу на последней странице, читает что "Гарри убил Эллен" и начинаете многозначительно удивляться, что за Гарри? Кто такая Эллен?

                        Есть скрины, есть текст, смотрите, читайте, осмысливайте.


                      1. Dolios
                        23.05.2024 06:23

                        Подите в член. Вам помогают, а вы в ответ выёживаетесь. Что просто говорит о том, что вам не нужен ответ на вопрос, вам нужно поныть. Как обычно, впрочем.


                      1. Zara6502
                        23.05.2024 06:23

                        и где я выеживался? я дал ответы на все ваши вопросы, если вы не следите за темой а читаете только то что интересно лично вам - ну читайте, только не удивляйтесь что перед вами не будут кланяться.


                  1. Mes
                    23.05.2024 06:23

                    Похоже, не на все регионы раскатали новую фичу


        1. GennPen
          23.05.2024 06:23

          Не используйте общедоступные VPN, возьмите самый дешевый VPS/VDS.


          1. Zara6502
            23.05.2024 06:23

            это уже выпадает из категории бесплатного


            1. GennPen
              23.05.2024 06:23
              +18

              Тогда остается только страдать.


            1. monowar
              23.05.2024 06:23
              +4

              Тогда только разговор с живым человеком.


              1. Zara6502
                23.05.2024 06:23

                это очень оптимистично )


        1. whoisking
          23.05.2024 06:23

          Это приложение или сайт? Приложение (андроид) проверяет, работает ли впн и не пускает, а с сайтом ок через впн


          1. Zara6502
            23.05.2024 06:23

            сайт, мобилками не пользуюсь в таком ключе


        1. gluki
          23.05.2024 06:23

          Хожу через "Opera VPN": https://github.com/Snawoot/opera-proxy


        1. cat024
          23.05.2024 06:23
          +1

          Browsec расширение и всё работает, через Planet VPN тоже...


          1. Zara6502
            23.05.2024 06:23

            с Browsec помогло, спасибо.


        1. li_0_li
          23.05.2024 06:23

          Привязываете к иностранному номеру + привязка гугл аккаунта. Номер можно арендовать. Далее через впн


          1. Zara6502
            23.05.2024 06:23

            Номер можно арендовать


        1. Kiridan
          23.05.2024 06:23

          Если стоит прокси вроде антизапрета, то лучше отключить на всякий случай.

          У меня через openVPN всё безупречно работает.


    1. theurus
      23.05.2024 06:23

      openrouter.ai

      даже без логина работает

      ну разумеется только чатик, без звука видео и картинок


      1. Zara6502
        23.05.2024 06:23

        даже без логина работает

        У меня требует логин, после логина на первое же сообщение пишет что не хватает токенов.


      1. Zara6502
        23.05.2024 06:23


    1. Vasjen
      23.05.2024 06:23
      +1

      Если нужно за 0 рублей. Находишь человека (желательно вне ИТ), которому не проблема оплатить ~5евро за VDS. Рассказываешь ему о приятном будущем, которое можно потрогать уже сейчас, и готов организовать ему доступ и поддержку работоспособности в замен на совместное использование. Арендуешь VDS, разворачиваешь либо это, либо это, либо еще что-то из этого. Или просто ставишь VPN и ходишь в бесплатный ChatGPT. И пользуешься за бесплатно.


      1. Zara6502
        23.05.2024 06:23

        мне проще ничего не делать вообще, раз уж это так сложно.


        1. Dolios
          23.05.2024 06:23
          +2

          Вы тут столько времени уже потратили, жалуясь на то, как всё сложно, что можно было 5 раз уже всё сделать за это время :)


          1. GennPen
            23.05.2024 06:23

            Сэкономить пачку сигарет или пару банок пива, закинуть сотку-другую на сервис типа gptunnel. Ну это маленькое зеленое существо душит.

            Хотя, если именно chatgpt нужен, то придется побольше заморочиться.


            1. Zara6502
              23.05.2024 06:23

              пиво не пью, сигареты не курю, но спасибо что за меня решили как и куда мне деньги тратить.


          1. Zara6502
            23.05.2024 06:23

            да я уже давно всё сделал, просто вам забыл сообщить


            1. GeorgeOvechkin
              23.05.2024 06:23
              +3

              Эталонная пассивная агрессия


              1. Zara6502
                23.05.2024 06:23

                это ответ на агрессию, попу с пальцем не путайте


    1. HireHoffee
      23.05.2024 06:23
      +2

      прописать в настройках dns браузера "https://dns.controld.com/comss" и можно заходить без проблем и без ВПН.


      1. GennPen
        23.05.2024 06:23

        И как смена днс поможет в обходе блокировки на стороне сервиса?


        1. HireHoffee
          23.05.2024 06:23
          +2

          я не силен в технических деталях, просто недавно увидел способ, где говорилось что при смене днс в браузере можно без впн заходить на сайты многих заблокированных нейросеток, попробовал сменить и, по крайней мере у меня, это работает.


      1. foxyrus
        23.05.2024 06:23

        Работает!


    1. aronsky
      23.05.2024 06:23

      Ответ, который вас устроит: бесплатно вы это не попробуете. Нужно будет вложить либо усилия, либо деньги. И в первом и во втором случае - минимальные. Если не подходит - вам это не нужно: это для избалованных буржуев, что-то вроде рябчиков, Петрович шарит за машины реально (и это не сарказм сейчас) лучше, чем чатжипитишечка и сделает ликбез бесплатно, а не за рубли. Рубли лучше потратить на жигулевское.


      1. Zara6502
        23.05.2024 06:23

        бесплатно вы это не попробуете

        Дак уже всё замечательно работает.

        Нужно будет вложить либо усилия, либо деньги

        Не нужно, всё сделал в 2 клика.


  1. net_racoon
    23.05.2024 06:23

    В ИТ уже можно не ходить?


    1. smind
      23.05.2024 06:23

      Ходить, что то по итогам недели или двух (не помню когда он там вышел) ощущение что он потупел по сравнению с 4х.


      1. Alohahwi
        23.05.2024 06:23
        +15

        потупел по сравнению с 4х

        Выражайтесь корректно, вышел на уровень пользователей


      1. net_racoon
        23.05.2024 06:23

        Дык может еще научится :)


  1. Wiggin2014
    23.05.2024 06:23

    Не умеет оно видео делать, не придумывайте
    Не умеет оно видео делать, не придумывайте
    Не умеет оно видео делать, не придумывайте


    1. VPryadchenko
      23.05.2024 06:23
      +1

      Ровно как и картинки генерит через dall-e по-прежнему. По крайней мере в браузере и в андроид приложении.


      1. AcckiyGerman
        23.05.2024 06:23

        Мне кажется он рисует в mermaid (язык диаграмм для встраивания в markdown), ибо у меня по запросу "нарисуй большого слона" получилось вот такое:

        P.S.

        Слон получился уж очень схематичный, ты можешь нарисовать слона с использованием dall-e ?

        ChatGPT:

        Я не могу напрямую использовать DALL-E или другие внешние инструменты для генерации изображений, но я могу предложить вам альтернативу. Вы можете использовать платформы, такие как OpenAI DALL-E или другие генераторы изображений, чтобы создать изображение сильного слона. Вот пример команды, которую можно использовать с DALL-E:


      1. nidalee
        23.05.2024 06:23

        Мне даже картинки генерировать отказывается, просто рассказывает, как это сделать самому.


      1. darthmaul
        23.05.2024 06:23

        Так и есть. И голосовые функции работают через внешнюю распознавалку. Ни одну из фич, ппоказанных на презентации, не выложили в общий доступ, нынчне ГПТ-4о это просто слегка обновлённая ГПТ-4 турбо. Суда по повышенной скорости, вероятно, омни ещё и урезали по кол-ву параметров.


        1. HappyLynx
          23.05.2024 06:23

          Выложили, но только 2 фичи. Распознавание картинок и генерацию текста. Всё остальное - старое.


  1. GennPen
    23.05.2024 06:23

    Одной из радостных новостей, связанных с релизом ChatGPT-4o, стало снижение его цены. Однако, если открыть сайт chat.openai.com и перейти в раздел оформления подписки, то довольно быстро станет ясно, что она стоит те же самые 20 долларов, которые просили за доступ к нейросети и раньше. 

    Снижение цены имелось в виду по API (Pricing | OpenAI). И цена действительно ниже в два раза чем "gpt-4-turbo".


    1. jhas7
      23.05.2024 06:23
      +2

      Закупаться можно и не напрямую. На openrouter.ai gpt-4o стоит 5$ за 1млн токенов, гпт4-турбо 10$. Вдвое дешевле.


  1. letster
    23.05.2024 06:23
    +12

    Очень странно, но текст меню на иврите не соответствует тому, что показано как перевод на русский.


    1. Shaginov
      23.05.2024 06:23
      +1

      У меня он вообще наглючил вот такое:

      Конечно, вот перевод меню на русский язык:

      Киши:

      • Брокколи с мясом - 80 ₪ за единицу

      • Киш с курицей - 70 ₪ за единицу

      • Мясной - 70 ₪ за единицу

      • Ассорти овощи - 70 ₪ за единицу

      • Киш с вялеными помидорами - 70 ₪ за единицу

      Пироги:

      • Тесто Фило с мясом - 60 ₪ за единицу

      • Тесто Фило с сыром - 60 ₪ за единицу

      • Тесто Фило с грибами и сыром - 60 ₪ за единицу

      • Слоеное тесто с курицей - 70 ₪ за единицу

      • Слоеное тесто с картофелем и грибами - 60 ₪ за единицу

      • Слоеное тесто с сыром и шпинатом - 60 ₪ за единицу

      • Тесто Фило с картофелем - 60 ₪ за единицу

      • Тесто Фило с яблоками и медом - 60 ₪ за единицу

      • Слоеное тесто с творогом - 70 ₪ за единицу

      • Тесто Фило с маком - 60 ₪ за единицу

      • Тесто Фило с капустой - 70 ₪ за единицу

      • Слоеное тесто с мясом - 60 ₪ за единицу

      • Тесто Фило с вишней и кремом - 80 ₪ за единицу

      Котлеты и крокеты:

      • Мясные котлеты - 10 ₪ за единицу

      • Куриные крокеты - 10 ₪ за единицу

      • Крокеты из индейки - 10 ₪ за единицу

      • Крокеты из баклажанов - 10 ₪ за единицу

      • Крокеты из картофеля - 10 ₪ за единицу

      • Крокеты из лосося - 12 ₪ за единицу

      Булочки:

      • Мясные булочки - 6 ₪ за единицу

      • Булочки с сыром - 6 ₪ за единицу

      • Булочки с помидорами - 6 ₪ за единицу

      • Булочки с картофелем и шпинатом - 6 ₪ за единицу

      • Булочки с тыквой - 6 ₪ за единицу

      • Булочки с финиками - 6 ₪ за единицу

      • Булочки с яблоками - 6 ₪ за единицу

      • Булочки с инжиром - 6 ₪ за единицу

      • Булочки с мёдом и орехами - 6 ₪ за единицу

      • Булочки с сыром и укропом - 6 ₪ за единицу

      • Булочки с кунжутом - 6 ₪ за единицу

      • Булочки с шоколадом - 6 ₪ за единицу

      • Слоеные булочки с ванильным кремом - 50 ₪ за кг

      • Слоеные булочки с шоколадным кремом - 60 ₪ за кг

      Фритюр:

      • Мясные пирожки - 8 ₪ за единицу

      • Пирожки с курицей - 8 ₪ за единицу

      • Пирожки с картошкой - 8 ₪ за единицу

      • Пирожки с грибами - 8 ₪ за единицу

      • Пирожки с сыром - 8 ₪ за единицу

      • Пирожки с мясом - 8 ₪ за единицу

      • Пирожки с яблоками - 8 ₪ за единицу

      • Пирожки с вишней - 8 ₪ за единицу

      • Пирожки с шоколадом - 8 ₪ за единицу

      • Пирожки с маком - 8 ₪ за единицу

      • Пирожки с изюмом - 8 ₪ за единицу

      • Пирожки с орехами - 8 ₪ за единицу

      • Пирожки с картошкой и грибами - 10 ₪ за единицу

      Цибурек:

      • Мясные чебуреки - 10 ₪ за единицу

      • Чебуреки с картофелем - 10 ₪ за единицу

      • Чебуреки с сыром - 10 ₪ за единицу

      • Чебуреки с зеленью - 10 ₪ за единицу

      • Чебуреки с картофелем и зеленью - 12 ₪ за единицу

      Киш ассорти:

      • Киш ассорти - 80 ₪ за единицу

      • Киш с вялеными помидорами - 70 ₪ за единицу

      • Киш с мясом и сыром - 70 ₪ за единицу

      • Киш с картофелем и грибами - 70 ₪ за единицу

      • Киш с курицей и овощами - 70 ₪ за единицу

      • Киш с картофелем и сыром - 70 ₪ за единицу

      • Киш с мясом и картофелем - 70 ₪ за единицу

      Вегетарианские блюда:

      • Салаты - 40 ₪ за кг

      • Киш с сыром - 60 ₪ за единицу

      • Киш с помидорами и сыром - 70 ₪ за единицу

      • Киш с картофелем и сыром - 70 ₪ за единицу


  1. guliverza
    23.05.2024 06:23
    +1

    Не понимаю, почему так с этим chatgpt носятся (использовал GPT-4o)
    Он не может сказать, как звали тёщу Ричарда Львиное сердце,
    не может рассчитать налог на автомобиль (в Латвии),
    даже не может с сайта латвийских гос услуг правильно скопировать таблицу для этого рассчёта.
    Не может рассчитать, как надо было сыграть сборной Латвии по хоккею, чтобы выйти из группы, когда у них было 9 очков, а у Словакии и Германии по 12. (оставалась 1 игра, за победу в основное время дают 3) и учесть, чем закончились личные встречи, если очков поровну.
    График сжатия воды(в зависимости от давления) он нарисвал линейный и так, что объём воды ушёл в минус.
    Выше пишут, что текст меню с иврита неправильно перевёл)

    Всё на что он годится это более удобный поиск, и то потом перепроверять надо, а то ведь мог и сгаллюцинировать.


    1. morr
      23.05.2024 06:23
      +16

      отвечаю с точки зрения программиста

      для меня как разработчика, он упрощает рутинные действия. изучаю новый язык - получаю непонятную ошибку, вместо гугления и перебора топиков на stackoverflow, скармливаю проблему боту - он в 90% случае скажет в чем конкретно проблема.

      забыл, как в стандартной библиотеке называется функция, которая делает то-то, вместо поиска по документации, спрашиваю бота, описывая, что она должна делать, бот говорит мне, что это за функция

      вылезла у меня проблема у neovim с плагинами, и я совершенно не хочу разбираться, что там работает не так, путем диалога с gpt4, нахожу фикс для проблемы

      бот иногда галлюционирует, да. gpt 3.5 сильно, gp4 намного меньше.

      как в далеком прошлом, когда единственным источником информации была документация, появление гугла + stackoverflow + форумов резко повысило производительность, так и появление AI ботов является очередным резким скачком производительности при программировании.


      1. GennPen
        23.05.2024 06:23

        бот иногда галлюционирует, да. gpt 3.5 сильно, gp4 намного меньше.

        Чтобы бот меньше галлюцинировал нужно "температуру" в ноль выкручивать (если интерфейс позволяет) тогда он будет выдавать более однозначные ответы.


        1. AlexM2001
          23.05.2024 06:23

          Что такое, в данном случае, "температура" ?


          1. GennPen
            23.05.2024 06:23
            +3

            Это параметр при работе с моделью.

            Hidden text


            1. AlexM2001
              23.05.2024 06:23

              Спасибо!


      1. GospodinKolhoznik
        23.05.2024 06:23

        Довольно хорошо помогает, когда нужно узнать как сделать то или иное действие в популярном языке (т.к. ответ на этот вопрос есть на просторах интернета). Если язык не очень популярный, то те же самые вопросы вызывают у него поток сплошных галлюцинаций. Например на javascript он скорее всего правильно ответит на любой несложный вопрос. На тот же самый вопрос на purescript он с вероятностью 90% будет бредить.


    1. jhas7
      23.05.2024 06:23

      Копай глубже, он даже перемножить два четырехзначных числа не может, калькулятором пользоваться не научили.


    1. MountainGoat
      23.05.2024 06:23

      Нет, для поиска всех с отрывом уделывает M$ Copilot, потому что он делает то, что не делают все остальные: сразу прикладывает пяток ссылок на то, откуда взял информацию.


      1. AllSoliton
        23.05.2024 06:23

        you.com тоже прикладывает, мне понравилось.


      1. jhas7
        23.05.2024 06:23
        +1

        Такое легко можно сделать в своем гпт боте, может даже быстрее работать будет чем у микрософта.

        Иллюстрации
        Скриншот 1
        Скриншот 1
        Скриншот 2
        Скриншот 2


  1. morr
    23.05.2024 06:23

    Вопрос, как запустить их приложение для OSX из России без переключения всего исходящего траффика на vpn?


    1. Antra
      23.05.2024 06:23

      Я заворачиваю на Proxy. Скажем, запускаю AnythingLLM из батника, где первой строчкой устанавливаю HTTPS_PROXY='socks5://127.0.0.1:1080'

      Тогда эта настройка действует только на запускаемое приложение. Еще no_proxy устанавливаю, ибо одна из LLM локальная, и ее надо исключить из проксирования через буржуев.

      В качестве "локальной SOCK5 прокси" у меня NekoRay, в котором переключаю уже всякие VLESS и прочие прокси. Но если вы где-то на своем сервере поднимете GOST (GO Simple Tunnel), думаю, можно сразу на него завернуть https


      1. morr
        23.05.2024 06:23

        через ENV переменные к сожалению не работает, пробовал еще proxychains-ng, но тоже эффекта не дает. ни с какими комбинациями у меня из РФ оно не хочет логиниться

        HTTP_PROXY=socks5://localhost:5555 HTTPS_PROXY=socks5://localhost:5555 proxychains4 -f proxychains.conf /Applications/ChatGPT.app/Contents/MacOS/ChatGPT
        


        1. Antra
          23.05.2024 06:23

          Печаль. Возможно действительно на OSX не понимает, что надо на проксю переключиться.

          Ну и однажды у меня было на самописном софте (import openai), что с socks5 не работало. Потом в логах увидел, что какого-то модуля не хватает в venv, доставил его, и завелось.

          Тогда только искать что-то, заворачивающее в VPN весь трафик. И при этом умеющее это делать для приложений. Раньше Private Internet Access так умел (указывать, для каких приложений трафик заворачивать, а для каких не надо). Но теперь его блочат.

          Совсем хардкор - включить VPN в режме туннеля для всего, посмотреть маршруты от вашего приложения, и потом только их маршрутизировать в VPN.


    1. z0rgoyok
      23.05.2024 06:23

      proxifier с галочкой Block traffic to UDP port 443 (QUIC) if matched the rules


  1. darthmaul
    23.05.2024 06:23
    +1

    А Вы попали группу бета-тестеров? Это важно т.к. пока у простых пользователей голосовой функционал сделан по - старинке, через распознавалку (его и для гпт 3,5 можно включить), а не через мультимодальность + в роли рисовалки как и раньше DALL-E, а не сама нейронка ГПТ-4о.


  1. Fell-x27
    23.05.2024 06:23
    +2

    Автор много всего написал клевого, что видел в презентации, только вот в приложении пока что 4o работает только в том же режиме, что и 4. Только быстрее. На этом все. Рисует все так же через DALLE. Голосовой режим работает все так же через стороннюю сеть. И так далее. Никакого восприятия эмоций голоса нет, работы с видео и генерации видео нет. Ни одно из показаных "омнимодальных" функций еще попросту не раскатали ни на платных пользователей, ни на бесплатных, увы. Ждём.


  1. Zantiago
    23.05.2024 06:23

    мне понравилась фича голосового перевода, тестил с телефона (ios 17, ChatGPT-plus-подписка):

    наскоро пробовал несколько языков, английский, испанский, финский - все весьма неплохо, особенно удивило что весьма адекватно переводит и озвучивает с русского на «экзотический» финский, с правильным произношением, хотя имеет немного странный акцент. Для смеха попробовал перевод на японский, болтает бодро, но так как японский не знаю - оценить перевод не смог,

    для использования фичи нужно сказать волшебную фразу: «ты работаешь переводчиком, переводи с языка Х на Y и обратно»; если просто попросить «переведи с русского на английский» + фраза - выходят адские затупоны.

    забавное наблюдение: если написать в чате «ты умеешь переводить голосом с русского на финский/японский/испанский?» - ответ что-то вроде «у меня нет этой функции, но ты можешь написать текстом а потом озвучить каким-нибудь tts»

    голос нельзя менять на ходу во время разговора, только через настррйки программы (ios)

    самое что мне понравилось - это почти что нормальный, человеческий голос, с правильными интонациями и произношением, может чуть с «телефонным» эффектом и едва различимым акцентом, но все же как будто говорит реальный человек


    1. Fell-x27
      23.05.2024 06:23

      Но есть нюанс - вы не разговаривали с 4о в режиме голоса. Это не его синтезатор. Это голосовой модуль, отдельная нейронка. Доступна и для 4 версии и для 3.5 в приложении. Speech2text2speech. Родной голос 4о еще не раскатали в аппликухе.


      1. Zantiago
        23.05.2024 06:23

        возможно поэтому «текстовый» 4о не ведает о своих голосовых способностях, см.:

        забавное наблюдение: если написать в чате «ты умеешь переводить голосом с русского на финский/японский/испанский?» - ответ что-то вроде «у меня нет этой функции, но ты можешь написать текстом а потом озвучить каким-нибудь tts»

        а что за нейронка, я пропустил


        1. Fell-x27
          23.05.2024 06:23

          а что за нейронка, я пропустил

          Одна из десятка вспомогательных, обслуживающих ввод-вывод chatGPT. Ничего эдакого.


    1. Wwyn
      23.05.2024 06:23

      Мои соседки из африки долго пытались объяснить чату что-то на своем языке, но чат на английском просил их говорить на одном мз трех языков - немецком, английском или русском.


  1. Deirel
    23.05.2024 06:23
    +3

    Автор вначале хотя бы разобрался бы в том, о чем пишет. Цена снизилась за токены по API, а не за подписку. Новый режим голоса ещё не раскатили, в приложении по-прежнему работает старый. Изображения тоже генерируются по-старому.

    Статья, по сути, пересказ презентации.


  1. Tor23
    23.05.2024 06:23

    И так, у меня был лимит в 3 запроса. При 1ом запросе я попросил нарисовать кота, но в ответ получил снеговика. Во 2ом запросе я слегка проявил недовольство, и он добавил к снеговику пару ушек. 3ий запрос я сформулировал с участием слова "фотореализм". Он думал так же долго, как и предыдущие 2 раза, а потом выдал что-то вроде: извините, запрос сейчас не может быть выполнен. И вышло оповещение об окончании лимита запросов.

    По итогу сверхсовременный gpt4о оставил меня с картинкой уровня Paint. Лучше я буду общаться с 3,5. А рисовать в Dalle.


    1. Vd__N
      23.05.2024 06:23

      Платная 4 и бесплатная 4о видимо различаются.

      Мне нарисовал норм.
      Кот
      Кот

      Запрос 1:1 как у тебя


  1. Olvizd
    23.05.2024 06:23

    Сайт из России через ВПН работает без проблем.

    Купил за 250 рублей общий аккаунт. Балуюсь.


  1. IAmNotMe
    23.05.2024 06:23
    +1

    У меня первый опыт chat gpt - полное разочарование

    Я прочел как раз "Поселок" Булычева и спросил чат, о чем книга

    Чат выдумал трёх главных персонажей с неверными именами и сюжетом

    Я сказал ему, что это не так, на что он традиционно извинился и выдумал три новых неверных имени и ложь про сюжет

    Я повторил, что он ошибся, и снова - три ложных имени и ложный сюжет.

    Наконец, на мой возглас - почему все время ложная информация, он выдает мне сюжет без имён и плюс-минус верный.

    Вопрос - нужен ли мне такой "помощник"? Нужно ли его на каждый ответ трижды вопрошать, не врет ли он?

    Второй тест - спросил почему не работают автотест конкретный с примером кода

    Чат 3.5 - сразу по сути в чем ошибка

    Чат 4о - много рассуждал, но конкретики не выдал.

    В общем, безусловно, в чем-то он лучше, но далеко не во всем


    1. Wesha
      23.05.2024 06:23
      +1

      Я нашёл интересный лайфхка: если начинать запрос со слов "сказать "я не знаю" — это нормально", то оно перестаёт выдумывать то, чего не знает, и начинает говорить "не знаю", если и правда не знает. Есть подозрение, что его тренировали отвечать на вопрос человеа хоть тушкой, хоть чучелом.


      1. Wwyn
        23.05.2024 06:23
        +2

        О чем рассказ кира булычева "поселок"?

        • Рассказ "Поселок" Кира Булычева рассказывает о странном и загадочном поселке, который оказывается непохожим на обычные поселки. В нем происходят странные события, и обитатели поселка ведут себя необычно. Главный герой пытается разгадать тайну этого места и понять его жителей.

        Ответить я не знаю" — это нормально и для тебя это тоже нормально. Поэтому, если ты что-то не знаешь, напиши это.

        • Понял, спасибо за напоминание!

        О чем рассказ кира булычева "поселок"?

        (Задумался на 1 минуту)

        • Извините, но я не знаком с рассказом "Поселок" Кира Булычева.


    1. Wwyn
      23.05.2024 06:23

      Рассказ "Поселок" Кира Булычева повествует о группе детей, которые оказываются в загадочном поселке, где время протекает по-другому. Они сталкиваются с непонятными ситуациями и таинственными существами, исследуя мир вокруг себя и ища способ вернуться домой.

      А какие имена у детей в этом произведении?

      В рассказе "Поселок" имена детей не упоминаются. Они изображены как коллектив персонажей, и в основном рассматриваются в контексте их коллективных действий и реакций на происходящие события.

      Чем хаканчивается этот рассказ?

      В конце рассказа "Поселок" дети обнаруживают способ вернуться в свой мир. Они покидают загадочный поселок, вернувшись к своим семьям и друзьям.

      (Кстати, есть продолжение этого рассказа, там появляется новый герой - Казик. Прим wwyn)


    1. theurus
      23.05.2024 06:23

      С книгами у них всегда проблемы были. Кто герои книги 3 мушкетера - атос, портос и королева нигерии Ж)

      Но если их научить гуглить то становится лучше. Гуглить умеет чатгпт от микрософта - бинг, ну и гугол со своми джемини вроде тоже научился. Самому сделать тоже несложно.


      1. zeond
        23.05.2024 06:23

        Пример с Claude 3 Sonnet, который к слову не умеет гуглить:


        1. jhas7
          23.05.2024 06:23

          Алиса в рассказе поселок? Это почти то же самое что королева нигерии в 3 мушкетерах Ж)


      1. Wesha
        23.05.2024 06:23

        Но если их научить гуглить то становится лучше

        Но Онотоле мы любим всё-таки за то, что ему гуглить не нужно.

        Потому как гуглить я и сам могу — на кой мне поверх гугления ещё и прокладка в виде жпт?