В середине мая компания OpenAI представила новую версию самой популярной и хайповой нейросети в мире. Продукт получил название ChatGPT-4o, сохранив порядковый номер своего предшественника. Несмотря на это, чат-бот не только стал быстрее обрабатывать информацию, но и получил поддержку мультимодальности, и это буквально все изменило.
Буква "o" в названии ChatGPT-4o расшифровывается как "omni" и указывает на универсальность нейросети. Теперь чат-бот способен воспринимать информацию различных типов одновременно и отвечать пользователю, генерируя текст, озвучивая его, создавая изображения и т.д.
Благодаря поддержке мультимодальности нейросеть ChatGPT-4o получила целый ряд новых интересных функций.
Работа с изображениями
Распознавание и детальное описание содержимого изображений
Перевод текста, присутствующего на изображениях
Ответы на вопросы, связанные с визуальным контентом
Генерация изображений по текстовому описанию
Работа с видео
Понимание происходящего на видео без звука по визуальному ряду
Распознавание отдельных предметов на видео
Умение генерировать видео, включая трехмерные, по текстовому описанию
Способность комментировать то, что снимает камера, в реальном времени (актуально для незрячих)
Сжимание видео и пересказ
Работа с аудио
Распознавание и транскрибирование речи в реальном времени (задержка около 0,3 сек)
Генерация речи с разными эмоциональными оттенками и интонациями
Определение эмоций по голосу человека
Совмещение модальностей
Одновременная работа с текстом, изображением, аудио в рамках одного запроса
Например, можно задать вопрос по картинке, а ответ получить в виде аудиосообщения
Контекстное понимание
Модель учитывает предыдущий контекст беседы при обработке новых данных
Способна вести последовательный диалог на протяжении нескольких минут
Продвинутая работа с языками
GPT-4o может помочь вам в изучении более 50 иностранных языков
Может работать в качестве синхронного переводчика в диалоге
Понимает шутки на разных языках и определяет контекст беседы по интонации, например, иронию или сарказм
Распознавание текста на картинках в ChatGPT-4o
Мне стало интересно, насколько хорошо нейросеть умеет в распознавание. Поэтому на первом этапе я решил не жестить и попросил нейросеть перевести меню ресторана, данное на иврите, на русский язык. Я обращался к ней с компьютера, который вы всегда можете купить в магазине XCOM-SHOP.RU.
Результат не заставил себя ждать. Спустя всего несколько секунд я получил полный перечень блюд с разбивкой по разделам:
Затем я попросил нейросеть посоветовать мне что-то из блюд, указав, что я очень голоден, и получил вот такой ответ:
Достойно, но и задача, прямо скажем, была не очень сложной. Мне захотелось проверить, сможет ли ChatGPT-4o распознать врачебный почерк.
Поэтому я взял первую попавшуюся справку из интернета и предложил расшифровать ее двум конкурирующим нейросетям - ChatGPT-4o и Claude3.
Вот что из этого получилось:
К сожалению, обе нейросети практически не справились, или справились, но плохо. ChatGPT-4o правильно определил ФИО и возраст пациента, понял, что он здоров, и на этом все. Номер справки, дату выписки, специализацию врача, проводившего осмотр, и т.д., и т.п. он либо не определил, либо определил неверно.
Claude3, который так все хвалят, впрочем, справился еще хуже. Он почему-то решил предложить расшифровку в описательном виде, но оставим это на его усмотрение. Куда важнее, что он не смог определить верно ни одного факта, описанного в справке, кроме ФИО пациента. Мало того, что в ряде случаев он неверно распознал информацию, так часть еще и просто додумал самостоятельно.
В пресс-релизе OpenAI уделяет большое значение способности ChatGPT-4o совмещать изображения с текстом. Якобы поэтому теперь текстовое содержимое на генерируемых нейросетью картинках выглядит полноценно как с точки зрения грамотности, так и начертания. Например, теперь вы можете попросить ее нарисовать рисунок и разместить внутри конкретный текст.
Я попросил ChatGPT-4o нарисовать робота, который пишет этот самый текст. Вот что у меня получилось в итоге:
Справедливости ради, я составлял запросы по-разному, переходя с русского на английский и наоборот, но ничего не получилось. Из-за этого может сложиться впечатление, что обновление не является таким уж масштабным. Но на самом деле все эти проверки - полная глупость, потому что произошедшие изменения куда более глобальны и не сводятся только к распознаванию врачебного почерка.
Скорость генерации контента в ChatGPT-4o
Несмотря на вялое начало знакомства с ChatGPT-4o, могу подтвердить, что скорость ответов нейросети возросла очень и очень заметно. Она будет отвечать вам примерно так же быстро, как отвечал бы живой человек, если бы вы строили диалог с ним. Причем очевиднее всего это становится при вербальном общении, то есть голосом.
По заявлениям OpenAI, средняя задержка при распознавании ChatGPT-4o голосовых запросов составляет всего 0,3 секунды. Ускорение произошло за счет унификации методики распознавания. Сильнее всего это заметно на примере взаимодействия голосом. Правда, проверить это можно исключительно в приложении на смартфонах, которые вы можете купить в XCOM-SHOP.RU.
Две предыдущие итерации ChatGPT использовали последовательность из трех отдельных моделей для преобразования речи в текст, обработки текста и обратного преобразования в речь. В отличие от них, GPT-4o представляет собой единую модель, обученную на тексте, изображениях и аудио одновременно.
Такой подход позволяет ChatGPT не терять значительные объемы информации на этапе обработки, как это происходило с GPT-3.5 и GPT-4, которые не могли напрямую учитывать интонации, фоновые шумы, а также генерировать смех, пение или эмоциональную речь. GPT-4o решает эту проблему благодаря единой архитектуре в рамках целостной нейронной сети.
Повышение скорости обработки данных произошло на всех уровнях и привело к тому, что ChatGPT-4o стал расходовать меньше токенов - базовой единицы, на которую разбиваются текстовые запросы для обработки нейросетью. Например, русский язык теперь тратит примерно вдвое меньше токенов, а хинди - втрое.
При этом сохраняется возможность работы с большими объемами данных. На практике это выливается в способность нейросети поддерживать голосовой диалог в течение 7 минут, оставаясь в контексте. Обычные голосовые ассистенты, с которыми мы знакомы, обычно теряют нить разговора уже после 3-4 вопросов и замолкают.
ChatGPT-4o как замена Siri, Google Assistant и Алисы
Фактически OpenAI уже сделала первый шаг в сторону превращения чат-бота в полноценного ассистента вроде Siri или Google Assistant, только более высокого уровня. Уже на этом этапе уровень распознавания речи и генерация голосовых ответов в реальном времени делает из GPT-4o невероятно полезного помощника.
Во-первых, мне очень понравилась возможность выбрать голос, которым нейросеть будет со мной разговаривать.
Во-вторых, сама методика генерации речи сильно напоминает то, как говорит человек. Если Алиса от Яндекса - при всех ее плюсах - говорит где-то даже слишком академично, ChatGPT-4o нарочито растягивает слова, из-за чего создается полное впечатление, что говоришь с реальным человеком.
В-третьих, ChatGPT-4o почти не задумывается над ответами. Мне кажется, это как раз та длительность пауз, которая оптимальна для имитации человеческой речи. Они не слишком длинные, но и не слишком короткие. Чат-бот не перебивает вас.
Я разговаривал с ChatGPT-4o на разные темы, просил посоветовать мне машину, спрашивал, что приготовить на ужин, как помочь ребенку с уроками, и ни одна из тем не вызвала у него затруднений. Я как будто реально общался с живым человеком, который не только рад со мной поболтать, но еще и отлично разбирается в предмете.
Но он может не только вести диалог, улавливая контекст, но и самым непосредственным образом способствовать решению многих задач.
В этом смысле наиболее широкие возможности для взаимодействия предлагает приложение. Оно есть как для мобильных платформ, так и для для macOS. Помимо интуитивного и удобного интерфейса для взаимодействия с чат-ботом, программа предлагает ряд дополнительных возможностей, которых нет в веб-версии:
Возможность поделиться экраном и обрабатывать визуальную информацию, которая на нем отображается.
Синхронизация истории диалогов между устройствами, так что можно продолжить общение с ChatGPT с того места, где остановились на другом девайсе.
Быстрое и своевременное распространение обновлений с новыми моделями и возможностями ChatGPT.
Распознавание голосовых команд и ведение вербальных диалогов.
Возможность загружать различные файлы, документы, таблицы, куски программного кода и т.д.
Причем зачастую вы можете даже не загружать данные в GPT. Возможность видеть содержимое экрана является главной фишкой приложения независимо от платформы. Просто у десктопной версии есть ориентация на работу с видимой частью рабочего стола, и это очень облегчает многие задачи. На презентации нам даже показали, как ChatGPT-4o анализирует некий проект и помогает разработчику. Нейросеть ищет ошибки, закрывает скобки и делает всю ту грязную работу, пренебрегать которой нельзя и от которой зависит успех конечного продукта.
ChatGPT-4o в iOS 18
Доступ к приложениям позволяет подключать нейросеть к совместной работе над документами, презентациями и другим мультимедийным контентом. Именно этими навыками чат-бота, по слухам, и хочет воспользоваться Apple, которая якобы уже заключила договор с OpenAI об использовании ChatGPT в iOS 18. Это должно сделать общение с Siri более естественным и человекоподобным. Ассистент Apple сможет лучше понимать контекст вопросов, давать более осмысленные и развернутые ответы.
Кроме Siri, возможности GPT-4o можно интегрировать и в другие стоковые приложения iOS: Заметки, Почта, Фото и т.д. К примеру, в Заметках GPT-4o может помочь с написанием и редактированием текстов, в Почте - с умной сортировкой и ответами, в Фото - с распознаванием объектов и описанием изображений.
С внедрением GPT-4o Apple также сможет реализовать совершенно новые функции с элементами искусственного интеллекта в iOS. Например, универсальный мультимодальный переводчик, помощник с распознаванием объектов дополненной реальности, генератор контента и многое другое.
Стоимость ChatGPT-4o: сколько стоит подписка
Одной из радостных новостей, связанных с релизом ChatGPT-4o, стало снижение его цены. Однако, если открыть сайт chat.openai.com и перейти в раздел оформления подписки, то довольно быстро станет ясно, что она стоит те же самые 20 долларов, которые просили за доступ к нейросети и раньше.
Все потому, что снижение цены затронуло только API для сторонних разработчиков, которые используют чат-бота в своих сервисах. Они не платят фиксированную стоимость. Для них она рассчитывается, исходя из количества потраченных токенов, которые исчисляются миллионами. Раньше OpenAI брала за каждый миллион токенов 14 долларов США. Теперь эта цифра уменьшилась вдвое, и разработчики будут должны платить всего 7 долларов.
Тут, в общем-то, все просто. Выше мы говорили о том, что ChatGPT-4o стал тратить меньше токенов на обработку команд на многих языках мира. В ряде случаев затраты снизились в 2-3 раза. Такой подход позволяет OpenAI экономить ресурсы, а значит, компания может позволить себе распространять свой продукт дешевле.
Комментарии (107)
Wiggin2014
23.05.2024 06:23Не умеет оно видео делать, не придумывайте
VPryadchenko
23.05.2024 06:23+1Ровно как и картинки генерит через dall-e по-прежнему. По крайней мере в браузере и в андроид приложении.
AcckiyGerman
23.05.2024 06:23Мне кажется он рисует в
mermaid
(язык диаграмм для встраивания в markdown), ибо у меня по запросу "нарисуй большого слона" получилось вот такое:P.S.
Слон получился уж очень схематичный, ты можешь нарисовать слона с использованием dall-e ?
ChatGPT:
Я не могу напрямую использовать DALL-E или другие внешние инструменты для генерации изображений, но я могу предложить вам альтернативу. Вы можете использовать платформы, такие как OpenAI DALL-E или другие генераторы изображений, чтобы создать изображение сильного слона. Вот пример команды, которую можно использовать с DALL-E:
nidalee
23.05.2024 06:23Мне даже картинки генерировать отказывается, просто рассказывает, как это сделать самому.
darthmaul
23.05.2024 06:23Так и есть. И голосовые функции работают через внешнюю распознавалку. Ни одну из фич, ппоказанных на презентации, не выложили в общий доступ, нынчне ГПТ-4о это просто слегка обновлённая ГПТ-4 турбо. Суда по повышенной скорости, вероятно, омни ещё и урезали по кол-ву параметров.
HappyLynx
23.05.2024 06:23Выложили, но только 2 фичи. Распознавание картинок и генерацию текста. Всё остальное - старое.
GennPen
23.05.2024 06:23Одной из радостных новостей, связанных с релизом ChatGPT-4o, стало снижение его цены. Однако, если открыть сайт chat.openai.com и перейти в раздел оформления подписки, то довольно быстро станет ясно, что она стоит те же самые 20 долларов, которые просили за доступ к нейросети и раньше.
Снижение цены имелось в виду по API (Pricing | OpenAI). И цена действительно ниже в два раза чем "gpt-4-turbo".
jhas7
23.05.2024 06:23+2Закупаться можно и не напрямую. На openrouter.ai gpt-4o стоит 5$ за 1млн токенов, гпт4-турбо 10$. Вдвое дешевле.
letster
23.05.2024 06:23+12Очень странно, но текст меню на иврите не соответствует тому, что показано как перевод на русский.
Shaginov
23.05.2024 06:23+1У меня он вообще наглючил вот такое:
Конечно, вот перевод меню на русский язык:
Киши:
Брокколи с мясом - 80 ₪ за единицу
Киш с курицей - 70 ₪ за единицу
Мясной - 70 ₪ за единицу
Ассорти овощи - 70 ₪ за единицу
Киш с вялеными помидорами - 70 ₪ за единицу
Пироги:
Тесто Фило с мясом - 60 ₪ за единицу
Тесто Фило с сыром - 60 ₪ за единицу
Тесто Фило с грибами и сыром - 60 ₪ за единицу
Слоеное тесто с курицей - 70 ₪ за единицу
Слоеное тесто с картофелем и грибами - 60 ₪ за единицу
Слоеное тесто с сыром и шпинатом - 60 ₪ за единицу
Тесто Фило с картофелем - 60 ₪ за единицу
Тесто Фило с яблоками и медом - 60 ₪ за единицу
Слоеное тесто с творогом - 70 ₪ за единицу
Тесто Фило с маком - 60 ₪ за единицу
Тесто Фило с капустой - 70 ₪ за единицу
Слоеное тесто с мясом - 60 ₪ за единицу
Тесто Фило с вишней и кремом - 80 ₪ за единицу
Котлеты и крокеты:
Мясные котлеты - 10 ₪ за единицу
Куриные крокеты - 10 ₪ за единицу
Крокеты из индейки - 10 ₪ за единицу
Крокеты из баклажанов - 10 ₪ за единицу
Крокеты из картофеля - 10 ₪ за единицу
Крокеты из лосося - 12 ₪ за единицу
Булочки:
Мясные булочки - 6 ₪ за единицу
Булочки с сыром - 6 ₪ за единицу
Булочки с помидорами - 6 ₪ за единицу
Булочки с картофелем и шпинатом - 6 ₪ за единицу
Булочки с тыквой - 6 ₪ за единицу
Булочки с финиками - 6 ₪ за единицу
Булочки с яблоками - 6 ₪ за единицу
Булочки с инжиром - 6 ₪ за единицу
Булочки с мёдом и орехами - 6 ₪ за единицу
Булочки с сыром и укропом - 6 ₪ за единицу
Булочки с кунжутом - 6 ₪ за единицу
Булочки с шоколадом - 6 ₪ за единицу
Слоеные булочки с ванильным кремом - 50 ₪ за кг
Слоеные булочки с шоколадным кремом - 60 ₪ за кг
Фритюр:
Мясные пирожки - 8 ₪ за единицу
Пирожки с курицей - 8 ₪ за единицу
Пирожки с картошкой - 8 ₪ за единицу
Пирожки с грибами - 8 ₪ за единицу
Пирожки с сыром - 8 ₪ за единицу
Пирожки с мясом - 8 ₪ за единицу
Пирожки с яблоками - 8 ₪ за единицу
Пирожки с вишней - 8 ₪ за единицу
Пирожки с шоколадом - 8 ₪ за единицу
Пирожки с маком - 8 ₪ за единицу
Пирожки с изюмом - 8 ₪ за единицу
Пирожки с орехами - 8 ₪ за единицу
Пирожки с картошкой и грибами - 10 ₪ за единицу
Цибурек:
Мясные чебуреки - 10 ₪ за единицу
Чебуреки с картофелем - 10 ₪ за единицу
Чебуреки с сыром - 10 ₪ за единицу
Чебуреки с зеленью - 10 ₪ за единицу
Чебуреки с картофелем и зеленью - 12 ₪ за единицу
Киш ассорти:
Киш ассорти - 80 ₪ за единицу
Киш с вялеными помидорами - 70 ₪ за единицу
Киш с мясом и сыром - 70 ₪ за единицу
Киш с картофелем и грибами - 70 ₪ за единицу
Киш с курицей и овощами - 70 ₪ за единицу
Киш с картофелем и сыром - 70 ₪ за единицу
Киш с мясом и картофелем - 70 ₪ за единицу
Вегетарианские блюда:
Салаты - 40 ₪ за кг
Киш с сыром - 60 ₪ за единицу
Киш с помидорами и сыром - 70 ₪ за единицу
Киш с картофелем и сыром - 70 ₪ за единицу
guliverza
23.05.2024 06:23+1Не понимаю, почему так с этим chatgpt носятся (использовал GPT-4o)
Он не может сказать, как звали тёщу Ричарда Львиное сердце,
не может рассчитать налог на автомобиль (в Латвии),
даже не может с сайта латвийских гос услуг правильно скопировать таблицу для этого рассчёта.
Не может рассчитать, как надо было сыграть сборной Латвии по хоккею, чтобы выйти из группы, когда у них было 9 очков, а у Словакии и Германии по 12. (оставалась 1 игра, за победу в основное время дают 3) и учесть, чем закончились личные встречи, если очков поровну.
График сжатия воды(в зависимости от давления) он нарисвал линейный и так, что объём воды ушёл в минус.
Выше пишут, что текст меню с иврита неправильно перевёл)Всё на что он годится это более удобный поиск, и то потом перепроверять надо, а то ведь мог и сгаллюцинировать.
morr
23.05.2024 06:23+16отвечаю с точки зрения программиста
для меня как разработчика, он упрощает рутинные действия. изучаю новый язык - получаю непонятную ошибку, вместо гугления и перебора топиков на stackoverflow, скармливаю проблему боту - он в 90% случае скажет в чем конкретно проблема.
забыл, как в стандартной библиотеке называется функция, которая делает то-то, вместо поиска по документации, спрашиваю бота, описывая, что она должна делать, бот говорит мне, что это за функция
вылезла у меня проблема у neovim с плагинами, и я совершенно не хочу разбираться, что там работает не так, путем диалога с gpt4, нахожу фикс для проблемы
бот иногда галлюционирует, да. gpt 3.5 сильно, gp4 намного меньше.
как в далеком прошлом, когда единственным источником информации была документация, появление гугла + stackoverflow + форумов резко повысило производительность, так и появление AI ботов является очередным резким скачком производительности при программировании.
GennPen
23.05.2024 06:23бот иногда галлюционирует, да. gpt 3.5 сильно, gp4 намного меньше.
Чтобы бот меньше галлюцинировал нужно "температуру" в ноль выкручивать (если интерфейс позволяет) тогда он будет выдавать более однозначные ответы.
GospodinKolhoznik
23.05.2024 06:23Довольно хорошо помогает, когда нужно узнать как сделать то или иное действие в популярном языке (т.к. ответ на этот вопрос есть на просторах интернета). Если язык не очень популярный, то те же самые вопросы вызывают у него поток сплошных галлюцинаций. Например на javascript он скорее всего правильно ответит на любой несложный вопрос. На тот же самый вопрос на purescript он с вероятностью 90% будет бредить.
jhas7
23.05.2024 06:23Копай глубже, он даже перемножить два четырехзначных числа не может, калькулятором пользоваться не научили.
MountainGoat
23.05.2024 06:23Нет, для поиска всех с отрывом уделывает M$ Copilot, потому что он делает то, что не делают все остальные: сразу прикладывает пяток ссылок на то, откуда взял информацию.
jhas7
23.05.2024 06:23+1Такое легко можно сделать в своем гпт боте, может даже быстрее работать будет чем у микрософта.
Иллюстрации
morr
23.05.2024 06:23Вопрос, как запустить их приложение для OSX из России без переключения всего исходящего траффика на vpn?
Antra
23.05.2024 06:23Я заворачиваю на Proxy. Скажем, запускаю AnythingLLM из батника, где первой строчкой устанавливаю HTTPS_PROXY='socks5://127.0.0.1:1080'
Тогда эта настройка действует только на запускаемое приложение. Еще no_proxy устанавливаю, ибо одна из LLM локальная, и ее надо исключить из проксирования через буржуев.
В качестве "локальной SOCK5 прокси" у меня NekoRay, в котором переключаю уже всякие VLESS и прочие прокси. Но если вы где-то на своем сервере поднимете GOST (GO Simple Tunnel), думаю, можно сразу на него завернуть https
morr
23.05.2024 06:23через ENV переменные к сожалению не работает, пробовал еще proxychains-ng, но тоже эффекта не дает. ни с какими комбинациями у меня из РФ оно не хочет логиниться
HTTP_PROXY=socks5://localhost:5555 HTTPS_PROXY=socks5://localhost:5555 proxychains4 -f proxychains.conf /Applications/ChatGPT.app/Contents/MacOS/ChatGPT
Antra
23.05.2024 06:23Печаль. Возможно действительно на OSX не понимает, что надо на проксю переключиться.
Ну и однажды у меня было на самописном софте (import openai), что с socks5 не работало. Потом в логах увидел, что какого-то модуля не хватает в venv, доставил его, и завелось.
Тогда только искать что-то, заворачивающее в VPN весь трафик. И при этом умеющее это делать для приложений. Раньше Private Internet Access так умел (указывать, для каких приложений трафик заворачивать, а для каких не надо). Но теперь его блочат.
Совсем хардкор - включить VPN в режме туннеля для всего, посмотреть маршруты от вашего приложения, и потом только их маршрутизировать в VPN.
z0rgoyok
23.05.2024 06:23proxifier с галочкой Block traffic to UDP port 443 (QUIC) if matched the rules
darthmaul
23.05.2024 06:23+1А Вы попали группу бета-тестеров? Это важно т.к. пока у простых пользователей голосовой функционал сделан по - старинке, через распознавалку (его и для гпт 3,5 можно включить), а не через мультимодальность + в роли рисовалки как и раньше DALL-E, а не сама нейронка ГПТ-4о.
Fell-x27
23.05.2024 06:23+2Автор много всего написал клевого, что видел в презентации, только вот в приложении пока что 4o работает только в том же режиме, что и 4. Только быстрее. На этом все. Рисует все так же через DALLE. Голосовой режим работает все так же через стороннюю сеть. И так далее. Никакого восприятия эмоций голоса нет, работы с видео и генерации видео нет. Ни одно из показаных "омнимодальных" функций еще попросту не раскатали ни на платных пользователей, ни на бесплатных, увы. Ждём.
Zantiago
23.05.2024 06:23мне понравилась фича голосового перевода, тестил с телефона (ios 17, ChatGPT-plus-подписка):
наскоро пробовал несколько языков, английский, испанский, финский - все весьма неплохо, особенно удивило что весьма адекватно переводит и озвучивает с русского на «экзотический» финский, с правильным произношением, хотя имеет немного странный акцент. Для смеха попробовал перевод на японский, болтает бодро, но так как японский не знаю - оценить перевод не смог,
для использования фичи нужно сказать волшебную фразу: «ты работаешь переводчиком, переводи с языка Х на Y и обратно»; если просто попросить «переведи с русского на английский» + фраза - выходят адские затупоны.
забавное наблюдение: если написать в чате «ты умеешь переводить голосом с русского на финский/японский/испанский?» - ответ что-то вроде «у меня нет этой функции, но ты можешь написать текстом а потом озвучить каким-нибудь tts»
голос нельзя менять на ходу во время разговора, только через настррйки программы (ios)
самое что мне понравилось - это почти что нормальный, человеческий голос, с правильными интонациями и произношением, может чуть с «телефонным» эффектом и едва различимым акцентом, но все же как будто говорит реальный человек
Fell-x27
23.05.2024 06:23Но есть нюанс - вы не разговаривали с 4о в режиме голоса. Это не его синтезатор. Это голосовой модуль, отдельная нейронка. Доступна и для 4 версии и для 3.5 в приложении. Speech2text2speech. Родной голос 4о еще не раскатали в аппликухе.
Zantiago
23.05.2024 06:23возможно поэтому «текстовый» 4о не ведает о своих голосовых способностях, см.:
забавное наблюдение: если написать в чате «ты умеешь переводить голосом с русского на финский/японский/испанский?» - ответ что-то вроде «у меня нет этой функции, но ты можешь написать текстом а потом озвучить каким-нибудь tts»
а что за нейронка, я пропустил
Fell-x27
23.05.2024 06:23а что за нейронка, я пропустил
Одна из десятка вспомогательных, обслуживающих ввод-вывод chatGPT. Ничего эдакого.
Wwyn
23.05.2024 06:23Мои соседки из африки долго пытались объяснить чату что-то на своем языке, но чат на английском просил их говорить на одном мз трех языков - немецком, английском или русском.
Deirel
23.05.2024 06:23+3Автор вначале хотя бы разобрался бы в том, о чем пишет. Цена снизилась за токены по API, а не за подписку. Новый режим голоса ещё не раскатили, в приложении по-прежнему работает старый. Изображения тоже генерируются по-старому.
Статья, по сути, пересказ презентации.
Tor23
23.05.2024 06:23И так, у меня был лимит в 3 запроса. При 1ом запросе я попросил нарисовать кота, но в ответ получил снеговика. Во 2ом запросе я слегка проявил недовольство, и он добавил к снеговику пару ушек. 3ий запрос я сформулировал с участием слова "фотореализм". Он думал так же долго, как и предыдущие 2 раза, а потом выдал что-то вроде: извините, запрос сейчас не может быть выполнен. И вышло оповещение об окончании лимита запросов.
По итогу сверхсовременный gpt4о оставил меня с картинкой уровня Paint. Лучше я буду общаться с 3,5. А рисовать в Dalle.
Vd__N
23.05.2024 06:23Платная 4 и бесплатная 4о видимо различаются.
Мне нарисовал норм.
Запрос 1:1 как у тебя
Olvizd
23.05.2024 06:23Сайт из России через ВПН работает без проблем.
Купил за 250 рублей общий аккаунт. Балуюсь.
IAmNotMe
23.05.2024 06:23+1У меня первый опыт chat gpt - полное разочарование
Я прочел как раз "Поселок" Булычева и спросил чат, о чем книга
Чат выдумал трёх главных персонажей с неверными именами и сюжетом
Я сказал ему, что это не так, на что он традиционно извинился и выдумал три новых неверных имени и ложь про сюжет
Я повторил, что он ошибся, и снова - три ложных имени и ложный сюжет.
Наконец, на мой возглас - почему все время ложная информация, он выдает мне сюжет без имён и плюс-минус верный.
Вопрос - нужен ли мне такой "помощник"? Нужно ли его на каждый ответ трижды вопрошать, не врет ли он?
Второй тест - спросил почему не работают автотест конкретный с примером кода
Чат 3.5 - сразу по сути в чем ошибка
Чат 4о - много рассуждал, но конкретики не выдал.
В общем, безусловно, в чем-то он лучше, но далеко не во всем
Wesha
23.05.2024 06:23+1Я нашёл интересный лайфхка: если начинать запрос со слов "сказать "я не знаю" — это нормально", то оно перестаёт выдумывать то, чего не знает, и начинает говорить "не знаю", если и правда не знает. Есть подозрение, что его тренировали отвечать на вопрос человеа хоть тушкой, хоть чучелом.
Wwyn
23.05.2024 06:23+2О чем рассказ кира булычева "поселок"?
Рассказ "Поселок" Кира Булычева рассказывает о странном и загадочном поселке, который оказывается непохожим на обычные поселки. В нем происходят странные события, и обитатели поселка ведут себя необычно. Главный герой пытается разгадать тайну этого места и понять его жителей.
Ответить я не знаю" — это нормально и для тебя это тоже нормально. Поэтому, если ты что-то не знаешь, напиши это.
Понял, спасибо за напоминание!
О чем рассказ кира булычева "поселок"?
(Задумался на 1 минуту)
Извините, но я не знаком с рассказом "Поселок" Кира Булычева.
Wwyn
23.05.2024 06:23Рассказ "Поселок" Кира Булычева повествует о группе детей, которые оказываются в загадочном поселке, где время протекает по-другому. Они сталкиваются с непонятными ситуациями и таинственными существами, исследуя мир вокруг себя и ища способ вернуться домой.
А какие имена у детей в этом произведении?
В рассказе "Поселок" имена детей не упоминаются. Они изображены как коллектив персонажей, и в основном рассматриваются в контексте их коллективных действий и реакций на происходящие события.
Чем хаканчивается этот рассказ?
В конце рассказа "Поселок" дети обнаруживают способ вернуться в свой мир. Они покидают загадочный поселок, вернувшись к своим семьям и друзьям.
(Кстати, есть продолжение этого рассказа, там появляется новый герой - Казик. Прим wwyn)
theurus
23.05.2024 06:23С книгами у них всегда проблемы были. Кто герои книги 3 мушкетера - атос, портос и королева нигерии Ж)
Но если их научить гуглить то становится лучше. Гуглить умеет чатгпт от микрософта - бинг, ну и гугол со своми джемини вроде тоже научился. Самому сделать тоже несложно.
Zara6502
расскажите есть ли какой-то доступ бесплатный для рядового пользователя из РФ к этому чуду, пусть даже с ограничением запросов в сутки? Мне писали про РОЕ и еще какие-то варианты, то ничего не сработало.
AlexB17
Любой VPN и логин через гугл аккаунт.
Zara6502
С разных провайдеров, с разными VPN и без VPN
me21
Только что проверил с телефона Хуавей, с аккаунтом, зарегистрированным на яндексовскую почту:
Hidden text
Единственное но - вместо более-менее известных провайдеров VPN был личный на арендованном сервере.
Попробуйте почистить куки.
Zara6502
а chatgpt.com это же совсем не chat.openai.com
GennPen
chat.openai.com сейчас редиректит на chatgpt.com
Zara6502
хм, а мне сказали что это что-то левое, типа проверяй по ответу "какая модель используется", мол у реального chatgpt формат ответа другой. в общем я как-то подзапутался уже со всем этим, современный интернет без поллитра не разобрать.
GennPen
Ну, можно работать напрямую с API OpenAI, например поставить LibreChat. Но нужно заморачиваться с оплатой сервиса(есть способы). Нужно один раз заморочиться с установкой LibreChat на VPS/VDS.
Но зато будет полный контроль над выбором модели и прочих параметров. Не будет часовых лимитов.
Zara6502
я же про бесплатно пишу
мне это не нужно
GennPen
Бесплатно могу посоветовать https://groq.com/, там бесплатные лимиты очень даже неплохие, llama3 очень хороша. Но не работает в РФ, на бесплатных VPN не знаю как будет работать.
Zara6502
это не работает
jhas7
Эммм, если даже лама сойдет тогда полно вариантов. В телеграме пиши боту https://t.me/kun4sun_bot
Zara6502
нет, нужен именно chatgpt4 от openai
RingilNill
А вот раз упомянули LibreChat…
Вопрос такой, если им пользуетесь
Насколько осмысленно развернуть его и платить за API?
Я просто в раздумьях за Claude или ChatGPT заплатить, так как и на бесплатных версиях убедился, что они могут эффективно мне помогать
Но учитывая мою работу(админ старой школы, девопс, SRE) мне развернуть LibreChat не сложно, благо своих серверов у меня хватает именно своих для личных проектов
И вот тут вопрос и вылезает
Нужно ли сильно будет вникать в игру с весами и прочим, или можно просто поставить LibreChat, купить запросы к API и спокойно юзать 4ку не думая ни о чем
Понятно, что скорее всего финансово это выгодней, не так много я делаю запросов, что бы сжирать токенов больше чем на 20ку в месяц, скорее выйдет меньше. Но вопрос в том придется ли вникать дополнительно(на что может просто не быть времени) или дефолты вполне рабочие?
GennPen
Работать напрямую с API в любом случае выгодней, даже не смотря на комиссию примерно 30% на пополнение через другие сервисы. Платишь за фактическое использование запросов, даже если пара запросов в месяц - остаток не сгорает на балансе. Ну, если вы не будете кормить его огромными ветками истории сообщений.
Дефолтные параметры вполне рабочие. Основное что меняется: температура - влияет на разнообразность ответов, промпт - от него очень сильно зависит как будет работать модель (на счет этого проще в инете почитать), кол-во токенов - для ограничения контекста и ответа.
Ну и плюс LibreChat в том, что он все запросы пропускает через себя, можно поставить на зарубежный хостинг и не возиться с переключением VPN. Естественно в таком случае нужно получше настроить авторизацию.
jhas7
Если 4ка это гпт4 то для чата через апи это вообще не вариант, слишком дорого получается, что то типа 50 центов за каждый запрос, даже за простое привет-пока, а если в нее большие куски текста кидать(код например) то за 1 запрос может и 2 бакса получится.
Если покупать и активно юзать то более менее терпимые только самые дешевые модели, хайку и джемени флеш.
При этом все эти боты так или иначе доступны абсолютно бесплатно на своих сайтах или поблизости. ГПТ4 турбо например дают на сайте coze.com
GennPen
Что то вы переборщили с ценами.
Даже на максимальном кол-ве токенов: gpt-4, максимум 8192 токена, 30 баксов за 1млн. исходящих токенов - около 24 центов за максимальный запрос.
И это не "за каждый запрос", а за запрос с огромным контекстом. Для примера, у меня беседа примерно на 10 страниц русского текста заняла примерно 4к токенов, а русский текст занимает примерно в 2 раза больше токенов чем английский.
Да и gpt-4o стоит гораздо дешевле.
jhas7
Моделька gpt4-8к для чата это очень мало.
Gpt4-32k стоит 60 долларов за миллион токенов. Это 1.92$ за 32к токенов запрос, не учитывая исходящие а они стоят в 2 раза дороже, но их мало обычно.
В чате такие цифры достигаются легко, кидаешь в чат код размером 10к символов и просишь исправить, получаешь в ответ что то, потом кидаешь обратно лог с ошибкой на 10т символов, получаешь в ответ что то и вот ты сделал всего 2 запроса а в памяти уже торчит почти 32т символов. Это еще не 32т токенов но близко.
Gpt-4о дешевле но это опасная дешевизна, там окно намного больше и отвечает(жрет токены) он намного быстрее.
GennPen
Не мне вас переубеждать.
Я не вижу смысла использовать дорогой gpt-4, когда есть лучше и дешевле gpt-4o, к тому же у него более свежая база.
И да, нужно ограничивать ответ в кол-ве токенов чтобы он не выдавал длиннющую портянку текста в ответ.
jhas7
Про гпт-4о я согласен.Он намного дешевле и быстрее. С ним каждый запрос в чатик будет стоить около 10 центов (если в памяти торчит ~20т символов). По мне так это тоже очень много.
У гугл джемини в бесплатных апи ключах сейчас лимит 1млн токенов в... минуту. И 1500 запросов в сутки на один ключ.
GennPen
Да, только Gemini 1.5 недоступен в EU:
Да и он отмечен как "Preview", так что может поменяться в любую сторону.
Dolios
В левом нижнем углу кнопку "Upgrade plan" нажмите, там написано, какая модель используется.
Скрин
Бесплатный ГптЧо работает до какого-то количества запросов в сутки.
Zara6502
у меня нажимать нечего так как просто ничего не работает.
Dolios
Вы мне напоминаете бухгалтера с моей первой работы эникеем. Что именно у вас не работает? Вы зарегистрировались на chatgpt.com, зашли и у вас нет этой кнопки? Или она не нажимается?
Zara6502
а вы мне напоминаете человека который открывает книгу на последней странице, читает что "Гарри убил Эллен" и начинаете многозначительно удивляться, что за Гарри? Кто такая Эллен?
Есть скрины, есть текст, смотрите, читайте, осмысливайте.
Dolios
Подите в член. Вам помогают, а вы в ответ выёживаетесь. Что просто говорит о том, что вам не нужен ответ на вопрос, вам нужно поныть. Как обычно, впрочем.
Zara6502
и где я выеживался? я дал ответы на все ваши вопросы, если вы не следите за темой а читаете только то что интересно лично вам - ну читайте, только не удивляйтесь что перед вами не будут кланяться.
Mes
Похоже, не на все регионы раскатали новую фичу
GennPen
Не используйте общедоступные VPN, возьмите самый дешевый VPS/VDS.
Zara6502
это уже выпадает из категории бесплатного
GennPen
Тогда остается только страдать.
monowar
Тогда только разговор с живым человеком.
Zara6502
это очень оптимистично )
whoisking
Это приложение или сайт? Приложение (андроид) проверяет, работает ли впн и не пускает, а с сайтом ок через впн
Zara6502
сайт, мобилками не пользуюсь в таком ключе
gluki
Хожу через "Opera VPN": https://github.com/Snawoot/opera-proxy
cat024
Browsec расширение и всё работает, через Planet VPN тоже...
Zara6502
с Browsec помогло, спасибо.
li_0_li
Привязываете к иностранному номеру + привязка гугл аккаунта. Номер можно арендовать. Далее через впн
Zara6502
Kiridan
Если стоит прокси вроде антизапрета, то лучше отключить на всякий случай.
У меня через openVPN всё безупречно работает.
theurus
openrouter.ai
даже без логина работает
ну разумеется только чатик, без звука видео и картинок
Zara6502
У меня требует логин, после логина на первое же сообщение пишет что не хватает токенов.
Zara6502
Vasjen
Если нужно за 0 рублей. Находишь человека (желательно вне ИТ), которому не проблема оплатить ~5евро за VDS. Рассказываешь ему о приятном будущем, которое можно потрогать уже сейчас, и готов организовать ему доступ и поддержку работоспособности в замен на совместное использование. Арендуешь VDS, разворачиваешь либо это, либо это, либо еще что-то из этого. Или просто ставишь VPN и ходишь в бесплатный ChatGPT. И пользуешься за бесплатно.
Zara6502
мне проще ничего не делать вообще, раз уж это так сложно.
Dolios
Вы тут столько времени уже потратили, жалуясь на то, как всё сложно, что можно было 5 раз уже всё сделать за это время :)
GennPen
Сэкономить пачку сигарет или пару банок пива, закинуть сотку-другую на сервис типа gptunnel. Ну это маленькое зеленое существо душит.
Хотя, если именно chatgpt нужен, то придется побольше заморочиться.
Zara6502
пиво не пью, сигареты не курю, но спасибо что за меня решили как и куда мне деньги тратить.
Zara6502
да я уже давно всё сделал, просто вам забыл сообщить
GeorgeOvechkin
Эталонная пассивная агрессия
Zara6502
это ответ на агрессию, попу с пальцем не путайте
HireHoffee
прописать в настройках dns браузера "https://dns.controld.com/comss" и можно заходить без проблем и без ВПН.
GennPen
И как смена днс поможет в обходе блокировки на стороне сервиса?
HireHoffee
я не силен в технических деталях, просто недавно увидел способ, где говорилось что при смене днс в браузере можно без впн заходить на сайты многих заблокированных нейросеток, попробовал сменить и, по крайней мере у меня, это работает.
foxyrus
Работает!
aronsky
Ответ, который вас устроит: бесплатно вы это не попробуете. Нужно будет вложить либо усилия, либо деньги. И в первом и во втором случае - минимальные. Если не подходит - вам это не нужно: это для избалованных буржуев, что-то вроде рябчиков, Петрович шарит за машины реально (и это не сарказм сейчас) лучше, чем чатжипитишечка и сделает ликбез бесплатно, а не за рубли. Рубли лучше потратить на жигулевское.
Zara6502
Дак уже всё замечательно работает.
Не нужно, всё сделал в 2 клика.