• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом jailbreak

Guardrails для LLM на Java: как приручить промпт‑инъекции и токсичные ответы

  • 15.04.2026 11:43
  • Ratila
  • 4
  • Искусственный интеллект
  • Информационная безопасность
  • JAVA
  • Машинное обучение

Шифр онтографии: как я упаковываю субъектность и роли в LLM +8

  • 28.08.2025 14:46
  • uncia__poison
  • 11
  • Habr
  • GitHub
  • Информационная безопасность

Jailbreak ChatGPT-5, системный промпт, и скрытый контекст +11

  • 22.08.2025 19:31
  • Parcevale
  • 12
  • Информационная безопасность
  • Тестирование IT-систем
  • Машинное обучение

Джейлбрейк новой бесплатной модели OpenAI, GPT-OSS -5

  • 06.08.2025 15:40
  • olegchir
  • 17
  • Блог компании Anarchic
  • Блог компании Anarchic AI
  • Машинное обучение
  • Искусственный интеллект
  • Информационная безопасность

От мозга к мультиагентным системам: как устроены Foundation Agents нового поколения +3

  • 24.07.2025 21:44
  • redmadrobot
  • 8
  • red_mad_robot corporate blog
  • Artificial Intelligence
  • Research and forecasts in IT
  • Блог компании red_mad_robot
  • Искусственный интеллект
  • Исследования и прогнозы в IT

Обнаружение уязвимостей ИИ агентов. Часть I: Введение в уязвимости +1

  • 18.07.2025 08:41
  • nosystem0
  • 0
  • Информационная безопасность
  • Искусственный интеллект

Яндекс.Полуразврат или при чём тут Crypt? +7

  • 10.07.2025 13:50
  • HiveTyrant89
  • 43
  • Информационная безопасность
  • Машинное обучение
  • Тестирование IT-систем
  • Искусственный интеллект
  • Реверс-инжиниринг

Взлом AI Assistant через… философию? +31

  • 08.06.2025 17:00
  • Parcevale
  • 43
  • Информационная безопасность
  • Машинное обучение
  • Тестирование IT-систем

Claude Sonnet 4, и это самая защищенная модель? Wasted +8

  • 03.06.2025 20:01
  • Parcevale
  • 9
  • Информационная безопасность
  • Машинное обучение
  • Тестирование IT-систем

Комната Наверху и другие истории обхода LLM +16

  • 17.05.2025 19:22
  • wearetyomsmnv
  • 5
  • Информационная безопасность
  • Искусственный интеллект

Обзор уязвимостей для LLM. Часть 2. Защита +7

  • 09.01.2025 05:59
  • artmaro
  • 1
  • Блог компании Конференции Олега Бунина (Онтико)
  • Блог компании Raft
  • Искусственный интеллект
  • Машинное обучение
  • Информационная безопасность

Новый универсальный метод взлома LLM от Anthropic «Best-of-N Jailbreaking» +4

  • 14.12.2024 00:10
  • Ologos
  • 5
  • Информационная безопасность
  • Искусственный интеллект
  • Машинное обучение
  • Программирование
  • Научно-популярное

Как я взломал одну из самых топовых нейросетей (Claude 3.5 Sonnet) для студенческой научной статьи +61

  • 08.12.2024 17:49
  • Ologos
  • 32
  • Информационная безопасность
  • Искусственный интеллект
  • Машинное обучение
  • Программирование
  • Научно-популярное

Эксплойт iPhone 4, часть 1: получение доступа +1

  • 03.10.2023 15:20
  • bel1k0v
  • 4
  • Разработка под iOS
  • Реверс-инжиниринг

Jailbreak checker — как обезопасить свое iOS-приложение +15

  • 21.09.2023 12:40
  • tonya_fedorova
  • 28
  • Блог компании QIWI
  • Информационная безопасность
  • Программирование
  • Разработка под iOS
  • «
  • 1
  • 2
  • »
Страница 1 из 2
ЛУЧШЕЕ

  • Вчера
  • Позавчера
10:46

Фирма из 14 человек vs завод с 93-летней историей: Наглядный пример того, как убивают заводы +95

08:45

Маленькие секреты детского фонографа +47

09:55

far2l 2.8.0 в Ubuntu 26.04: новые классные фичи +40

09:01

Как поставить точку на беспорядке +34

13:01

Как фотографируют в космосе +24

00:00

Gemini перестал работать с VPN. Что делать? +22

08:00

Кислород из лунного грунта и новая космическая гонка: кто собрался строить инфраструктуру на Луне +14

08:00

Linux 7.1: отказ от прошлого и подготовка к новому железу +14

19:15

Модель термогенеза пчелы +13

11:30

Эстонская сланцевая энергетика: от революции к контрреволюции +12

10:50

Потоковая запись ADC семплов на STM32 +12

13:10

Знакомство с одним прогоном Mythos применительно к Firefox: а разговоров-то было? +9

12:16

Неприятный антиутопический мир центров обработки данных для ИИ +9

09:53

Применение платы Arduino Due для измерения параметров вибрации при балансировке роторов +9

05:59

Eat your own dog food: почему продукт, которым не пользуются создатели, обречён +9

04:34

Наглядный пример, зачем нужны агенты +9

17:24

«Очевидный вопрос»: годовой эксперимент по изучению семантического табу +8

17:10

Как мы продавали компьютеры в 90-х. Новые хлопоты +7

16:21

Пластиковые пакеты для спасения жизней новорождённых: фейк или нетипичная практика? +7

16:15

Биологический квайн: программа из 75 букв ДНК, которая копирует сама себя +7

07:32

Это — всё что вам надо знать о белых списках: как устроены и 6 способов обхода +366

23:06

Мама, я киберповстанец +165

21:38

Пекло +99

09:01

Почему не взлетели дирижабли? Часть 19: советские дирижабли накануне войны +45

13:01

Я проверил Wi-Fi 7 на практике: 3+ Гбит/сек по воздуху и нюансы +42

02:32

Yggdrasil-ng: как я переписал Yggdrasil на Rust за 3.5 дня и неделю фиксил один баг +36

13:16

Опасный ток: как плакаты и карикатуры поддерживали страх и что за ним стояло +28

17:45

StaticECS — Bitmap Entity Component System +27

15:06

Сломал руку, купил Pixel 10, возненавидел Gboard и написал свой офлайн-голосовой ввод для Android на GigaAM v3 +24

06:11

Локальные LLM на слабом железе — что ставить, как запустить, чего ждать +21

12:05

Лучший промпт для LLM. Бессмысленный поиск +17

13:30

IT: от сокращения до оффера. Полезные заметки на полях +16

08:00

Пять одноплатников 2026: новые чипы, больше памяти и неожиданные форматы +16

07:48

Накануне ввода «реестра криптанов» в РФ, давайте обратимся к французскому опыту +16

07:25

Что тренд грядущий нам готовит: как Netflix меняет правила игры в киноиндустрии на примере отчета Still Watching 2025 +15

14:16

О создании в России центральной базы данных идентификаторов пользовательского оборудования (оконечного оборудования) +14

21:15

Почему Хомский неудобен для AI-индустрии +11

16:02

Квантовый сапёр и квантовый тетрис: изучение квантовых феноменов через компьютерные игры +11

18:37

Своя почта против Gmail +10

18:39

Как я снимал короткометражку с тремя нейросетями и одним агентом +9

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.
ОБСУЖДАЕМОЕ

  • Фирма из 14 человек vs завод с 93-летней историей: Наглядный пример того, как убивают заводы +95

    • 166

    Это — всё что вам надо знать о белых списках: как устроены и 6 способов обхода +366

    • 144

    Gemini перестал работать с VPN. Что делать? +22

    • 90

    О создании в России центральной базы данных идентификаторов пользовательского оборудования (оконечного оборудования) +14

    • 72

    Кислород из лунного грунта и новая космическая гонка: кто собрался строить инфраструктуру на Луне +14

    • 62

    Мама, я киберповстанец +165

    • 62

    Какой VPN работает в России — надоело искать ответ, собрал каталог с голосованием -33

    • 55

    far2l 2.8.0 в Ubuntu 26.04: новые классные фичи +43

    • 35

    hh выкатил фичу, которая убьет ваши отклики и найм окончательно +1

    • 34

    Сломал руку, купил Pixel 10, возненавидел Gboard и написал свой офлайн-голосовой ввод для Android на GigaAM v3 +24

    • 33

    «Очевидный вопрос»: годовой эксперимент по изучению семантического табу +7

    • 32

    Kotlin — моя любовь, Java — моя судьба. История одного возвращения +8

    • 31

    Наглядная эволюция человека, на коротком отрезке времени +4

    • 30

    Yggdrasil-ng: как я переписал Yggdrasil на Rust за 3.5 дня и неделю фиксил один баг +36

    • 30

    Вышел DeepSeek V4. Почему это очень плохо для США? +7

    • 28

Подписка


  • Главная
  • Контакты
© 2026. Все публикации принадлежат авторам.