• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом датасет

Перевод датасета для оценки эмпатии на русский язык: подход, проблемы, результаты +1

  • 12.09.2025 07:12
  • dweebishqys
  • 1
  • Natural Language Processing
  • Искусственный интеллект
  • Data Mining
  • Машинное обучение

Готовим данные для LLM: открытые инструменты для нормализации, очистки и не только +2

  • 11.09.2025 14:44
  • randall
  • 0
  • Блог компании MWS
  • Искусственный интеллект
  • Машинное обучение
  • Big Data
  • Data Engineering

Когда YOLO не спасает: как один параметр может испортить всё +7

  • 03.09.2025 10:47
  • alexsphera
  • 1
  • Машинное обучение
  • Искусственный интеллект

40 млн GitHub-репозиториев: открытый датасет метаданных для анализа и обучения +4

  • 02.09.2025 15:14
  • Ibragim_bad
  • 1
  • Python
  • GitHub
  • Data Mining

Если нужно сгенерировать синтетические данные — подборка открытых решений +9

  • 30.07.2025 13:22
  • randall
  • 0
  • Блог компании MWS
  • Блог компании МТС
  • Искусственный интеллект
  • Машинное обучение
  • Открытые данные

Как мы построили embedding-модель уха на Vision Transformers: от идеи до 88% точности +8

  • 25.07.2025 10:57
  • alexsphera
  • 2
  • Машинное обучение
  • Искусственный интеллект

ИИ против русского налогового права, часть 2: тестируем топовые reasoning LLM на RuTaR

  • 22.07.2025 06:38
  • derunat
  • 0
  • Машинное обучение
  • Искусственный интеллект

Создаем датасет печатных букв с любым шрифтом за 170 строк +1

  • 04.07.2025 12:15
  • PoStM0DeRn
  • 3
  • Python
  • Искусственный интеллект
  • Машинное обучение
  • Обработка изображений

Как мы сделали полезным крупнейший русскоязычный датасет запросов к LLM +4

  • 20.06.2025 09:05
  • kucev
  • 2
  • Искусственный интеллект
  • Машинное обучение
  • Big Data
  • Data Mining
  • Data Engineering

Benchmark — разрушитель LLM'ок, или Как мы собрали свой мультиязычный SWE-Bench +4

  • 07.06.2025 11:17
  • vladislav_dt
  • 4
  • Блог компании Doubletapp
  • Data Mining
  • Искусственный интеллект
  • Машинное обучение
  • Data Engineering

В Москве идет Datafest 2025 -1

  • 30.05.2025 11:17
  • technofeya
  • 4
  • Машинное обучение
  • Конференции
  • GPGPU
  • Big Data
  • Исследования и прогнозы в IT

CV/ML-проект от идеи до продакшена: практическое руководство +3

  • 28.05.2025 11:48
  • vvmedyanik
  • 2
  • Искусственный интеллект
  • Управление продуктом
  • Машинное обучение

Как собирать данные: руководство для ИИ-стартапов +11

  • 19.02.2025 09:57
  • full_moon
  • 1
  • Блог компании Magnus Tech
  • Машинное обучение
  • Искусственный интеллект
  • Развитие стартапа

∇²DFT — новый датасет и бенчмарк для решения задач квантовой химии с помощью нейросетей +2

  • 25.12.2024 12:27
  • KuzmaKhrabrov
  • 3
  • Блог компании AIRI
  • Машинное обучение
  • Химия
  • Искусственный интеллект
  • Физика

Обзор платформы Kaggle для начинающих: от состязаний до менторской программы +8

  • 18.10.2024 17:49
  • skillfactory_school
  • 0
  • Машинное обучение
  • Блог компании SkillFactory
  • «
  • 1
  • 2
  • 3
  • 4
  • 5
  • »
Страница 1 из 5
ЛУЧШЕЕ

  • Вчера
  • Позавчера
05:48

Роскомнадзор как форпост свободы и анонимности в Интернете +64

08:10

Простой LC-пробник с e-ink дисплеем +50

09:01

Мои личные скрипты для повседневной работы +45

10:25

Просто используй кнопку +41

18:55

Пишем свою мобильную ОС с нуля на Rust +40

08:30

Почему библиотеки на С такие кривые +26

09:00

Создаем красивые и удобные CLI-приложения на Python с помощью Typer и Rich +25

17:03

Делаем Electron UI более «нативным». Простой гайд из 15 шагов +20

09:46

Баночка с кремом и поношенное нижнее белье. Не содержимое мусорного бака, а экспонаты музея возрастом почти 2 тыс. лет +20

07:05

Ностальгические игры: Painkiller +19

13:01

Почему размер наблюдаемой Вселенной не соответствует её возрасту, и каков её общий размер +15

12:04

Открываем RAG и интернет для LM Studio +15

10:16

Fedora Linux 43: полный переход на Wayland, свежий GNOME и RPM 6.0 +14

09:41

Алхимия дофамина: всё, что вы читали о гормонах, вам не поможет +14

08:49

Насколько Java быстрая? +9

04:15

Claw Engine: как студенты из НИУ ВШЭ релизнули MVP игрового движка +7

15:25

Ретровайб из 90-х: RFC по нетикету, развитию интернета и… варке кофе +6

13:50

PID 1 на минималках: свой init, который жмёт зомби +6

11:48

Песни птиц меняются, как языки у людей +6

08:00

Бум ИИ обернулся дефицитом: почему серверная память подорожала почти вдвое +6

14:05

Хакаем самую дешёвую консоль с Ozon +99

13:57

Я нанял джуна в свой open source проект. Вот что получилось +65

09:01

«Машина останавливается»: как в антиутопии 1909 года появились утонувшие в соцсетях хикки на самоизоляции? +60

06:13

Как я уменьшил Docker-образ Go-приложения с 1.92 GB до 9 MB +50

10:58

Запускаем GPT-OSS-120B на 6 Гб GPU и ускоряем до 30 t/s. Вам нужна RAM, а не VRAM. Параметр -cmoe для ускорения MoE LLM +49

07:05

Спермоботы атакуют +23

08:00

Домашний сервер в корпусе роутера: Asus выпустила девайс с ИИ, 4 ГБ ОЗУ и 32 ГБ памяти +22

14:25

Рисовый долгоносик на зерне риса и ещё 19 победителей конкурса микрофотографии Nikon Small World 2025 +19

13:05

Исследуем прошивку старого файлового сервера TrendNET TS‑U100 +19

06:00

С появлением ИИ работа опытного программиста стала намного сложнее +19

13:01

AAA-хоррор в 2025 году: возвращение к истокам и самоповторы +15

12:15

Джеффри Хинтон, крестный отец ИИ: «Хотите знать, как выглядит жизнь, когда ты не высший интеллект? Спросите у курицы» +12

08:29

Когда фантастика 1939 года становится реальностью 2025-го +12

07:00

Как мы автоматизировали сеть в облаке и как нам с этим помогла Аннушка +12

16:02

Кризис – это возможности для роста: как мы переходили на отечественный софт +10

16:42

Запатентованный призрак +9

05:21

Эффект Даннинга — Крюгера в нейросети. OCR распознавание текста LLM: доверяй, но проверяй +9

10:13

Как мы в Авито обучили ML-модель находить «договорённости» без данных о сделках +8

09:34

systemd-nspawn: запускаем FidoIP на Arch Linux +8

19:08

Ментальные ограничения в управлении продуктом: как они незаметно убивают инновации +7

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.
ОБСУЖДАЕМОЕ

  • Я нанял джуна в свой open source проект. Вот что получилось +65

    • 99

    Роскомнадзор как форпост свободы и анонимности в Интернете +64

    • 92

    Будет ли важна чистота кода в ближайшем будущем -8

    • 89

    С появлением ИИ работа опытного программиста стала намного сложнее +19

    • 82

    Почему библиотеки на С такие кривые +26

    • 70

    Как я уменьшил Docker-образ Go-приложения с 1.92 GB до 9 MB +50

    • 47

    Кризис – это возможности для роста: как мы переходили на отечественный софт +10

    • 45

    Хабр против ИИ: эпоха неолуддитов или как не потерять работу, когда в вашу компанию пришел ИИ -6

    • 38

    Хакаем самую дешёвую консоль с Ozon +99

    • 36

    Как Agile убил задачи про люки +4

    • 32

    Офлайн-конвертер PNG в WebP прямо в браузере +4

    • 30

    Мои личные скрипты для повседневной работы +45

    • 29

    Энкодер на базе HEDR и STM32 +7

    • 26

    Excommunicado. Прецедент Едилова +3

    • 25

    Больше, чем торт. Почему Хабр — отличная стартовая площадка для авторов +5

    • 24

Подписка


  • Главная
  • Контакты
© 2025. Все публикации принадлежат авторам.