DeepSeek-R1 для чайников +80 03.02.2025 19:30 Razant 12 Блог компании AIRI Машинное обучение Natural Language Processing Искусственный интеллект
DeepSeek-R1 для чайников +80 03.02.2025 19:30 Razant 12 Математика Блог компании AIRI Машинное обучение Natural Language Processing Искусственный интеллект
Законы масштабирования – архитектура O1 Pro // Инфраструктура синтетических данных, RLAIF, токеномика вычислений +1 27.12.2024 11:09 kucev 0 Big Data Data Engineering Data Mining Искусственный интеллект Машинное обучение
Poisoned Data — отравление данных для LLM и создание «Спящего Агента» 20.08.2024 06:00 MrsWallbreaker 0 Машинное обучение Искусственный интеллект Natural Language Processing
RLHF. История становления идеи — 4. HHH: helpful, honest, harmless, Instruct LLM, Constitutional AI 10.08.2024 06:00 MrsWallbreaker 0 Машинное обучение Искусственный интеллект Natural Language Processing
RLHF. История становления идеи — 3. Supervised finetune, Протокольный сбор обратной связи, Batch RL 03.08.2024 06:00 MrsWallbreaker 0 Машинное обучение Искусственный интеллект Natural Language Processing
RLHF. История становления идеи — 2 26.07.2024 06:00 MrsWallbreaker 0 Машинное обучение Искусственный интеллект Natural Language Processing
Обучение с подкреплением на основе обратной связи от человека (RLHF). История становления идеи 19.07.2024 20:11 MrsWallbreaker 0 Машинное обучение Искусственный интеллект Natural Language Processing
Новый «ИИгрок»: что мы знаем о Grok? 05.04.2024 08:43 CyberPaul 0 Блог компании Serverspace IT-инфраструктура История IT Искусственный интеллект IT-компании
Reinforcement Learning from Human Feedback: когда одной математики мало +6 21.08.2023 13:06 dustalov 2 Будущее здесь Big Data Открытые данные Машинное обучение Искусственный интеллект
Тварь дрожащая или право имею: как мы лепили виртуального юриста из русскоязычных нейросетей +24 18.05.2023 15:01 Alliesverse 20 Functional Programming Machine Learning Artificial Intelligence Big Data Функциональное программирование Машинное обучение Искусственный интеллект
Алгоритм, сделавший ChatGPT таким «человечным» — Reinforcement Learning from Human Feedback +13 25.04.2023 14:47 Nastaa 9 Data Mining Алгоритмы Машинное обучение Искусственный интеллект Будущее здесь
ChatGPT — лучший помощник программиста. Примеры реальных задач. Плагины и инструменты +47 17.04.2023 09:00 alizar 80 Блог компании RUVDS.com Программирование Машинное обучение Искусственный интеллект Будущее здесь