Каждую неделю мир машинного обучения наполняется новыми открытиями, проектами и статьями, которые не только вдохновляют дата саентистов, но и расширяют горизонты знаний.

В этой статье мы собрали для вас подборку самых интересных и актуальных материалов недели, которые помогут вам быть в курсе последних тенденций и достижений.

? Полезные инструменты недели

LLaMa 3 - это главный релиз недели. Новая SOTA в open-source! LLM с открытым исходным кодом, которая превосходит Claude 3 Opus... и дышит в спину GPT-4.Скорость работы составляет почти 300 токенов в секунду. LLAMA-3 - самая загружаемая модельна HF.

Torchtune - новая PyTorch-библиотека для файнтюнинга LLM. Библиотека сделана на базе PyTorch и и поддерживает LLama2 7B/13B, Mistral 7B и Gemma 2B.

LLM Reka Core - новая передовая нейросеть способна обрабатывать текст, изображения, аудио и видео, чем выделяется среди других технологий в своем классе.

VASA-1 - ананас нового ИИ генератора от Microsoft Research видео, который выглядит очень реалистично.

AutoCodeRover - это полностью автоматизированный инструмент для исправления ошибок на GitHub (исправление ошибок в разделе issues и генерации новых функций в проект).

Tkinter Designer — инструмент, который автоматически конвертирует дизайны Figma в код Tkinter GUI.

• OmniFusion 1.1. - гибридная LLM для работы с картинками

VoiceCraft: Zero-Shot - мощный редактор речи и преобразователь Text2Speech


? Бесплатные книги недели:

Учебник, где собрана коллекция задачек о нейросетях, параллельно даётся необходимая теория с объяснением

Google выпустила крутой бесплатный  учебник по промпт-инжинирингу!

Foundation of computer Vision 

Бесплатня книга научная визуализация: Python + Matplotlib

? Статьи:

Простейшая нейронная сеть, мой опыт и выводы

Визуализация гравюры немецкого художника Альбрехта Дюрера с Matplotlib

LOCOST и SPECTRUM, два подхода к суммаризации

 — Prepacking - простой метод, позволяющий увеличить скорость работы LLM в 6 раз и эффективность использования памяти в 16 раз.

Scaling Instructable Agents Across Many Simulated Worlds 

Не DeepL-ом единым. Нейросетевой переводчик для ваших проектов в VS Code за пару кликов

На чем программируют суровый ML в Гугле

Заменят ли LLM людей в разметке данных для AI?

Как мы тестировали большие языковые модели для модерации отзывов

Распознавание лиц на микрокомпьютерах

Книга «Разработка приложений на базе GPT-4 и ChatGPT»

Что такое Charmed Kubeflow?

Linux of AI : Why Open Interpreter poised to completely disrupt how we interact with Technology?

The Optimal Choice of Hypothesis Is the Weakest, Not the Shortest

From Words to Numbers: Your Large Language Model Is Secretly A Capable Regressor When Given In-Context Examples

From Model-centered to Human-Centered: Revision Distance as a Metric for Text Evaluation in LLMs-based Applications

The Topos of Transformer Networks

Learning Agile Soccer Skills for a Bipedal Robot with Deep Reinforcement Learning

Impact of Extensions on Browser Performance: An Empirical Study on Google Chrome

Increased LLM Vulnerabilities from Fine-tuning and Quantization

The Use of Generative Search Engines for Knowledge Work and Complex Tasks

94% on CIFAR-10 in 3.29 Seconds on a Single GPU

?‍? Бесплатные курсы недели:

Машинное обучение на графах - бесплатный продвинутый курс:  Машинное обучение на графах. Курс регулярно дополняется практическими задачками и слайдами. Автор Ксавье Брессон - профессор национального университета  

Основы квантования - Новый краткий курс, созданный в сотрудничестве DeepLearning.AI с Hugging

Курс Геопространственный анализ данных - Первый открытый русскоязычный курс по геоаналитике. Материалы курса будут полезны специалистам в области Data Scientist, поскольку позволят решать геопространственные задачи, а также проводить исследования в области Geospatial Data Science.

? Видео:

? Мат.основы машинного обучения и прогнозирования (⏱ 1:22:10)

LLaMA 3 Tested!! Yes, It’s REALLY That GREAT (⏱ 15:02)

? Is My NLP Model Working? The Answer is Harder Than You Think with Graham Neubig, PhD (⏱ 35:11)

?Клон ChatGPT на Django (⏱ 20:11)

? Truth Checker: Generative Large Language Models and Hallucinations with Chandra Khatri (⏱ 40:47)

? ODSC Webinar | Building Responsible and Safe Generative AI Applications (⏱ 51:00)

Спасибо за внимание, хорошего дня!

Комментарии (3)


  1. Shado_vi
    20.04.2024 10:49

    есть сайты с рейтингами по генерации шаблонов кода?
    кроме как для языков Python и JavaScript?
    ещё бы возможность самому сравнить что какая модель выдала по запросу.
    или ниша ещё не занята?


    1. freQuensy23
      20.04.2024 10:49
      +1

      LLM arena


  1. ainu
    20.04.2024 10:49
    +1

    которая превосходит Claude 3 Opus... и дышит в спину GPT-4

    Это не совсем так (вернее совсем не так). К тому же это GPT-4 дышит в спину Опусу.