Awakari — бесплатный сервис поиска и фильтрации сообщений в режиме реального времени. Сервис ищет то, что интересно пользователю, среди тысяч сообщений в час из множества источников, таких как Fediverse, ленты RSS, каналы Телеграм.

Исторически Awakari интегрирован с Телеграм, используя его для идентификации пользователя и уведомления о результатах. В дополнение к Телеграм, теперь также доступны:

  1. Вход с помощью Google

  2. Чтение результатов поиска в формате RSS

Теперь сервис доступен также для пользователей, у которых нет аккаунта в Телеграм. Awakari принципиально не хранит никаких данных пользователей кроме их уникальных идентификаторов с префиксом провайдера. Поэтому способ входа определяет способ получения результатов:

RSS-лента результатов доступна при входе с помощью Google
RSS-лента результатов доступна при входе с помощью Google

После входа через Google нужно создать новую подписку и получить ссылку на ленту с результатами:

Для уже существующих подписок также можно легко найти ссылку на RSS:

Достаточно просто скопировать ссылку и использовать её в любом удобном приложении для чтения RSS. Лента будет содержать все результаты за последние 24 часа, но не более 10. Возможно увеличение количества результатов в ленте (до 100) с помощью URL-параметра "limit". Так как Awakari - это event-driven система, то она также может присылать (push) результаты на webhook по протоколу WebSub.

Комментарии (8)


  1. imageman
    28.05.2024 15:17
    +1

    Так и хочется воскликнуть "Боже мой! Что это?". Настолько минималистичный дизайн, что ничего не понятно. Дайте более подробное описание. Это может быть мега полезной вещью, но пользоваться не понятно как. Поэтому 1 балл из 5. И непонятная ошибка "failed to parse the etag header value: strconv.Atoi: parsing "": invalid syntax"


    1. akurilov Автор
      28.05.2024 15:17

      Спасибо за сообщение об ошибке, будет пофиксено.

      Я художник я так вижу изначально задумывал интерфейс минималистичным. Если есть более детальные пожелания, где можно сделать более понятным, то они приветствуются

      UPD: ошибка починена


  1. imageman
    28.05.2024 15:17

    Атрибуты ключевых слов, что это? По клику всплывает менюшка, а там всякие "cc" и "type". Ключевые слова, видимо, можно несколько - как их разделять? Что значит "exact"?
    Атрибуты ключевых слов, что это? По клику всплывает менюшка, а там всякие "cc" и "type". Ключевые слова, видимо, можно несколько - как их разделять? Что значит "exact"?

    Хочется где-нибудь видеть пример результата в виде списка прямо в браузере. Хочется более подробной обучалки. Чтобы через find можно было в документации найти хотя бы основные моменты. А вообще я давно мечтаю об агрегаторе, который производит нечеткий поиск по смыслу. Т.е. я накидываю статьи, которые мне нравятся, отмечаю те, что не нравятся. От этих статей берется embedding (через нейросеть) и дальше ступает в действие векторные БД или FAISS. Видимо прямо сейчас идет разработка, т.к. сервис не работает...


    1. akurilov Автор
      28.05.2024 15:17

      Спасибо за взгляд со стороны. Действительно, есть что улучшать.

      Какой сервис не работает?

      Upd видимо, спот нода уходила


    1. akurilov Автор
      28.05.2024 15:17

      Атрибуты это атрибуты сообщения для сопоставления. Если не указывать (пусто), то поиск происходит по всем атрибутам сообщений.

      Ключевые слова должны разделяться пробелами. Но запятые стемминг тоже повыбрасывает.

      Exact значит точное совпадение текста


      1. imageman
        28.05.2024 15:17
        +1

        "атрибуты для сопоставления".... Ты как разработчик, видимо понимаешь все эти CC или width. А для обычно пользователя? Какая ширина ("width") может быть у сообщения? Аналогично с другими терминами (лучше дать возможность прочитать и получить помощь, чем не дать).
        "точное совпадение текста" - дословный перевод с английского понимаю. Но когда у меня несколько слов, то не понимаю как это будет работать. К примеру, набор ключевых слов "работать, быстро" с галочкой Exact будет искать только "работать, быстро" или найдет так же "работать быстро" и "быстро работать"? Без галочки, как я понимаю, он ищет вхождение подстроки, с галочкой он смотрит на совпадение с границей слова (whole words only) и порядок слов не важен? А как быть, когда порядок слов важен?


        1. akurilov Автор
          28.05.2024 15:17

          Честно говоря, в авакари довольно много всяких деталей и я все навскидку не помню. Думаю, такие вопросы легко решаются экспериментально. Отправляете сообщение с произвольными атрибутами и проверяете, совпало ли оно с условиями вашей подписки или нет.

          По поводу атрибутов типа width, согласен, схема данных пока приблизительная и её ещё предстоит определить. Сейчас есть "расширения", которые производят сообщения из внешних источников, таких как RSS, Telegram и пр. Они довольно произвольно конвертируют атрибуты.


        1. akurilov Автор
          28.05.2024 15:17

          Я добавил примеры подписок, которые навскидку могу себе представить