Awakari — бесплатный сервис поиска и фильтрации сообщений в режиме реального времени. Сервис ищет то, что интересно пользователю, среди тысяч сообщений в час из множества источников, таких как Fediverse, ленты RSS, каналы Телеграм.
Исторически Awakari интегрирован с Телеграм, используя его для идентификации пользователя и уведомления о результатах. В дополнение к Телеграм, теперь также доступны:
Вход с помощью Google
Чтение результатов поиска в формате RSS
Теперь сервис доступен также для пользователей, у которых нет аккаунта в Телеграм. Awakari принципиально не хранит никаких данных пользователей кроме их уникальных идентификаторов с префиксом провайдера. Поэтому способ входа определяет способ получения результатов:
После входа через Google нужно создать новую подписку и получить ссылку на ленту с результатами:
Для уже существующих подписок также можно легко найти ссылку на RSS:
Достаточно просто скопировать ссылку и использовать её в любом удобном приложении для чтения RSS. Лента будет содержать все результаты за последние 24 часа, но не более 10. Возможно увеличение количества результатов в ленте (до 100) с помощью URL-параметра "limit". Так как Awakari - это event-driven система, то она также может присылать (push) результаты на webhook по протоколу WebSub.
Комментарии (8)
imageman
28.05.2024 15:17Хочется где-нибудь видеть пример результата в виде списка прямо в браузере. Хочется более подробной обучалки. Чтобы через find можно было в документации найти хотя бы основные моменты. А вообще я давно мечтаю об агрегаторе, который производит нечеткий поиск по смыслу. Т.е. я накидываю статьи, которые мне нравятся, отмечаю те, что не нравятся. От этих статей берется embedding (через нейросеть) и дальше ступает в действие векторные БД или FAISS. Видимо прямо сейчас идет разработка, т.к. сервис не работает...
akurilov Автор
28.05.2024 15:17Спасибо за взгляд со стороны. Действительно, есть что улучшать.
Какой сервис не работает?
Upd видимо, спот нода уходила
akurilov Автор
28.05.2024 15:17Атрибуты это атрибуты сообщения для сопоставления. Если не указывать (пусто), то поиск происходит по всем атрибутам сообщений.
Ключевые слова должны разделяться пробелами. Но запятые стемминг тоже повыбрасывает.
Exact значит точное совпадение текста
imageman
28.05.2024 15:17+1"атрибуты для сопоставления".... Ты как разработчик, видимо понимаешь все эти CC или width. А для обычно пользователя? Какая ширина ("width") может быть у сообщения? Аналогично с другими терминами (лучше дать возможность прочитать и получить помощь, чем не дать).
"точное совпадение текста" - дословный перевод с английского понимаю. Но когда у меня несколько слов, то не понимаю как это будет работать. К примеру, набор ключевых слов "работать, быстро" с галочкой Exact будет искать только "работать, быстро" или найдет так же "работать быстро" и "быстро работать"? Без галочки, как я понимаю, он ищет вхождение подстроки, с галочкой он смотрит на совпадение с границей слова (whole words only) и порядок слов не важен? А как быть, когда порядок слов важен?akurilov Автор
28.05.2024 15:17Честно говоря, в авакари довольно много всяких деталей и я все навскидку не помню. Думаю, такие вопросы легко решаются экспериментально. Отправляете сообщение с произвольными атрибутами и проверяете, совпало ли оно с условиями вашей подписки или нет.
По поводу атрибутов типа width, согласен, схема данных пока приблизительная и её ещё предстоит определить. Сейчас есть "расширения", которые производят сообщения из внешних источников, таких как RSS, Telegram и пр. Они довольно произвольно конвертируют атрибуты.
imageman
Так и хочется воскликнуть "Боже мой! Что это?". Настолько минималистичный дизайн, что ничего не понятно. Дайте более подробное описание. Это может быть мега полезной вещью, но пользоваться не понятно как. Поэтому 1 балл из 5. И непонятная ошибка
"failed to parse the etag header value: strconv.Atoi: parsing "": invalid syntax"
akurilov Автор
Спасибо за сообщение об ошибке, будет пофиксено.
Я
художник я так вижуизначально задумывал интерфейс минималистичным. Если есть более детальные пожелания, где можно сделать более понятным, то они приветствуютсяUPD: ошибка починена