Привет Хабр! Эта публикация про небольшую интеграцию внешнего сервиса в Хабр и Geektimes, о которой вы бы никогда и не узнали. Тут не будет ни строчки про блокчейн, ни про машинное обучение, ни даже про анализ исходников DOOM III. Зато будет немного котиков.


В этой небольшой пятничной заметке хочется рассказать про один классный сервис, который ежедневно помогает нам в работе. А именно — text.ru — сервис, который позволяет проверять тексты на уникальность, искать в них ошибки и т.д. Работает просто: открываете сайт, вставляете из буфера обмена текст и жмёте кнопку «Проверить на уникальность». Через некоторое время получите наглядный результат: какие куски текста и откуда позаимствованы:



> Увеличить картинку | Посмотреть результат проверки вживую

В случае сомнений, есть побуквенное сравнение каждого фрагмента взаимствования с оригиналом:



> Увеличить картинку

Как вы уже поняли, этот сервис оказался очень удобен для модерации публикаций, которые пользователи присылают нам в «Песочницу» — ведь надо проверить каждую, а их ежедневно присылают до нескольких десятков!

Когда-то давно мы просто копировали рандомные строчки публикаций и искали их в Яндексе или Гугле — если были точные совпадения нескольких кусочков, то материал отклонялся как копипаст. Позже мы наткнулись на text.ru и начали проверять тексты через него — всё же удобней и надёжней, когда проверяется вся публикация, причём не человеком, а роботом.

На данном этапе появилась первая заминка: даже если зарегистрироваться на сервисе, это всё равно был «бесплатный аккаунт», все материалы с которого вставали в «очередь на проверку» присылаемых в сервис текстов — иногда она могла длиться несколько минут, ведь пользователей довольно много. Несложно догадаться, что только проверка уникальности десятка «песочных» публикаций в таком случае могла легко растянуться на час, а ведь в них ещё надо поправить форматирование в соответствии с нашими «гайдлайнами», исправить ошибки, пунктуацию итд.

Решением стала покупка Pro-аккаунта, который помимо прочего позволяет проверять тексты без очереди — это уже немалая экономия времени. Второй плюс Pro-аккаунта — возможность за раз проверять тексты размером более 15000 символов. Третий плюс Pro-аккаунта — возможность получить доступ к API сервиса, которым мы благополучно воспользовались: в каждой «песочной» публикации появилась кнопка «Результат проверки на text.ru»:



Механика получилась следующая: пользователь присылал публикацию в песочницу, она автоматически проверялась на уникальность в сервисе и ссылка на страницу с результатом проверки вставлялась в шапку публикации, чтобы модератор мог нажать на неё и без всяких очередей посмотреть уже готовый результат (для каждого материала формируется уникальная ссылка, доступная только владельцу аккаунта). Получилась хорошая экономия времени на модерацию при её возросшем качестве.

Но тут нас ждал ещё один подводный камень. Даже имея Pro-аккаунт на сервисе, у него было суточное ограничение на количество проверяемых символов — 50000. Что такое 50 Кб текста? Кому-то этого хватит на неделю, но на Хабре иногда это одна публикация, а то и половинка. Если суточный лимит исчерпывался, то у публикации не появлялась заветная синяя «плашка» с результатами проверки. Для расширения этого ограничения на сервисе предлагается купить так называемые «пакеты символов» — пакет на 50 000 000 символов стоит 15000 рублей, например. В таком случае сначала расходуется ежедневно возобновляемый на Pro-аккаунте суточный лимит в 50000 символов, а уже потом — купленные символы. Честно. Но всё равно сама мысль «либо плати, либо мучайся с лимитами» при уже купленном Pro-аккаунте не очень радовала.

Здесь важно сделать небольшое отступление: данная интеграция сервиса была исключительно моей инициативой и сделать её приспичило в новогодние праздники. Несмотря на возможность оплаты услуг по безналичному расчёту, я не хотел ждать возни с бумажками и реквизитами, поэтому оплатил Pro-аккаунт на год из личных средств. Тогда я ещё не понимал дальнейшей арифметики работы с сервисом, но очень скоро понял, что все возможные лимиты Хабр исчерпывает довольно быстро, особенно если «в два смычка» с Geektimes.

А коты-то где?!


По закону подлости, суточные лимиты символов заканчивались в самый неподходящий момент. И однажды я попросил службу поддержки начислить немного символов, чтобы проверить работу системы:

Пользователь #12345 (09.02.2017 16:40:44)
Правильно ли я понимаю, что раз у нас ПРО-аккаунт, то каждый день нам начисляется 50000 символов на проверку через API? И когда мы их израсходуем, статьи перестают проверяться и возвращают ошибку «Нехватка символов на балансе»?

107248: https://text.ru/text_check/result/589c6e64432fa
107250: https://text.ru/text_check/result/589c6e6893129
107252: https://text.ru/text_check/result/589c6e6b56a26
107256: https://text.ru/text_check/result/589c6e6c7d7e2
107260:
Array
(
   [error_code] => 142
   [error_desc] => Нехватка символов на балансе
)
107302:
Array
(
   [error_code] => 142
   [error_desc] => Нехватка символов на балансе
)

Администрация (09.02.2017 17:01:46)
Да, вы можете тратить данный пакет на api-проверку. Как только символы закончатся, вам придет сообщение, которое вы написали ранее: «Нехватка символов на балансе».

Пользователь #12345 (09.02.2017 17:11:28)
Понял. А можете тогда уточнить, во сколько по московскому времени «начисляются» эти символы снова? Чтобы мы могли инициализировать повторную проверку тех текстов, что не вложились в лимит в предыдущие сутки?

Администрация (09.02.2017 17:19:01)
Каждый день ровно в полночь.

Пользователь #12345 (09.02.2017 17:24:32)
Может вы нам сейчас по дружбе начислите символов немножко, а мы вам котика?


Удивительно, но сработало — служба поддержки начислила приятный бонус в виде 600к символов, чего хватило для дальнейшей работы.
Администрация (09.02.2017 17:36:03)
Мы выдали вам бесплатный пакет символов :)

Пользователь #12345 (09.02.2017 17:46:58)
Мур! Вы делаете полезный сервис и нам нравится им пользоваться. Спасибо большое!

Администрация (09.02.2017 17:55:42)
Благодарим вас за данный отзыв о сервисе и милого котика! Хорошего вам дня!

Вскоре история повторилась:

Пользователь #12345 (03.03.2017 17:04:53)
Эх, если бы вы только знали, как хочется ещё от вас «бесплатный пакет символов»…
Котики ещё есть, если что! :)
Администрация (03.03.2017 17:22:32)
Давайте обменяемся — мы вам пакет, вы нам котика :)

Сказано — сделано:

Пользователь #12345 (03.03.2017 18:32:13)
Тогда вот котики! Весенние! :)



Администрация (03.03.2017 18:40:41)
Мы подарили вам пакет на 600 000 символов :)

Никогда такого не было и вдруг опять:

Пользователь #12345 (20.03.2017 15:56:11)
Эх да что ж такое-то, опять символы кончились. Может продолжим нашу добрую пушистую традицию? ) Вот, например, вы же наверняка не слышали (и в словарике нет) о такой породе кошек, как Бурма? И что ударение в этом слове может сразу на обе гласных быть:


Котик снова сделал своё дело.

Пользователь #12345 (04.04.2017 11:19:57)
Хьюстон, у нас проблемы, как слышно, приём. Хьюстон, у нас кончились символы, повторяю, кончились символы. Пришлите по возможности побольше, а то они тут быстро расходуются. Конец связи! :)



Администрация (04.04.2017 11:38:48)
Здравствуйте. Мы зачислили на ваш профиль новый пакет символов :)

Пользователь #12345 (04.04.2017 11:56:43)
Спасибо большое! 5 минут — полёт нормальный! :)

Через пару недель:

Пользователь #12345 (23.04.2017 23:57:42)
Пусть ваш завтрашний дёнь начнётся с коробки котят. Котята выросли немножко и тоже символов хотят :)



Администрация (24.04.2017 08:59:32)
Здравствуйте. Мы подарили вам 600 000 символов =)

… шли годы…

Пользователь #12345 (06.06.2017 16:25:41)
Здравствуйте! Подскажите пожалуйста, как бы получше у вас ещё символов выпросить? ) Может в качестве подарка на 11-летие Хабра? Вот и праздничный котик пришёл по этому случаю!


И снова сотрудники сервиса ответили взаимностью.

Не то чтобы у ТМ нет возможности оплатить работу сервиса, но в данном случае уже появился некий азарт с придумыванием текстов и поиском картинок, остановиться уже сложно :)

Пользователь #12345 (04.07.2017 16:56:37)
Здравствуйте, снова мы. Засыпаем и просыпаемся в страхе, что символы вот-вот закончатся (точнее уже закончились, перешли на ежедневный лимит от pro-аккаунта), save our souls :)



Администрация (04.07.2017 16:59:05)
Здравствуйте. Мы подарили вам 600 000 символов =)

Пользователь #12345 (04.07.2017 17:00:33)
Мрррм, спасибо!


Пользователь #12345 (09.07.2017 03:53:39)
Просто внеплановый ночной котик, правда, морской:



Администрация (09.07.2017 08:10:01)
Мяу)

И вот недавнее:
Пользователь #12345 (03.08.2017 14:28:45)
Здравствуйте! Эх, все по отпускам разъехались, кота покормить некому! :)



Администрация (03.08.2017 14:34:30)
Здравствуйте. Мы покормили кота и подарили вам пакет на 600 000 тысяч символов :)

Пользователь #12345 (03.08.2017 14:40:58)
Поели, теперь можно и поспать. Спасибо! :)


Собственно, вот уже как полгода песочницы на наших сервисах работает только за счёт котиков :)

The end


Иногда в песочницу присылают публикации про основы JS/CSS, решения задач, подборки лайфхаков для коммандной строки или рассказы о том, как кто-то начал программировать в три года. Иногда мы пропускаем такие публикации, заведомо зная, что их заминусуют, а в комментариях обязательно появится «как за это вообще выдали инвайт?». В данном случае хочется напомнить одно: «Песочница» — это не кузница золотых публикаций, это своего рода небольшой вступительный экзамен, который должен пройти новый пользователь, чтобы стать полноценным участником сообщества. В то время как именно сообщество выступает в роли экзаменатора и вершит судьбы. Поэтому есть небольшое предложение: давайте относиться к публикациям из «песочницы» немного более лояльно.

? ? ?

Когда-то я тоже работал в суппорте Хабра и знаю, как эта работа иногда бывает утомительна. И как поднимали настроение периодические шутки пользователей — это прям как маленький островок позитива в океане рутины и однообразия. И сейчас мне приятно от мысли, что котики вызывают у сотрудника поддержки на том конце провода хотя бы улыбку. А может быть там даже несколько сотрудников сидят и иногда на обеде спрашивают друг у друга: «ну как там, эти, с Хабра, новых котов не присылали?» :)

Спасибо сервису text.ru за эту особенную лояльность, которая очень располагает и которой не могут похвастаться угрюмые и бездушные службы поддержек многих других сервисов.

P.S.

— Всегда общайтесть со службой поддержкой вежливо, даже если у вас «накипело»;
— Если для решения проблемы одна из сторон согласна на котиков, то вторая сторона должна выбирать только самых лучших котиков;
— Если котики не сработали, попробуйте заслать собакена;
— Не шлите котиков и собакенов нам в суппорт и в корп.отдел, там у всех аллергия :)
Данную публикацию просили выпустить без смайликов — нарушаю как могу
P.P.S.

> Сервис распознавания котов
> Сколько котов на Хабре?
> Генератор случайных котов

Хороших выходных!

Комментарии (28)


  1. LoadRunner
    04.08.2017 14:29
    +3

    А на уникальность котов проверка есть?


  1. JustRamil
    04.08.2017 14:31
    -42

    Пост надо было назвать «Хабр в восторге от text.ru». Вы это всерьез? У вас тут сообщество разработчиков, а вы описываете как выпрашиваете символы у службы поддержки. Вы же могли сами написать или бросить клич. Но вы зачем то пиарите чужой сервис. И как быть другим рекламодателям? Которые честно платят вам деньги за Мегапосты и корпоративные блоги.


    1. Fortisa
      04.08.2017 14:57
      +32

      А как быть с такими, как вы, которые мало что пиарили всё что ни лень и помимо постов (Zoho, привет!), да ещё и ломят 40 000 за пост от вашего имени? При том, что сам вы говорите весьма неграмотно и кто пишет посты вам — ещё боооольшой вопрос. Ваш снобизм уже всех достал. Я недавно на Хабре, но уже против вас сформировался негатив. Хотя да, я вас знала и до Хабра.

      Что касается публикации — суперский пятничный пост.


      1. JustRamil
        04.08.2017 21:31
        -19

        А как быть с такими, как вы, которые мало что пиарили всё что ни лень и помимо постов (Zoho, привет!), да ещё и ломят 40 000 за пост от вашего имени?

        Вы ошиблись, я беру 340 т.
        При том, что сам вы говорите весьма неграмотно и кто пишет посты вам — ещё боооольшой вопрос. Ваш снобизм уже всех достал.


        Пруфы or GTFO!


        1. Itimora
          04.08.2017 22:12
          +8

          Вы же сами себя топите. Первый злой и реально не в тему комментарий написали, а теперь продолжаете. Вы же сольётесь!


          1. JustRamil
            04.08.2017 22:34
            -13

            Amicus Plato, sed magis amica veritas

            Администрация не хочет писать ответ на мой комментарий, но клевету, иначе это не назвать, она пропускает. Я отлично понимаю мой комментарий и разместил его потому что считаю нужным, разность мнений. Да, я не преклоняюсь перед котиками и перед пятницей, и не считаю их достаточным оправданием для того чтобы перестать быть критичным.


  1. cssman
    04.08.2017 14:50
    +5

    IT s beautiful :3
    image


  1. mike_y_k
    04.08.2017 15:49

    Отлично! Спасибо! Особенно после обсуждения проблем с VPN и НАСФИТ :D


  1. Serenevenkiy
    04.08.2017 15:55
    +7

    На Самюэля Л Джексона похож
    image



  1. sefus
    04.08.2017 16:42
    +2

    Text.ru — Отличный сервис, давно пользуюсь. Его бы еще внедрить для переводов не помешало.


  1. Kriminalist
    04.08.2017 18:08

    Выдали б они вам плашку «уникальность поста проверена text.ru», и дали бы анлим.


    1. MonstraG
      04.08.2017 18:53
      +3

      Но тогда им больше не будут присылать котиков!


      1. Nixhibrid
        04.08.2017 22:08

        тут автоматизации на пол часа и на коленке!


  1. mrholycookie
    04.08.2017 18:17

    Большое спасибо за пятничный пост-котэ. Сервису +1. Пользуемся давно и все устраивает. Развития и успехов!


  1. TimsTims
    04.08.2017 19:19
    +1

    А правильно ли я понял, что если вам кто-то запостит пару сотен статей на 50 к символов, то вам снова придётся выпрашивать котиков?)))


    1. Boomburum Автор
      04.08.2017 19:21
      +1

      В целом да и я думал об этом :) Но пока такого не было (и надеюсь не будет).


      1. iClo
        10.08.2017 18:08

        После данной публикации могут найтись желающие :)


  1. lxsmkv
    04.08.2017 19:59
    +3

    Всегда представлял себе администрацию хабра весьма суровой. А тут такое. Сразу на сердце потеплело. Ваша карма на моем балансе переползла из синего сектора в зеленый :)


  1. seniorcote
    04.08.2017 21:51
    +3

    Отличный пост! Отсыпаю вам котиков, ни в чем себе не отказывайте :)

    Котики
    image
    image
    image
    image


  1. Norraxx
    04.08.2017 21:55
    +4

    А ещё котиков можно генерить: http://thecatapi.com/
    image


  1. 3epo
    06.08.2017 01:46

    Хороший сервис «text.ru». Когда-то с помощью этого сервиса меня учили писать уникальные статьи для модерации одного кибер-новостного сайта. Спасибо за котиков ^__^


  1. Wan-Derer
    06.08.2017 12:37

    Хрень какая-то а не сервис. Вставил статью, полностью выдуманную из головы. Итог: уникальность 0.02%, заспамленность 47%, воды 20%… Аут!
    Значит что? Голова копипастит автоматически и если рассказываешь о технических вещах — это сразу спам?
    С "водой" ещё могу согласиться т.к. лирические отступления люблю… А остальное хрень да и только.
    И вообще, как можно проверить, скажем, курсовик если он по определению основан на источниках?
    Если источники технические, то там и по стилю ничего не поправишь обычно. Да и нормально это — делать работу на основе других работ, применяя их к своей задаче.
    Главное не забыть их указать в перечне источников.


    1. Regis
      07.08.2017 20:41

      Одно дело, когда вы ссылаетесь на источники и своими словами описываете часть их содержимого. И совсем другое дело, если вы копируете текст их них 1 к 1 и даже не оформляете его как цитаты.


      1. Wan-Derer
        07.08.2017 21:54

        КМК, если пишешь курсач по математике, то умумукаешься пересказывать источники своими словами.
        … кажись, я понял почему уникальность ноль. Он просто нашёл уже опубликованную статью, из которой я вставлял тест. Ладно, примем.
        Но по поводу спама…

        Картинко
        image


  1. Pavel1114
    09.08.2017 12:17

    Даже на хабре подборку фото котов могут заплюсовать только из за имени автора. Попробуйте представить, чтобы такое было опубликовано кем либо другим не имеющим отношения к администрации и не столь популярным.


  1. GlaDosEvolution
    09.08.2017 12:17

    Мур :)

    if (cats == 0) make.spawn_cats(infinity);


  1. Farxial2
    09.08.2017 12:17

    Если так получилось не потому что вы самый крупный русскоязычный IT-портал — всё это здорово)