Привет Хабр! Эта публикация про небольшую интеграцию внешнего сервиса в Хабр и Geektimes, о которой вы бы никогда и не узнали. Тут не будет ни строчки про блокчейн, ни про машинное обучение, ни даже про анализ исходников DOOM III. Зато будет немного котиков.
В этой небольшой пятничной заметке хочется рассказать про один классный сервис, который ежедневно помогает нам в работе. А именно — text.ru — сервис, который позволяет проверять тексты на уникальность, искать в них ошибки и т.д. Работает просто: открываете сайт, вставляете из буфера обмена текст и жмёте кнопку «Проверить на уникальность». Через некоторое время получите наглядный результат: какие куски текста и откуда позаимствованы:
> Увеличить картинку | Посмотреть результат проверки вживую
В случае сомнений, есть побуквенное сравнение каждого фрагмента взаимствования с оригиналом:
> Увеличить картинку
Как вы уже поняли, этот сервис оказался очень удобен для модерации публикаций, которые пользователи присылают нам в «Песочницу» — ведь надо проверить каждую, а их ежедневно присылают до нескольких десятков!
Когда-то давно мы просто копировали рандомные строчки публикаций и искали их в Яндексе или Гугле — если были точные совпадения нескольких кусочков, то материал отклонялся как копипаст. Позже мы наткнулись на text.ru и начали проверять тексты через него — всё же удобней и надёжней, когда проверяется вся публикация, причём не человеком, а роботом.
На данном этапе появилась первая заминка: даже если зарегистрироваться на сервисе, это всё равно был «бесплатный аккаунт», все материалы с которого вставали в «очередь на проверку» присылаемых в сервис текстов — иногда она могла длиться несколько минут, ведь пользователей довольно много. Несложно догадаться, что только проверка уникальности десятка «песочных» публикаций в таком случае могла легко растянуться на час, а ведь в них ещё надо поправить форматирование в соответствии с нашими «гайдлайнами», исправить ошибки, пунктуацию итд.
Решением стала покупка Pro-аккаунта, который помимо прочего позволяет проверять тексты без очереди — это уже немалая экономия времени. Второй плюс Pro-аккаунта — возможность за раз проверять тексты размером более 15000 символов. Третий плюс Pro-аккаунта — возможность получить доступ к API сервиса, которым мы благополучно воспользовались: в каждой «песочной» публикации появилась кнопка «Результат проверки на text.ru»:
Механика получилась следующая: пользователь присылал публикацию в песочницу, она автоматически проверялась на уникальность в сервисе и ссылка на страницу с результатом проверки вставлялась в шапку публикации, чтобы модератор мог нажать на неё и без всяких очередей посмотреть уже готовый результат (для каждого материала формируется уникальная ссылка, доступная только владельцу аккаунта). Получилась хорошая экономия времени на модерацию при её возросшем качестве.
Но тут нас ждал ещё один подводный камень. Даже имея Pro-аккаунт на сервисе, у него было суточное ограничение на количество проверяемых символов — 50000. Что такое 50 Кб текста? Кому-то этого хватит на неделю, но на Хабре иногда это одна публикация, а то и половинка. Если суточный лимит исчерпывался, то у публикации не появлялась заветная синяя «плашка» с результатами проверки. Для расширения этого ограничения на сервисе предлагается купить так называемые «пакеты символов» — пакет на 50 000 000 символов стоит 15000 рублей, например. В таком случае сначала расходуется ежедневно возобновляемый на Pro-аккаунте суточный лимит в 50000 символов, а уже потом — купленные символы. Честно. Но всё равно сама мысль «либо плати, либо мучайся с лимитами» при уже купленном Pro-аккаунте не очень радовала.
Здесь важно сделать небольшое отступление: данная интеграция сервиса была исключительно моей инициативой и сделать её приспичило в новогодние праздники. Несмотря на возможность оплаты услуг по безналичному расчёту, я не хотел ждать возни с бумажками и реквизитами, поэтому оплатил Pro-аккаунт на год из личных средств. Тогда я ещё не понимал дальнейшей арифметики работы с сервисом, но очень скоро понял, что все возможные лимиты Хабр исчерпывает довольно быстро, особенно если «в два смычка» с Geektimes.
По закону подлости, суточные лимиты символов заканчивались в самый неподходящий момент. И однажды я попросил службу поддержки начислить немного символов, чтобы проверить работу системы:
Удивительно, но сработало — служба поддержки начислила приятный бонус в виде 600к символов, чего хватило для дальнейшей работы.
Вскоре история повторилась:
Сказано — сделано:
Никогда такого не было и вдруг опять:
Котик снова сделал своё дело.
Через пару недель:
… шли годы…
И снова сотрудники сервиса ответили взаимностью.
Не то чтобы у ТМ нет возможности оплатить работу сервиса, но в данном случае уже появился некий азарт с придумыванием текстов и поиском картинок, остановиться уже сложно :)
И вот недавнее:
Собственно, вот уже как полгода песочницы на наших сервисах работает только за счёт котиков :)
Иногда в песочницу присылают публикации про основы JS/CSS, решения задач, подборки лайфхаков для коммандной строки или рассказы о том, как кто-то начал программировать в три года. Иногда мы пропускаем такие публикации, заведомо зная, что их заминусуют, а в комментариях обязательно появится «как за это вообще выдали инвайт?». В данном случае хочется напомнить одно: «Песочница» — это не кузница золотых публикаций, это своего рода небольшой вступительный экзамен, который должен пройти новый пользователь, чтобы стать полноценным участником сообщества. В то время как именно сообщество выступает в роли экзаменатора и вершит судьбы. Поэтому есть небольшое предложение: давайте относиться к публикациям из «песочницы» немного более лояльно.
? ? ?
Когда-то я тоже работал в суппорте Хабра и знаю, как эта работа иногда бывает утомительна. И как поднимали настроение периодические шутки пользователей — это прям как маленький островок позитива в океане рутины и однообразия. И сейчас мне приятно от мысли, что котики вызывают у сотрудника поддержки на том конце провода хотя бы улыбку. А может быть там даже несколько сотрудников сидят и иногда на обеде спрашивают друг у друга: «ну как там, эти, с Хабра, новых котов не присылали?» :)
Спасибо сервису text.ru за эту особенную лояльность, которая очень располагает и которой не могут похвастаться угрюмые и бездушные службы поддержек многих других сервисов.
P.S.
— Всегда общайтесть со службой поддержкой вежливо, даже если у вас «накипело»;
— Если для решения проблемы одна из сторон согласна на котиков, то вторая сторона должна выбирать только самых лучших котиков;
— Если котики не сработали, попробуйте заслать собакена;
— Не шлите котиков и собакенов нам в суппорт и в корп.отдел, там у всех аллергия :)
Данную публикацию просили выпустить без смайликов — нарушаю как могу
P.P.S.
> Сервис распознавания котов
> Сколько котов на Хабре?
> Генератор случайных котов
Хороших выходных!
В этой небольшой пятничной заметке хочется рассказать про один классный сервис, который ежедневно помогает нам в работе. А именно — text.ru — сервис, который позволяет проверять тексты на уникальность, искать в них ошибки и т.д. Работает просто: открываете сайт, вставляете из буфера обмена текст и жмёте кнопку «Проверить на уникальность». Через некоторое время получите наглядный результат: какие куски текста и откуда позаимствованы:
> Увеличить картинку | Посмотреть результат проверки вживую
В случае сомнений, есть побуквенное сравнение каждого фрагмента взаимствования с оригиналом:
> Увеличить картинку
Как вы уже поняли, этот сервис оказался очень удобен для модерации публикаций, которые пользователи присылают нам в «Песочницу» — ведь надо проверить каждую, а их ежедневно присылают до нескольких десятков!
Когда-то давно мы просто копировали рандомные строчки публикаций и искали их в Яндексе или Гугле — если были точные совпадения нескольких кусочков, то материал отклонялся как копипаст. Позже мы наткнулись на text.ru и начали проверять тексты через него — всё же удобней и надёжней, когда проверяется вся публикация, причём не человеком, а роботом.
На данном этапе появилась первая заминка: даже если зарегистрироваться на сервисе, это всё равно был «бесплатный аккаунт», все материалы с которого вставали в «очередь на проверку» присылаемых в сервис текстов — иногда она могла длиться несколько минут, ведь пользователей довольно много. Несложно догадаться, что только проверка уникальности десятка «песочных» публикаций в таком случае могла легко растянуться на час, а ведь в них ещё надо поправить форматирование в соответствии с нашими «гайдлайнами», исправить ошибки, пунктуацию итд.
Решением стала покупка Pro-аккаунта, который помимо прочего позволяет проверять тексты без очереди — это уже немалая экономия времени. Второй плюс Pro-аккаунта — возможность за раз проверять тексты размером более 15000 символов. Третий плюс Pro-аккаунта — возможность получить доступ к API сервиса, которым мы благополучно воспользовались: в каждой «песочной» публикации появилась кнопка «Результат проверки на text.ru»:
Механика получилась следующая: пользователь присылал публикацию в песочницу, она автоматически проверялась на уникальность в сервисе и ссылка на страницу с результатом проверки вставлялась в шапку публикации, чтобы модератор мог нажать на неё и без всяких очередей посмотреть уже готовый результат (для каждого материала формируется уникальная ссылка, доступная только владельцу аккаунта). Получилась хорошая экономия времени на модерацию при её возросшем качестве.
Но тут нас ждал ещё один подводный камень. Даже имея Pro-аккаунт на сервисе, у него было суточное ограничение на количество проверяемых символов — 50000. Что такое 50 Кб текста? Кому-то этого хватит на неделю, но на Хабре иногда это одна публикация, а то и половинка. Если суточный лимит исчерпывался, то у публикации не появлялась заветная синяя «плашка» с результатами проверки. Для расширения этого ограничения на сервисе предлагается купить так называемые «пакеты символов» — пакет на 50 000 000 символов стоит 15000 рублей, например. В таком случае сначала расходуется ежедневно возобновляемый на Pro-аккаунте суточный лимит в 50000 символов, а уже потом — купленные символы. Честно. Но всё равно сама мысль «либо плати, либо мучайся с лимитами» при уже купленном Pro-аккаунте не очень радовала.
Здесь важно сделать небольшое отступление: данная интеграция сервиса была исключительно моей инициативой и сделать её приспичило в новогодние праздники. Несмотря на возможность оплаты услуг по безналичному расчёту, я не хотел ждать возни с бумажками и реквизитами, поэтому оплатил Pro-аккаунт на год из личных средств. Тогда я ещё не понимал дальнейшей арифметики работы с сервисом, но очень скоро понял, что все возможные лимиты Хабр исчерпывает довольно быстро, особенно если «в два смычка» с Geektimes.
А коты-то где?!
По закону подлости, суточные лимиты символов заканчивались в самый неподходящий момент. И однажды я попросил службу поддержки начислить немного символов, чтобы проверить работу системы:
Пользователь #12345 (09.02.2017 16:40:44)
Правильно ли я понимаю, что раз у нас ПРО-аккаунт, то каждый день нам начисляется 50000 символов на проверку через API? И когда мы их израсходуем, статьи перестают проверяться и возвращают ошибку «Нехватка символов на балансе»?
107248: https://text.ru/text_check/result/589c6e64432fa 107250: https://text.ru/text_check/result/589c6e6893129 107252: https://text.ru/text_check/result/589c6e6b56a26 107256: https://text.ru/text_check/result/589c6e6c7d7e2 107260: Array ( [error_code] => 142 [error_desc] => Нехватка символов на балансе ) 107302: Array ( [error_code] => 142 [error_desc] => Нехватка символов на балансе )
Администрация (09.02.2017 17:01:46)
Да, вы можете тратить данный пакет на api-проверку. Как только символы закончатся, вам придет сообщение, которое вы написали ранее: «Нехватка символов на балансе».
Пользователь #12345 (09.02.2017 17:11:28)
Понял. А можете тогда уточнить, во сколько по московскому времени «начисляются» эти символы снова? Чтобы мы могли инициализировать повторную проверку тех текстов, что не вложились в лимит в предыдущие сутки?
Администрация (09.02.2017 17:19:01)
Каждый день ровно в полночь.
Пользователь #12345 (09.02.2017 17:24:32)
Может вы нам сейчас по дружбе начислите символов немножко, а мы вам котика?
Удивительно, но сработало — служба поддержки начислила приятный бонус в виде 600к символов, чего хватило для дальнейшей работы.
Администрация (09.02.2017 17:36:03)
Мы выдали вам бесплатный пакет символов :)
Пользователь #12345 (09.02.2017 17:46:58)
Мур! Вы делаете полезный сервис и нам нравится им пользоваться. Спасибо большое!
Администрация (09.02.2017 17:55:42)
Благодарим вас за данный отзыв о сервисе и милого котика! Хорошего вам дня!
Вскоре история повторилась:
Пользователь #12345 (03.03.2017 17:04:53)
Эх, если бы вы только знали, как хочется ещё от вас «бесплатный пакет символов»…
Котики ещё есть, если что! :)
Администрация (03.03.2017 17:22:32)
Давайте обменяемся — мы вам пакет, вы нам котика :)
Сказано — сделано:
Пользователь #12345 (03.03.2017 18:32:13)
Тогда вот котики! Весенние! :)
Администрация (03.03.2017 18:40:41)
Мы подарили вам пакет на 600 000 символов :)
Никогда такого не было и вдруг опять:
Пользователь #12345 (20.03.2017 15:56:11)
Эх да что ж такое-то, опять символы кончились. Может продолжим нашу добрую пушистую традицию? ) Вот, например, вы же наверняка не слышали (и в словарике нет) о такой породе кошек, как Бурма? И что ударение в этом слове может сразу на обе гласных быть:
Котик снова сделал своё дело.
Пользователь #12345 (04.04.2017 11:19:57)
Хьюстон, у нас проблемы, как слышно, приём. Хьюстон, у нас кончились символы, повторяю, кончились символы. Пришлите по возможности побольше, а то они тут быстро расходуются. Конец связи! :)
Администрация (04.04.2017 11:38:48)
Здравствуйте. Мы зачислили на ваш профиль новый пакет символов :)
Пользователь #12345 (04.04.2017 11:56:43)
Спасибо большое! 5 минут — полёт нормальный! :)
Через пару недель:
Пользователь #12345 (23.04.2017 23:57:42)
Пусть ваш завтрашний дёнь начнётся с коробки котят. Котята выросли немножко и тоже символов хотят :)
Администрация (24.04.2017 08:59:32)
Здравствуйте. Мы подарили вам 600 000 символов =)
… шли годы…
Пользователь #12345 (06.06.2017 16:25:41)
Здравствуйте! Подскажите пожалуйста, как бы получше у вас ещё символов выпросить? ) Может в качестве подарка на 11-летие Хабра? Вот и праздничный котик пришёл по этому случаю!
И снова сотрудники сервиса ответили взаимностью.
Не то чтобы у ТМ нет возможности оплатить работу сервиса, но в данном случае уже появился некий азарт с придумыванием текстов и поиском картинок, остановиться уже сложно :)
Пользователь #12345 (04.07.2017 16:56:37)
Здравствуйте, снова мы. Засыпаем и просыпаемся в страхе, что символы вот-вот закончатся (точнее уже закончились, перешли на ежедневный лимит от pro-аккаунта), save our souls :)
Администрация (04.07.2017 16:59:05)
Здравствуйте. Мы подарили вам 600 000 символов =)
Пользователь #12345 (04.07.2017 17:00:33)
Мрррм, спасибо!
Пользователь #12345 (09.07.2017 03:53:39)
Просто внеплановый ночной котик, правда, морской:
Администрация (09.07.2017 08:10:01)
Мяу)
И вот недавнее:
Пользователь #12345 (03.08.2017 14:28:45)
Здравствуйте! Эх, все по отпускам разъехались, кота покормить некому! :)
Администрация (03.08.2017 14:34:30)
Здравствуйте. Мы покормили кота и подарили вам пакет на 600 000 тысяч символов :)
Пользователь #12345 (03.08.2017 14:40:58)
Поели, теперь можно и поспать. Спасибо! :)
Собственно, вот уже как полгода песочницы на наших сервисах работает только за счёт котиков :)
The end
Иногда в песочницу присылают публикации про основы JS/CSS, решения задач, подборки лайфхаков для коммандной строки или рассказы о том, как кто-то начал программировать в три года. Иногда мы пропускаем такие публикации, заведомо зная, что их заминусуют, а в комментариях обязательно появится «как за это вообще выдали инвайт?». В данном случае хочется напомнить одно: «Песочница» — это не кузница золотых публикаций, это своего рода небольшой вступительный экзамен, который должен пройти новый пользователь, чтобы стать полноценным участником сообщества. В то время как именно сообщество выступает в роли экзаменатора и вершит судьбы. Поэтому есть небольшое предложение: давайте относиться к публикациям из «песочницы» немного более лояльно.
? ? ?
Когда-то я тоже работал в суппорте Хабра и знаю, как эта работа иногда бывает утомительна. И как поднимали настроение периодические шутки пользователей — это прям как маленький островок позитива в океане рутины и однообразия. И сейчас мне приятно от мысли, что котики вызывают у сотрудника поддержки на том конце провода хотя бы улыбку. А может быть там даже несколько сотрудников сидят и иногда на обеде спрашивают друг у друга: «ну как там, эти, с Хабра, новых котов не присылали?» :)
Спасибо сервису text.ru за эту особенную лояльность, которая очень располагает и которой не могут похвастаться угрюмые и бездушные службы поддержек многих других сервисов.
P.S.
— Всегда общайтесть со службой поддержкой вежливо, даже если у вас «накипело»;
— Если для решения проблемы одна из сторон согласна на котиков, то вторая сторона должна выбирать только самых лучших котиков;
— Если котики не сработали, попробуйте заслать собакена;
— Не шлите котиков и собакенов нам в суппорт и в корп.отдел, там у всех аллергия :)
Данную публикацию просили выпустить без смайликов — нарушаю как могу
P.P.S.
> Сервис распознавания котов
> Сколько котов на Хабре?
> Генератор случайных котов
Хороших выходных!
LoadRunner
JustRamil
Пост надо было назвать «Хабр в восторге от text.ru». Вы это всерьез? У вас тут сообщество разработчиков, а вы описываете как выпрашиваете символы у службы поддержки. Вы же могли сами написать или бросить клич. Но вы зачем то пиарите чужой сервис. И как быть другим рекламодателям? Которые честно платят вам деньги за Мегапосты и корпоративные блоги.
Fortisa
А как быть с такими, как вы, которые мало что пиарили всё что ни лень и помимо постов (Zoho, привет!), да ещё и ломят 40 000 за пост от вашего имени? При том, что сам вы говорите весьма неграмотно и кто пишет посты вам — ещё боооольшой вопрос. Ваш снобизм уже всех достал. Я недавно на Хабре, но уже против вас сформировался негатив. Хотя да, я вас знала и до Хабра.
Что касается публикации — суперский пятничный пост.
JustRamil
Вы ошиблись, я беру 340 т.
Пруфы or GTFO!
Itimora
Вы же сами себя топите. Первый злой и реально не в тему комментарий написали, а теперь продолжаете. Вы же сольётесь!
JustRamil
Администрация не хочет писать ответ на мой комментарий, но клевету, иначе это не назвать, она пропускает. Я отлично понимаю мой комментарий и разместил его потому что считаю нужным, разность мнений. Да, я не преклоняюсь перед котиками и перед пятницей, и не считаю их достаточным оправданием для того чтобы перестать быть критичным.
cssman
mike_y_k
Отлично! Спасибо! Особенно после обсуждения проблем с VPN и НАСФИТ :D
Serenevenkiy
Oxoron
Котики — это хорошо, но когда будет порно?
sefus
Text.ru — Отличный сервис, давно пользуюсь. Его бы еще внедрить для переводов не помешало.
Kriminalist
Выдали б они вам плашку «уникальность поста проверена text.ru», и дали бы анлим.
MonstraG
Но тогда им больше не будут присылать котиков!
Nixhibrid
тут автоматизации на пол часа и на коленке!
mrholycookie
Большое спасибо за пятничный пост-котэ. Сервису +1. Пользуемся давно и все устраивает. Развития и успехов!
TimsTims
А правильно ли я понял, что если вам кто-то запостит пару сотен статей на 50 к символов, то вам снова придётся выпрашивать котиков?)))
Boomburum Автор
В целом да и я думал об этом :) Но пока такого не было (и надеюсь не будет).
iClo
После данной публикации могут найтись желающие :)
lxsmkv
Всегда представлял себе администрацию хабра весьма суровой. А тут такое. Сразу на сердце потеплело. Ваша карма на моем балансе переползла из синего сектора в зеленый :)
seniorcote
Отличный пост! Отсыпаю вам котиков, ни в чем себе не отказывайте :)
Norraxx
А ещё котиков можно генерить: http://thecatapi.com/
3epo
Хороший сервис «text.ru». Когда-то с помощью этого сервиса меня учили писать уникальные статьи для модерации одного кибер-новостного сайта. Спасибо за котиков ^__^
Wan-Derer
Хрень какая-то а не сервис. Вставил статью, полностью выдуманную из головы. Итог: уникальность 0.02%, заспамленность 47%, воды 20%… Аут!
Значит что? Голова копипастит автоматически и если рассказываешь о технических вещах — это сразу спам?
С "водой" ещё могу согласиться т.к. лирические отступления люблю… А остальное хрень да и только.
И вообще, как можно проверить, скажем, курсовик если он по определению основан на источниках?
Если источники технические, то там и по стилю ничего не поправишь обычно. Да и нормально это — делать работу на основе других работ, применяя их к своей задаче.
Главное не забыть их указать в перечне источников.
Regis
Одно дело, когда вы ссылаетесь на источники и своими словами описываете часть их содержимого. И совсем другое дело, если вы копируете текст их них 1 к 1 и даже не оформляете его как цитаты.
Wan-Derer
КМК, если пишешь курсач по математике, то умумукаешься пересказывать источники своими словами.
… кажись, я понял почему уникальность ноль. Он просто нашёл уже опубликованную статью, из которой я вставлял тест. Ладно, примем.
Но по поводу спама…
Pavel1114
Даже на хабре подборку фото котов могут заплюсовать только из за имени автора. Попробуйте представить, чтобы такое было опубликовано кем либо другим не имеющим отношения к администрации и не столь популярным.
GlaDosEvolution
Мур :)
Farxial2
Если так получилось не потому что вы самый крупный русскоязычный IT-портал — всё это здорово)