В разборе дальше будет упомянут только 51.143.124.155, хотя в логах также мелькали
52.250.62.82,
52.250.19.204,
52.250.119.153,
но они ведут себя более культурно.
Как выглядит проблема на примере выборки bing ботов из вчерашнего лога одного сайта:
$ cat ./20201026* | grep -F bingbot | awk '{print $1}' | sort | uniq -c | sort -rn | head -10
404582 51.143.124.155
10449 157.55.39.174
10037 207.46.13.162
10036 207.46.13.86
10008 157.55.39.152
6638 207.46.13.207
4993 207.46.13.238
4113 157.55.39.200
3897 157.55.39.205
2995 157.55.39.166
Как выглядит типичный «старый» bing-бот:
$ whois 157.55.39.174 | grep -i "org[-]*name"
OrgName: Microsoft Corporation
$ host 157.55.39.174
174.39.55.157.in-addr.arpa domain name pointer msnbot-157-55-39-174.search.msn.com.
Они базируются в сетях
157.56.0.0/14,
157.54.0.0/15,
157.60.0.0/16,
207.46.0.0/16
и успешно проходят проверку на www.bing.com/toolbox/verify-bingbot-verdict:
Как выглядят «новые» боты:
$ whois 51.143.124.155 | grep -i "org[-]*name"
org-name: Microsoft Limited
$ host 51.143.124.155
Host 155.124.143.51.in-addr.arpa not found: 3(NXDOMAIN)
$ host 52.250.62.82
Host 82.62.250.52.in-addr.arpa not found: 3(NXDOMAIN)
$ host 52.250.19.204
Host 204.19.250.52.in-addr.arpa not found: 3(NXDOMAIN)
$ host 52.250.119.153
Host 153.119.250.52.in-addr.arpa not found: 3(NXDOMAIN)
И соответственно:
При этом почерк, активность сразу на всех сайтах, а также сообщения коллег, о том, что после блокировки этих «новых» ip поступают уведомления Bing Webmaster Tools о недоступности сайта, позволяют сделать заключение, о том, что эти боты действительно являются делом рук microsoft.
Запросы в саппорт и абузы, разумеется, игнорируются.
В общем, не бейте сразу ботов из сетей 51.140.0.0/14, 52.224.0.0/11. Вероятно, они являются полезными (или хотя бы безобидными) бифидобактериями.
Upd (28.10.2020 08:48 MSK):
Вчера (в 27/Oct/2020:11:56:24 +0300) запросы прекратились.
На абузы ответов так и не поступило.
В твиттере @facan появился комментарий к аналогичному запросу:
… some sites reported that a small percentage of Bing crawler was not DNS resolving appropriately and we were crawling outside of usual IPs for few days. We fixed that yesterday.
Upd (29.10.2020 19:23 MSK):
Microsoft в своем репертуаре — около часа назад его старые боты «потеряли» обратную зону:
$ host 157.55.39.174
Host 174.39.55.157.in-addr.arpa not found: 3(NXDOMAIN)
$ host 157.55.39.152
Host 152.39.55.157.in-addr.arpa not found: 3(NXDOMAIN)
$ host 157.55.39.200
Host 200.39.55.157.in-addr.arpa not found: 3(NXDOMAIN)
$ host 157.55.39.205
Host 205.39.55.157.in-addr.arpa not found: 3(NXDOMAIN)
$ host 157.55.39.166
Host 166.39.55.157.in-addr.arpa not found: 3(NXDOMAIN)
13werwolf13
уже не раз появлялось желание заблокировать в своих сетях все подсети мелкософта… чую рано или поздно дойдём до этого..