Как я обошёл запрет на Messages API через документацию Вконтакте / forpes.ru

Главная
Как я обошёл запрет на Messages API через документацию Вконтакте

Как я обошёл запрет на Messages API через документацию Вконтакте +9

05.03.2020 19:00

Aragroth 26 6200 Источник

Привет всему Хабро-сообществу. Для меня эта первая статья и пишется она под определённой эйфорией, так что прошу не судить эту статью слишком строго за литературную часть. Но что же, меньше слов и переходим к делу.

С чего всё началось

Все мы знаем, что у ВК есть API, и я уверен, что большинство людей пыталось им воспользоваться в своих целях. Лично у меня полно проектов, связанных с ним: штук 5 мощных ботов, составление масштабных датасетов из постов групп и т.д. И не удивительно, что мои знакомые просили меня пару раз выкачать песни из вложений диалога, фотографии или же сохранить текст переписок с каким-нибудь человеком в отдельный файл.

Но однажды пришло «оно», и с того момента выполнение таких небольших просьб перестало быть тривиальной задачей:

И вот, пару дней назад, чтобы раз и навсегда избавиться от этой проблемы, я решил написать свою обёртку через http запросы, притворяясь обычным пользователем, дабы иметь такой же мощный инструмент, как официальный API для раздела messages.

Переходим к делу

Итак, начал я с авторизации. Вооружившись сниффером https и Firefox-ом, я смог пройти все «ступеньки» авторизации и получить финальные куки. С этого момента оставалось только понять, как именно делаются запросы. Было выяснено, что большинство данных получается POST запросом от https://vk.com/wkview.php, просто каждый раз меняются параметры для разных ситуаций. Мне удалось написать функции для выкачки абсолютно всех видов вложений, но не будем вдаваться в подробности этого, потому что в один момент всё кардинально изменилось.

Ссылка на файл для получения куки авторизации (Писал только для двухфакторной аутентификации, так как она стоит у большинства людей)

Неожиданное открытие

Я работал на ноутбуке, когда ко мне подошёл знакомый и спросил, чем я занимаюсь. Так как у меня не получилось ему объяснить всю проблему быстро на пальцах, я открыл официальную документацию на разделе messages, и обомлел, когда увидел, что находится под главным описанием у этих «запрещённых» методов:

Нет, вы поймите меня правильно, я не первый раз вижу эту возможность. Я много раз пользовался ею у других методов, но я даже и подумать не мог, что функция «пример запроса» останется у методов раздела messages. И ещё более сильным было моё удивление, когда я проснифферил трафик. Это были просто обычные запросы к API, только на сайте , у которых лишь слегка отличались названия параметров в веб-форме и был какой-то хэш-айди.

За несколько минут я понял, что хэш-айди — это просто строка, находящаяся в атрибуте data-hash тэга кнопки, а ещё через пару минут я уже вовсю пытался реализовать эмуляцию «тестовых запросов» и до конца не верил, что будет работать. Ведь наверняка у этих запросов есть какое-то ограничение по количеству или что-то подобное. Но каково же было моё удивление, когда этот скрипт в 30 строк (не считая получения куки), который был написан на коленках, смог за 4 минуты выкачать полторы тысячи картинок из вложений диалога.

Прикладываю использованный код

import requests, pickle, re, json

with open('cookies_vk_auth.pickle', 'rb') as handle:
    cookies_final = pickle.load(handle)

session = requests.Session()
peer_id = int(input('Введите айди пользователя:  '))

response = session.get(f'https://vk.com/dev/messages.getHistoryAttachments', cookies=cookies_final)
hash_data =  re.findall(r'data-hash="(\S*)"', response.text)[0]

session = requests.Session()
response = session.post(f'https://vk.com/dev',
            data=f'act=a_run_method&al=1&hash={hash_data}&method=messages.getHistoryAttachments&param_count=20&param_max_forwards_level=45&param_media_type=photo&param_peer_id={peer_id}&param_photo_sizes=0&param_preserve_order=0&param_v=5.103', cookies=cookies_final)

count=20

for i in range(200):
    response_json = json.loads(json.loads(response.text[4:])['payload'][1][0])['response']['items']

    for photo in response_json:
        ph = photo['attachment']['photo']['sizes'][-1]['url']
        r = session.get(ph, timeout=10)
        
        if r.status_code == 200:
            with open(f'D://dev/'+str(ph.split('/')[-1]), 'wb') as f:
                f.write(r.content)

    m_id = photo['message_id']
    response = session.post(f'https://vk.com/dev',
            data=f'act=a_run_method&al=1&hash={hash_data}&method=messages.getHistoryAttachments&param_count=20&param_start_from={m_id}&param_max_forwards_level=45&param_media_type=photo&param_peer_id={peer_id}&param_photo_sizes=0&param_preserve_order=0&param_v=5.103', cookies=cookies_final)

Я был на столько поражён, что на этом моменте я решил остыть и попробовать реализовать какой-нибудь другой метод (вдруг я просто ошибся). Я взялся за метод History и результат был аналогичным. Только пришлось поставить задержку в 0.1 секунды, чтобы сервер не выдавал ошибку о слишком большом количестве запросов. (Если кто-то будет повторять, прошу не забыть, что при смене метода нужно также менять и url на документацию, откуда берётся hash-data). То есть этот способ действительно давал возможность получить доступ к разделу messages через официальную документацию, используя лишь пароль и логин пользователя. Для достоверности я попробовал проделать те же шаги на другом аккаунте и получил тот же результат.

Подводим итоги

И так, думаю, все уже осознали, что это — брешь в защите наших персональных данных, которая висела в документации целый год и не известно сколько людей уже воспользовались ей. Причём эта брешь очень крупная, и её нужно скорее закрыть. И чтобы ещё раз доказать, что это не должно так работать, процитирую самих разработчиков ВК:

Если Вы планируете начать разработку мессенджера, после 15 февраля 2019 года для этого потребуется получить в Поддержке тестовый доступ, подразумевающий работу методов секции Messages с ключами администраторов Вашего Standalone-приложения.

То есть даже для получения токена внутреннего приложения, который будет иметь доступ к переписке пользователя, нужно личное разрешение от ВК, что уж говорить о доступе с обычным паролем и логином.

Моё личное мнение

Запрет раздела messages не привнёс кардинальных изменений в безопасность пользователей. Он всего-лишь обозначил границу и отсёк группу «недо-хакеров», которые даже не понимая того, что делают, могли получить полный доступ к данным. Для остальных же людей, более опытных в программировании, получение доступа к перепискам — это всего лишь вопрос времени. И я уже в первой части статьи доказал на собственном примере, создав программку для выкачивания вложений, что появление библиотеки, которая сможет притворяться пользователем, не за горами. Может я и сам доведу её до конца, а разработчикам ВК нужно быть готовыми к этому и придумать способы распознавания слишком подозрительной активности пользователей, если для них конфиденциальность наших данных действительно важна.

P.S.

Также прошу не судить за этот незакоментированный код, он писался быстро и на коленках) А также большое спасибо друзьям, которые помогали мне с написанием первой статьи.

Комментарии (26)

PeterPP
05.03.2020 22:23
#21360610
-1
А если проставить headless chrome, написать selenium скрипт и настроить доступ через MitM прокси, по идее от пользователя не отличить. Данные все из прокси доставать.

Понятно что для хостинга на сервере это не подойдёт и API сильно быстрее, но собрать данные в принципе можно.

andreymal
05.03.2020 23:42
#21360790
Во-первых, брешь-то в чём? Есть логин и пароль — значит есть доступ ко всему.

Во-вторых, всегда можно прикинуться официальным iOS/Android клиентом и получить полный доступ к API, наверное.
1. SadLion
  06.03.2020 00:51
  #21360934
  Вроде бы уже писали о том, что официальный клиент не использует публичные апи и шифрует передаваемые данные. (могу ошибаться)
  1. sleirsgoevy
    07.03.2020 11:10
    #21365442
    +1
    Неправда. Я некоторое время назад занимался моддингом оф. приложения (делал нечиталку), там на 99% используется официальный API. До сих пор пользуюсь той версией, сообщения пока работают.

igorjan94
06.03.2020 01:16
#21360970
Но зачем это всё?
Я для своего месседжера (персональный) просто взял access_token kate mobile'а и продолжил пользоваться им как ни в чём не бывало. В переписке с поддержкой на эту тему было сказано

Да, пока такой подход может работать. Однако на всякий случай предупредим: однажды мы начнем блокировать пользователей, чьи токены вызываются не из ассоциированного приложения
Но, честно говоря, мне кажется это совсем бред, особенно если запросы не отличаются от запроса приложения
1. 0xd34df00d
  07.03.2020 03:34
  #21365010
  +2
  На самом деле вообще непонятно, как со всеми этими токенами жить опенсорс-приложениям.

princessmilana
06.03.2020 07:17
#21361226
Какой смысл было это описывать, если через пару дней после такой статьи это все закроют?
1. Aragroth Автор
  06.03.2020 07:18
  #21361228
  Статья была специально написана для того, чтобы больше людей узнали об этом баге и его скорее закрыли

DrMefistO
06.03.2020 07:50
#21361276
Некрасиво не сообщать сначала разработчикам.
1. kovert99
  06.03.2020 18:12
  #21363758
  А зачем? Все известно, что команде разработке плевать на подобные баги, почитай посты на хабре. Пусть пожинают плоды своей беспечности.

AndrewTishkin
06.03.2020 08:57
#21361400
Я чего-то не понял, какое решение предлагает автор? Как бы вы это реализовали? Критиковать-то прекрасно, но где альтернатива?

Не признают это проблемой, никто не будет лопатить тонны кода ради сомнительных угроз.
IMHO
1. Aragroth Автор
  06.03.2020 09:03
  #21361410
  Тоесть возможность за 5 минут выкачать последние личные сообщения и как минимум по 100 вложений картинок Вы не считаете угрозой личным данным? Или Вы хотите, чтобы я написал отдельную библиотеку-обёртку, что доказать 100%-ную возможность этого метода?
  1. andreymal
    06.03.2020 11:40
    #21361966
    Ещё раз, где вы угрозу увидели? Почему возможность выкачивать СВОИ сообщения вы считаете угрозой? В том же Telegram, например, возможность выкачивания всей переписки это вообще штатная возможность, встроенная прямо в официальный клиент.
    
    Aragroth Автор
    06.03.2020 12:14
    #21362130
    Я вижу опасность в том, что я могу условно сниффингом в локальной сети выловить из запроса пароль и логин пользователя, а после этого получить доступ к его сообщениям. Именно этого и пытались избежать ВК, закрывая доступ к API по паролю и логину
    
    andreymal
    06.03.2020 12:27
    #21362196
    я могу условно сниффингом в локальной сети
    Не можете, потому что https. Так что я угрозы по-прежнему не вижу
    
    Да, лет семь назад я сам сниффал сеть и получал доступ к чужим сообщениям (и меня тоже сниффали, кстати). Но это было лет семь назад, сейчас уже принудительный https для всех
    
    закрывая доступ к API по паролю и логину
    Если смысл и правда в этом, то со стороны ВК это бессмысленное страдание фигнёй, так как Selenium и прикидывание официальными клиентами всё равно никто не отменял
    
    Поэтому просто не надо вводить свой пароль куда попало, и всё будет пучком и без угроз
    
    Aragroth Автор
    06.03.2020 12:51
    #21362278
    Https не защитит от прокси сервера, а также настроенного на пк фальшивого корневого сертификата. Об этом можно вообще написать отдельную статью и сделать самописную библиотеку для messages api.
    
    andreymal
    06.03.2020 12:54
    #21362282
    Если пользователь ведёт себя настолько безответственно, что допустил на своём компьютере подключение левых прокси и сторонних сертификатов, то ВК здесь вот вообще абсолютно ни при чём.
    
    Aragroth Автор
    06.03.2020 13:04
    #21362316
    Ну а например школьники, которые могут зайти в ВК на уроке, на школьном компьтере? А как же социальная инженерия, где пользователя могут просто обмануть? Да, это не проблемы ВК, но Вы действитеоьо хотите облегчить жизнь этих мошенников? А где гарантия, что однажды Вы сами на это случайно не попадётесь? (без обид)
    
    andreymal
    06.03.2020 13:12
    #21362360
    На условном «школьном компьютере» может вообще стоять пропатченный «учителем» браузер, который будет собирать все личные сообщения прямо из открытой вкладки ВК. Ещё раз: в том, что пользователь лично вводит свой пароль куда попало, ВК не виноват вообще никак.
    
    Вы действитеоьо хотите облегчить жизнь этих мошенников?
    Если пользователь сам добровольно передаёт пароль стороннему лицу, да ещё и код из SMS при двухфакторке тоже перепечатывает ему, а потом ещё и девичью фамилию матери сообщает и фотографию обратной стороны кредитной карты шлёт, то любые технические меры здесь бессильны и единственный способ усложения жизни мошенников — ликбез по информационной безопасности (который ВК кстати иногда проводит).
    
    А где гарантия, что однажды Вы сами на это случайно не попадётесь?
    Я не ввожу свой пароль на «школьных компьютерах» и в недоверенных приложениях.
    
    Aragroth Автор
    06.03.2020 13:19
    #21362396
    Ну, такими темпами можно вообще придти к выводу, что нет смысла делать у приложений хоть какую-то защиту — даже двухфакторка бессмысленна, ведь пользователь сам во всем виноват, если случайно сольёт свой пароль.
    
    andreymal
    06.03.2020 13:32
    #21362448
    Нужна защита от таких атак, в которых пользователь не виноват — например, от того же сниффа сети или от перехвата SMS спецслужбами (после подобных событий в Telegram и завезли двухфакторку с паролем, кстати).
    
    Впрочем, во взломах компьютера пользователь тоже может быть не виноват (всё-таки это какой-нибудь майкрософт косячит и RCE-уязвимости в своих SMB и RDP клепает), но к сожалению я не вижу технических способов защититься на компьютере, который полностью подконтролен кому-то другому, без серьёзного ущерба для юзабилити. Банальное отключение доступа к messages API абсолютно точно не поможет, ведь при наличии полного контроля над компьютером есть ещё много способов получить доступ к переписке (см. «пропатченный браузер»)
    
    LifeDJ
    06.03.2020 16:26
    #21363274
    +1
    Я даже добавлю: тут не то что угрозы нет, невозможность выкачать свои сообщения — это недостаток. Например — если я хочу сделать бекап своих сообщений не в ВК. Без API я буду или копировать вручную (тратя много времени) — или придумывать костыли по типу selenium и патченных браузеров.
1. Aragroth Автор
  06.03.2020 09:05
  #21361416
  А альтернатива проста — просто удалить возможность "тестовых запросов" для всех методов раздела messages
  1. AndrewTishkin
    07.03.2020 00:36
    #21364774
    Альтернатива проста, читайте про JWT и рефреш-токен. Если он будет постоянно изменяться, проблемы нет, так как постоянная прослушка трафика реально выходит за пределы нормальной разработки в область информационной защиты.
  1. sleirsgoevy
    07.03.2020 11:13
    #21365448
    Впринципе, можно дергать messages через метод execute. Так что надо не "отключить формочку", а именно отобрать права у тестового приложения.

Taraflex
06.03.2020 13:18
#21362384
www.npmjs.com/package/vk-io может авторизоваться по логину/паролю, притворяясь офф. приложениями. Доступ к апи сообщений есть.

Как я обошёл запрет на Messages API через документацию Вконтакте +9

С чего всё началось

Переходим к делу

Неожиданное открытие

Подводим итоги

Моё личное мнение

Комментарии (26)

Aragroth Автор

Aragroth Автор

Aragroth Автор

Aragroth Автор

Aragroth Автор

Aragroth Автор

Aragroth Автор