Легко узнать, где сделана фотография, если на заднем плане — Эйфелева башня, Тадж-Махал, Собор Святого Петра, мемориал Линкольна или Красная площадь. Разработчики из Google пошли дальше и сделали нейросеть, способную узнать место по фотографии, даже если она сделана в помещении.

image

Люди могут использовать не только достопримечательности, чтобы понять, где сделана фотография. Место можно определить по блюду в ресторане, по направлению дорожного движения, по корове на улице, архитектуре зданий и совмещению всех этих факторов. А на что способна машина?

Разработчики технологии PlaNet разделили большую часть суши на 26000 зон различного размера в зависимости от количества фотографий, сделанных в конкретной местности. Большие города получили больше «ячеек», так как в них сделано больше фото, в то время как в сельской местности «ячейки» были большего размера. Моря, океаны, полярные зоны пропустили.

image

Была использована база из 126 миллионов фотографий из интернета вместе с их EXIF-данными. 91 миллион фотографий использовали для обучения нейросети, а оставшиеся 34 миллиона — для оценки её работы.

Для проверки эффективности нейросети использовали 2,3 миллиона геотаргетированных изображений из Flickr. 3,6% изображений PlaNet узнала с точностью до улицы, 10% — с точностью до города. Страну нейросеть определила в 28,4% случаев, а континент — в 48%.

Этот результат сравнили с возможностями десятка путешественников с помощью игры GeoGuessr.com, в которой вы угадываете место по Google Street View. PlaNet обыграла людей со средним результатом ошибки в 1131,7 километров. Люди ошибались в среднем на 2320,75 километров.

По словам одного из главных исследователей Тобиаса Уэйанда (Tobias Weyand) преимущество машины состоит в том, что нейросеть «видела» гораздо больше, чем любой живой человек, всю жизнь путешествовавший по миру.

Разработчики пошли дальше и начали работать с фотографиями, которые сделаны в помещениях. Узнать их можно в тех случаях, когда фото является частью альбома — машина просматривает альбомы полностью и ищет наиболее специфические изображения, сделанные в одном и том же месте

Сама нейросеть занимает всего 377 мегабайт.

Комментарии (75)


  1. Utopia
    27.02.2016 21:22
    +1

    ФБР радостно потирает руки


    1. d2ghost
      27.02.2016 21:53
      +42

      С радиусом в 1131 км они могут еще и начинать ноги разминать )


  1. Artoo-Detoo
    27.02.2016 21:30
    +36

    На правах юмора: <img src="http://" alt="image"/>


    1. kaaquantum
      28.02.2016 01:48
      +11

      а может Украина? Беларусь? Или остальные стране, где сохранились старые советские знаки?)


      1. arheops
        28.02.2016 06:28
        +4

        чтоб максимальную ошибку получить — это может быть, например, Аляска. Русский анклав.


        1. Valle
          28.02.2016 19:45

          Есть подозрение что не американские писсуары в сша запрещены либо скорее всего стандартизированы каким-то строительным кодом.


          1. equand
            01.03.2016 13:24

            США? Стандартизировано? :) Вы с Германией не попутали?


            1. Valle
              01.03.2016 21:37

              Я в Германии не был, не знаю если у них там туалеты стандартизированы.


        1. CulHatsker
          29.02.2016 22:02
          +1

          Но ведь в Аляске нет русских анклавов.


      1. CrazyViper
        29.02.2016 18:11
        +1

        Достаточно указать точку схождения трех границ и получим минимальную погрешность для определения страны =)


  1. lksdfj89
    27.02.2016 21:31
    +1

    Крупные корпорации и спецслужбы некоторых стран скоро будут знать почти всё о людях. Так может быть пора вообще отказаться от идеи приватности и воодушевить/обязать каждого расшаривать те сведения, которые могут быть вычислены? Ну или корпорации обязать расшаривать то, что они смогли вычислить.


    1. Idot
      28.02.2016 06:35

      Не нужно пользоваться соцесетями, а видеокамеру в телевизоре, планшете, ноутбуке, и смартфоне — выжечь паяльником.


      1. lksdfj89
        28.02.2016 09:41

        > Не нужно пользоваться соцесетями
        Трудновыполнимо.
        > выжечь паяльником
        А что делать с видеокамерами в городе, других людях снимающих фото на которые вы случайно попадёте?
        Ну и помимо камер есть ещё миллион и один способ узнать о человеке то, что он не хотел рассказывать.


        1. Sadler
          28.02.2016 11:02
          +1

          Трудновыполнимо.
          Нифига подобного. Просто не регистрируйтесь там.
          А что делать с видеокамерами в городе, других людях снимающих фото на которые вы случайно попадёте?
          Во-первых, это чуть менее ценная информация, во-вторых, на улице можете натянуть капюшон куртки или hoodie, от части камер поможет.


          1. lksdfj89
            28.02.2016 11:33

            Нет, если требуется рассказывать о себе как можно меньше любой ценой, то способы есть. Начать жить в лесу, например.
            Но для большинства людей способы уровня «перестать общаться с некоторыми людьми» (aka отказаться от соц. сетей) и «начать выглядеть странно» (aka натягивать капюшон и везде носить hoodie) неприемлемы.


            1. Sadler
              28.02.2016 12:24
              +1

              О том и речь. То, что трудновыполнимо или неприемлемо для Вас, для других людей может быть может быть вполне естественно. Но конечно, "он не такой, как мы! Давайте закидаем его камнями!"


          1. isden
            28.02.2016 11:44

            Несколько лет назад я как-то зашел в салон сотовой связи, натянув на голову это самое худи. Было холодно, а снять как-то не догадался. Так там охрана чуть ли не на входе меня крутить начала, подошли, любезно поинтересовались чем могут помочь. И потом глаз не сводили, пока не вышел.


            1. Idot
              28.02.2016 13:47

              lol Надо было пробовать зайти в баклаве с очками и шлемом — типа тех что велосипедисты ездят.


            1. lgorSL
              28.02.2016 18:16

              У меня зимой при температуре ниже -5 почему-то начинают сильно мёрзнуть нос и щёки. Обычно заматываюсь шарфом, закрывая нос и рот (практически всё лицо), повышенного внимания со стороны окружающих вроде бы нет.


              1. Sadler
                28.02.2016 19:46

                Тоже наматываю шарф до носа, плюс капюшон. Правда, у нас чаще -30, а не -5, потому я тут не один такой.


      1. ivansychev
        28.02.2016 10:59

        Про соцсети: когда я брал ипотеку (только не надо про "зло", иначе квартиру в Москве купить тяжеловато), меня Сбербанк проверял в Линкедине. Если бы они ничего про меня не нашли в сети — могли бы и не дать ничего, а так предложили кредит в полтора раза больше запрошенного.


        1. adlkhkmlln
          28.02.2016 16:44

          А как вы узнали про то, что вас в Линкедине смотрели, можно поинтересоваться?


          1. Nepherhotep
            28.02.2016 19:09
            +1

            А там показывает, кто профиль смотрел. Во вконтакте, думаю, тоже искали, но информацию об этом никто не узнает )


          1. ivansychev
            28.02.2016 23:20

            Как правильно написали уже — можно увидеть, кто смотрел. Мой профиль смотрели два аналитика из Сбербанка. Спустя сутки после подачи заявки на ипотеку. Ещё через сутки заявку одобрили.


  1. dinizzzo
    27.02.2016 21:53

    с помощью игры GeoGuessr.com
    О! Статистику им пополню немного.
    P.S. Вот как могла машина с армянскими номерами в деревушку в Эстонии попасть? В итоге промах в 2500 км :(


    1. alltiptop
      27.02.2016 22:34

      По миру не ездил, но у меня на GeoGuessr.com от максимума в 1500км (что характерно — в пределах одной страны, даже на одном побережье — на западе США (вычислил по знакам и гористой зелёной местности)) до минимума в 500 км — Германия/Ниделанды. То есть с таким же турестическим опытом как у PlaNet результаты у нас совпадают. Какая то не очень продвинутая нейросеть, моя во всяком случае не хуже, что уже радует.


      1. loly_girl
        28.02.2016 10:23

        У меня была максимальная точность аж в 18 км.


      1. EwgenW
        28.02.2016 10:59

        Как так? Мне удавалось вычислить до ± 100 м. ЧЯДНТ?


        1. alltiptop
          28.02.2016 13:45

          Ну у меня все дороги попадались посреди поля, «ездить» в поисках города надоедало и тыкал по местности.


        1. force
          01.03.2016 19:36

          Пфф… мне удалось как-то вычислить до 1 метра. Потому что фотография была из соседнего города и показывала достопримечательность с очевидного ракурса :)
          Так что зависит от фотографий.


    1. Ohar
      27.02.2016 22:35
      +7

      Она туда заехала.


    1. idiv
      27.02.2016 23:47

      P.S. Вот как могла машина с армянскими номерами в деревушку в Эстонии попасть? В итоге промах в 2500 км :(

      Я вот возле Амстердама видел машину с московскими номерами. Мираж?


      1. Zzzuhell
        28.02.2016 00:25
        +3

        В МСК на ливанских номерах машину видел. Законом не запрещено въезжать в страну иностранным машинам. Главное — страховка и права международного образца.
        А вот увидеть в США машину с австралийскими номерами — это уже посложнее. Но, опять же, не невозможно...


        1. idiv
          28.02.2016 11:28

          А вот увидеть в США машину с австралийскими номерами — это уже посложнее. Но, опять же, не невозможно...

          Серые импортные схемы приводили к появлению в Киеве машин с американскими номерами. Так что в общем все возможно.


          1. Zzzuhell
            28.02.2016 21:03

            Теоретически и это возможно. Я просто говорю, что увидеть номера с того же континета вероятнее, чем с другого. Фрахт overseas тупо дороже :)


      1. VJean
        28.02.2016 12:02

        Дилер


    1. tormozedison
      28.02.2016 21:12

      Спасибо за наводку, не знал про GeoGuessr. Уже пробую свои силы.


  1. radiolok
    27.02.2016 22:20

    Хотелось бы подробностей насколько хорошо нейросеть "понимает" что изображено на фотографии и на некоторых примерах почему она считает что фото сделано именно в %имя страны% стране.


    1. Artoo-Detoo
      27.02.2016 22:31

      По поводу "как понимает", не в курсе не специалист. А страна опознается по характерным для нее признакам. Если по простому, как мой коммент выше.


    1. vedenin1980
      27.02.2016 22:36
      +3

      Вроде бы суть нейросети в том что у неё трудно (или невозможно) получить ответ почему она приходит к тому или иному решению.


      1. Sadler
        28.02.2016 07:08

        Если используются Sparse Encoders или свёрточные сети, то очень просто: активируйте конкретный нейрон слоя, и увидите, на что тот реагирует. Если не sparse, то, конечно, всё сложнее. Подозреваю, что в данном случае сетка научилась на цветовой гамме и других характеристиках камеры, используемой гуглом в данной стране. Так в GeoGuessr можно безошибочно отличить Небраску и Австралию, если Вы понимаете, о чём я.


    1. ProLimit
      27.02.2016 23:22

      Конечно она ничего не понимает, это просто классификатор которые на основе огромной обучающей выборки научилиотвечать на один конкретный вопрос: какие координаты на карте для этой фотографии. Если нужны ответы на другие вопросы, например, "на фотографии изображены люди и сколько их", можно научить отвечать и на них, проведя повторное обучение, но принцип остается таким же простым.


      1. grozaman
        27.02.2016 23:48

        Тем не менее нейросети это рабочая, но узкая реализация некоторых человеческих способностей.
        Поэтому нейросети вероятно один из ключевых элементов гипотетического сильного ИИ.
        Пока что человек остается «универсальной нейросетью» решения практически любых задач.


        1. zim32
          28.02.2016 01:42
          +1

          Что самое удивительное что человеческий мозг не заточен под что-то одно. Это метанейронная сеть которая умеет строить нейронные сети


          1. Sychuan
            28.02.2016 02:39

            Я не специалист, но из книжки Маркова "Обезьяны, нейроны и душа" у меня сложилась впечатления, что человеческий мозг как он пишет очень универсален, но в целом ограничен и существуют такие вещи, на которые его фундаментально нельзя "запрограммировать". Но может я не все понял.


          1. Sadler
            28.02.2016 07:37
            +1

            А с чего Вы взяли, что он не заточен? Вспомнить хотя бы систему пространственной ориентации. Или, скажем, чисто на бытовом уровне: мы куда эффективнее справляемся с задачами классификации и распознавания образов, нежели, скажем, с задачами, требующими запоминания большого объёма информации. Истина в том, что наш мозг очень заточен под что-то одно (и это "что-то одно" сильно завязано на выживание в естественной среде), но мы всё равно умудряемся вполне успешно использовать его даже там, где он уже не вполне справляется без дополнительных средств.


            1. zim32
              28.02.2016 12:52

              Вы не совсем правы. Существуют люди (саванты) с фотографическрй памятью, есть которые вычисляют в уме огромные цисла. Да это сворее отклонения чем норма, но это говорит о том что мозг может быть заточен и под это. Просо для выживания человеку не нужно помнить все до крупинки с рождения.


              1. Sadler
                28.02.2016 13:24

                Это не я не совсем прав, это Вы нашли пару фриков с ошибкой в генотипе. Формально нейросеть можно натаскать на что угодно, если это вообще вычислимая задача и достаточно вычислительных ресурсов при относительно полных входных данных. По факту всё зависит ещё и от генетики, т.к. могут формироваться различные более или менее специализированные нейроны. Никакой магии здесь нет.


                1. zim32
                  28.02.2016 13:59

                  Если сравнить наш мозг с комьютером с ИИ это все равно чтобы ваш копьютер в один прекрасный день сказал — слушай, я тут решил, что для оптимальной работы я не буду хранить всю твою библиотеку флак файлов на SSD, а буду ужимать старые записи в mp3 и перенесу на HDD, все равно ты не слушаешь песни годичной давности, а быстрая память нужна здесь и сейчас. А от самых старых и вовсе оставлю сжатый образ и проиндексирую его хеш таблицей с разными органами чувств, чтобы ты, если что, мог найти их подумав о старом знакомом или почувствовав запах любимых духов. Это и есть настоящий ИИ, когда ты не вовлечен в эти процессы напрямую.

                  Разница в том, что мозг не знает наперед все типы задач с которыми ему придется сталкиваться и подстраивается под окружающую среду сам.

                  >>Вы нашли пару фриков с ошибкой в генотипе.
                  Это лишь доказывает что мозг теоретически способен на такое, просто ему это не надо.


                  1. Sadler
                    28.02.2016 14:14

                    … окей. И к чему был этот поток сознания? В Вашем видении мира нейросеть, искусственная или естественная не может параллельно решать несколько задач? Абсолютно не имеет значения задача(задачи), если есть общий метод оценки результата.


  1. edogs
    27.02.2016 22:50
    +1

    PlaNet обыграла людей со средним результатом ошибки в 1131,7 километров. Люди ошибались в среднем на 2320,75 километров.
    Звучит как «тренированный спортсмен из урюпинска в среднем бегает быстрее чем средний человек из америки на 25 мер длины в секунду»©


    1. ivansychev
      27.02.2016 22:59
      +1

      Прочитайте абзац полностью. Сравнивали с путешественниками, а не обычными людьми.


      1. edogs
        28.02.2016 00:07
        +6

        Вы же понимаете, что абстрактный путешественник ничем особо не отличается от абстрактного человека? Спец.средство победило среднее среди десятка любителей.
        К тому же учитывая куда обычно приземляет тот сайт, который выбрали для теста, т.е. крайне редко в города, тут человек знакомый с природоведением и не выходящий за пределы квартиры будет более точен чем путешественник объехавший 120 городов.


        1. AngusMetall
          01.03.2016 14:31

          Технологическая сингулярность во всей красе прям. Вы хоть понимаете, что буквально лет десять назад, задачи распознавания образов на изображениях считались чуть ли не невозможными, или как минимум требующими чуть ли не сильного ИИ? А тут вот, нейросеть обставила живого человека, чёрт с ним, даже пускай среднего, в задаче классификации. Это мегакруто!


  1. NeoChudic
    27.02.2016 22:59
    +5

    Черт, хотел приобщиться к исследователям, но ссылка ведет на pdf- документ на arxive. org. То есть какой-то доклад. А нет-ли ссылки на движок? Ну то есть — запостить фотку и проверить — где снято?


  1. darkfrei
    27.02.2016 23:58

    Пачку фотографий квартиры с мебелью из ИКЕИ — и как она страну определит?


    1. vedenin1980
      28.02.2016 00:21
      +1

      По языку на которому написан журнал, лежащий на столике, по породе кота, спящего на диване, по виду из окна, по лицам хозяев, наконец. Естественно, 100% точности ни ИИ, ни самый эрудированный человек не даст.


      1. tormozedison
        28.02.2016 11:14
        +1

        Кстати, про Икею. И про язык. В Икее в Химках есть один ручной пожарный извещатель с надписями по-шведски. Можно потроллить нейросеть фотографией этого извещателя.


        1. Keyten
          28.02.2016 13:03
          +12

          Можно потроллить нейросеть

          21 век.


          1. tormozedison
            28.02.2016 21:05

            Если, конечно, она там есть, а не просто анализатор геотегов присылаемых фоток. Кто-нибудь пробовал присылать без геотега — ошибку не выдавало?


        1. vilky
          04.03.2016 17:22

          И когда она повзрослеет, она вступит в ряды антиглобалистов.


    1. ingumsky
      28.02.2016 00:27
      +2

      В продакшен-версии она будет выводить в качестве ответа сниппет со временем работы и адресом ближайшей Икеи :)


  1. dydyman
    28.02.2016 00:03

    Получается для России определить город и улицу не получится? Эта территория состоит только из крупных участков.
    Интересно бы узнать какое количество нейронов в сети — это количество участков карты в квадрате, или что-то более сложное с множеством алгоритмов определения паттернов на изображениях (множеством слоев)?


    1. Sadler
      28.02.2016 07:13

      А Вы сами насколько точно сможете без чтения какого-либо текста определить своё местоположение в России? Посмотрите летсплееров зарубежных, те тупо всегда тыкают Казань, когда попадают в Россию, а если вокруг светло и тепло, то тыкают Украину (и всегда промахиваются, т.к. GeoGuessr крайне редко попадает на Украину).


    1. Idot
      28.02.2016 08:53

      Почему же не получится? Фото с Андроидов + Geo-Tag позволяют вполне составить подобную карту местности.


      1. dydyman
        28.02.2016 17:29

        Там на изображении карты в статье видно, что на территорию России приходится всего 4-5 участков. Похоже, что у Гугла было мало фоток из России при создании карты. А сама сеть, судя по всему, может установить принадлежность фото определенному участку с этой карты, а не координатам.


        1. Mad__Max
          01.03.2016 00:39

          Не видно — на самом деле на Россию там приходится не меньше сотни-другой сегментов. Просто большая их часть сосредоточена компактно в европейской части. Но это особенность не карты/алгоритма, а самой страны — у нас и население подавляющая часть проживает весьма компактно в европейской части — соответственно и массивы фото им генерируемых так же распределены. А вот уже плотность "координатной сетки" нейросети пропорциональна кол-ву фото из соответствующего региона, поэтому большие пустые необжитые территории сливает в один крупный сегмент. + проекция Меркатора как обычно искажающая пропорции(резко завышая площади визуально) в высоких широтах.

          Вот участок приходящийся на РФ детально:

          image


    1. impetus
      01.03.2016 14:09

      У нас надо брать базу не фоток, а видео с регистраторов...


  1. TimsTims
    28.02.2016 01:46

    Сразу вспомнился фильм, где по фотографии преступника где-то в горах — компьютер выделил рельеф, по положению солнца, высоте тени человека и углу падения тени определил, что такой угол мог быть только такого-то числа и только в таком-то месте земного шара)))


    1. arheops
      28.02.2016 06:34
      +1

      Это из разряда "увеличили и выделили номер по четырехпиксельному отражению". Весь рельеф в компьютер не заложишь, да и меняется он все же чуток. А также картинка зависит от обьектива средства сьемки.


    1. tmin10
      28.02.2016 15:42

      Был какой-то боевик, по фотографии вычислили высоту солнца, по дате снимка определии, что эта фотография была сделана в антарктиде. Мне кажется, что такое возможно, но точность конечно не будет даже близко около 1км.


  1. 007913
    28.02.2016 17:45

    Три месяца назад когда была популярна гугл игра про порталы мне один коллега подобное сказал :), что они собирают "маяки" для уточнения имеющихся карт в части содержания — люди сами приносили данные (плюс к тому статистически много данных от разных людей — ошибок минимум!) о позиционированиии конкретных мест в множестве городов в игровой форме.


    1. impetus
      01.03.2016 14:00

      Мне эта "игра" как-то слишком что-то ещё вторым-третьим слоем в ней спрятанное подозрения вызывает. Как-то в ней серьёзно всё что ли...


  1. baldr
    28.02.2016 23:46

    Просто умная нейросеть способна вытащить GPS-метки из фотографии, на что большинство современных пользователей не способны.
    Более того, они даже не имеют представления что их телефон и некоторые фотоаппараты геотеги сохраняют.


    1. impetus
      01.03.2016 14:06

      Да как минимум часовой пояс, заводской номер камеры и версию софта привязать к людям и по ним найти альбомы этих людей в фейсбуках, сравнить время снимков с их собсвенными чек-инами, подписями к фоткам и названиям альбомов и т.п.(номерам авиарейсов, бронью номеров в гостиницах и столиков в ресторанах, посещение афишных концертов, выставок, метео-аномалий (снег/гроза))…