Пример распознавания объектов с помощью Visual Recognition

До недавних пор IBM Watson Visual Recognition в основном использовался для распознавания изображения, как единого целого. Однако работа с картинкой, как с единым целым — далеко не самый правильный подход. Теперь, благодаря новой функции распознавания объектов, пользователи IBM Watson получили возможность обучать модели на изображениях с размеченными объектами, для их последующего распознавания на любых кадрах.

Покажем как это можно теперь сделать.

Если раньше с помощью IBM Watson Вы могли отличить поврежденный автомобиль от неповрежденного, то теперь Вы можете не просто распознать наличие повреждения, но и оценить его положение и размер. Подобный подход отличается гораздо большей информативностью, позволяя сделать предсказания о стоимости необходимого ремонта.
Конечно же список вариантов применения данного функционала гораздо шире, чем простая проверка целостности автомобиля. Теперь Вы сможете использовать Watson Visual Recognition для:

  • Подсчета количества людей в очередях или автомобилей в пробке
  • Идентификации товаров на торговых полках
  • Распознавания логотипов на фотографиях
  • Анализа снимков КТ и МРТ на наличие отклонений
  • Других задач, связанных с работой с конкретными объектами на снимках

Вам не придется тратить месяцы на подбор и разметку данных – наша модель уже обучена на нескольких миллионах образцов и обеспечивает достаточно высокое качество предсказания без каких-либо изменений. При необходимости Вы всегда сможете дообучить её для того, чтобы нейронная сеть отвечала специфике Вашей области деятельности.

Размечайте изображения и обучайте модель на своих данных быстрее с Watson Studio


Обычно обучение собственной модели точному распознаванию объектов — наиболее трудная задача при создании системы компьютерного зрения. Watson Studio ускоряет этот процесс и помогает сократить время при работе с большими объемами данных. В связке с бесплатным дополнением Auto Label вы сможете быстро разметить все изображения, находящиеся в датасете.

Начало работы


После активации и создания Visual Recognition приложения в облаке, подключите его к Watson Studio и в разделе Custom Models создайте модель в окне Detect Objects.

image

Загрузите ваши неразмеченные данные в Watson Studio (можно использовать JPEG, PNG или ZIP архив, содержащий эти изображения)

image

Выберите изображение, выделите объект, который вы хотите распознавать, дайте ему название и сохраните. Повторяйте до тех пор, пока не выделите все необходимые объекты на данном изображении.
image

Как только Вы разметите несколько изображений, Вы можете обучить и протестировать вашу модель.

image

Вы также можете добавить больше изображений для повышения качества модели с помощью функции Auto Label, которая поможет Вам разметить все ваши данные. Для применения данной функции, выберите все необходимые изображения и нажмите на кнопку «Auto Label», чтобы Watson самостоятельно разметил данные, в соответствие с заданными классами.

image

После проверки точности Вашей модели вы можете встроить готовое решение в Ваш продукт.

image

Попробуйте распознавание объектов с IBM Watson Visual Recognition бесплатно уже сегодня!

Также хотим пригласить Вас на бесплатные обучающие семинары по IBM Watson Studio и Visual Recognition в облаке IBM, проводимые в ноябре в клиентском центре нашего московского офиса.

Дополнительные материалы:


Комментарии (4)


  1. shadrap
    08.11.2019 13:41

    такое впечатление что у ИБМа какой-то другой curl. С тренировками сети все понятно, даже довольно сложные объекты распознает, но вот что б использовать тренерованное через curl ни один аргумент из туториала не работает, начиная с аунтификации. Кто-то пробовал?


    1. searchag
      08.11.2019 15:14

      На закладке «Implementation» есть секция «Code snippet» и там уже подготовленный curl для вашей модели. Только что попробовал — все работает на macos (пришлось только указать соответствующий threshold). Вот пример (ключ и collection id надо свой поставить):

      curl -X POST -u "apikey:CUJcQ00-876348756384576-8jrUzqP56WRyJ-1092" -F "threshold=0.15" -F "features=objects" -F "collection_ids=45845875-ab6b-6567-997b-c192c8f89ead" -F "images_file=@images_50.jpeg" "https://gateway.watsonplatform.net/visual-recognition/api/v4/analyze?version=2019-02-11"


      Результат:
      {
          "images": [
              {
                  "source": {
                      "type": "file",
                      "filename": "images_50.jpeg"
                  },
                  "dimensions": {
                      "height": 183,
                      "width": 275
                  },
                  "objects": {
                      "collections": [
                          {
                              "collection_id": "45845875-ab6b-6567-997b-c192c8f89ead",
                              "objects": [
                                  {
                                      "object": "face",
                                      "location": {
                                          "left": 100,
                                          "top": 21,
                                          "width": 27,
                                          "height": 37
                                      },
                                      "score": 0.2555423
                                  }
                              ]
                          }
                      ]
                  }
              }
          ]
      }


      1. shadrap
        08.11.2019 15:49

        какая версия curl у вас? У меня 7.51 для виндовс, аунтификации через апи нет, только через юзернейм: пассворд, но это и бог бы с ним, -F ключа нет…
        Кстати как распознавание? Объекты неплохо, а вот с лицами совсем никак..., даже на объемных тренировках


  1. searchag
    08.11.2019 16:28

    curl 7.54 под MacOS

    $ curl -V
    curl 7.54.0 (x86_64-apple-darwin18.0) libcurl/7.54.0 LibreSSL/2.6.5 zlib/1.2.11 nghttp2/1.24.1
    Protocols: dict file ftp ftps gopher http https imap imaps ldap ldaps pop3 pop3s rtsp smb smbs smtp smtps telnet tftp
    Features: AsynchDNS IPv6 Largefile GSS-API Kerberos SPNEGO NTLM NTLM_WB SSL libz HTTP2 UnixSockets HTTPS-proxy