Российская ИТ-компания ABBYY запускает новый масштабный проект. В США начинает работу поисковик Findo. Ключевыми отличиями Findo основатель компании Давид Ян называет умение искать информацию в облачных хранилищах, социальных сетях и на пользовательских устройствах (компьютерах и смартфонах).

Еще одним отличием является способность поисковика обрабатывать запросы на человеческих языках (например, по запросу «найди мне презентацию, сделанную в декабре» поисковик отыскивает на вашем компьютере файл, подходящий по параметрам).

Findo – разработан на базе платформы Compreno. Это система анализа текста, которую ABBYY разрабатывает более 10 лет. На ее разработку было потрачено более $80 миллионов. По задумке ABBYY Compreno может находить нужную информацию не только с помощью слов поискового запроса, но и с помощью заложенных между ними связей и контекста.

Согласно исследованию ABBYY около 20% пользователей не сразу находят нужную им информацию, объясняет Ян. Findo предлагает выход – объединить все источники информации и проиндексировать их.

Конкуренты у Findo есть, но они либо умеют искать только по одному типу хранилища (облачному или локальному), либо не понимают естественный язык и не видят связи между объектами, рассказывает «Ведомостям» Ян.

Современные поисковики понимают суть вопроса, заданного в естественной форме, и сейчас уже идет работа над тем, чтобы понимать вопросы, заданные голосом, возражает директор по распространению технологий «Яндекса» Григорий Бакунов. Создание поисковика, который может искать информацию и в интернете, и в облачном фотоальбоме, и в sms-сообщениях, и в документах рабочего стола, Бакунов называет сложной, но реализуемой задачей.

Findo будет ориентирован на массовый рынок – пока с англоязычной аудиторией. Сейчас продукт тестирует около 1000 человек. ABBYY вложила в Findo $1,5 миллиона, и в 2016 году вложит еще $1,4 миллиона. Сейчас искать можно только на английском языке, но Ян не исключает, что ABBYY добавит другие языки в зависимости от спроса в разных регионах.

В соответствии с принятой freemium-моделью монетизации, базовый продукт будет бесплатным, но пользователям предстоит платить за дополнительные опции. Платный сервис будет стоить около $5 в месяц. Другой способ заработка – лицензирование Findo сторонним производителям, говорит Ян. По его словам, сейчас ABBYY ведет переговоры с двумя компаниями, имеющими большую аудиторию, нуждающуюся в интеллектуальном поиске.

Ян полагает, что Findo будет получать прибыль при 2,2 миллиона пользователей, если из них 2-8% будут платить за пользование сервисом.

Дочерняя компания ABBYY – ABBYY Language Solutions – пошла несколько другим путем, но без бесплатных «плюшек» не обошлось.

«Мы [ABBYY LS] отказываемся от продажи лицензий на нашу облачную платформу для автоматизации перевода SmartCAT. Это не freemium-модель: для корпоративных клиентов полный доступ к платформе бесплатен. Для переводчиков-фрилансеров платформа была и остаётся бесплатной», рассказал «Мегамозгу» PR-директор ABBYY LS Сергей Корнилов.

Ранее платформа работала по модели платных лицензий за одно рабочее место. Компания планирует зарабатывать за счет комиссии с транзакций и дополнительных сервисов: расширенной технической поддержки, услуг по внедрению и так далее. По оценкам специалистов ABBYY LS, примерно через год выручка от сбора комиссии составит около $1 миллиона в месяц.

Сергей Корнилов объяснил, почему дополнительные сервисы должны принести прибыль и за что еще готовы платить клиенты:
Такие сервисы важны для переводческих агентств и компаний, в бизнес-процессах которых перевод играет важную роль. Компаниям нужны определенные гарантии с нашей стороны по стабильности системы при высоких нагрузках и по поддержке. Кроме того, клиенты готовы платить за индивидуальный подход в виде персонального менеджера, являющегося единой точкой контакта, некоторые доработки системы под требуемые процессы (так называемая «кастомизация»), а также за регулярное обучение новых сотрудников работе со SmartCAT.

Кроме того, в рамках SmartCAT на российском рынке открывается маркетплейс, в котором можно найти более 50 000 переводчиков из 100 стран. SmartCAT будет взимать 10% от суммы платежа. Платформа SmartCAT изначально создавалась для переводчиков-фрилансеров. По мнению представителей компании, это и позволило привлечь такое количество специалистов со всего мира за короткий период.

Маркетплейс позволяет бизнесу работать и рассчитываться с переводчиками, редакторами, корректорами напрямую. Подобрать переводчиков и организовать собственную команду можно по следующим параметрам: языковые пары (например, английский — русский и другие), владение тематикой, родной язык, тарифы, наличие пройденных тестов, количество выполненных проектов, активность на платформе и отзывы от заказчиков, говорится в пресс-релизе компании.

Комментарии (29)


  1. worldmind
    21.01.2016 18:16

    Т.е. Findo это поисковик по личным данным на разных сервисах, а не по интернету?


    1. Shapelez
      21.01.2016 19:16

      Насколько я понимаю, это дополнительный объем информации доступный в результатах поисковой информации.


      1. brauny
        22.01.2016 16:50
        +2

        привет, я работаю в команде Findo.

        все верно. Просто искать письмо или файл — не интересно. Интересно то, ради чего ищут — где мой билет? во сколько у меня доклад там-то (помню, пригашение высылали, от чьего имени)? нужны цифры из презентации или таблицы, я помню, что они значат, но не помню, какой был у них заголовок. Где-то у меня был контакт человека, который занимается маркетингом, имени не помню, компанию не помню и т.д.

        Мы учим Findo искать именно нужные человеку данные, а не просто письмо или файл по ключевым словам, которые человек и помнит-то неточно или совсем не помнит.


        1. worldmind
          24.01.2016 22:36

          Исходный вопрос был в том ищет ли findo только по личным данным или у этого нового поисковика есть паук который индексирует весь англоязычный инет?
          В статье ясно не обозначено позиционирование этого нового продукта.


          1. brauny
            25.01.2016 09:05

            Только по личным


  1. daaner
    21.01.2016 19:53

    «и на пользовательских устройствах (компьютерах и смартфонах)»
    Теперь при индексации все данные со смартфона или ПК уйдут в базу к кому-то? Как-то не вдохновляет…
    Или я что-то не так понял? Поправьте меня


    1. semen_grinshtein
      21.01.2016 20:02

      Findo ищет информацию в облачных хранилищах, социальных сетях и на пользовательских устройствах (компьютерах и смартфонах).

      Findo объединяет ВСЕ источники информации и индексирует их. Конкуренты Findo умеют искать только по одному типу хранилища (облачному или локальному).

      Поисковик еще на тестировании. Перейдите по ссылке: beta.findo.io. Может, все станет яснее.


      1. daaner
        21.01.2016 20:38

        Пытаюсь зарегистрироваться
        image
        Ага, вижу что еще не тестировалось))) думаю я подожду какого-то релиза


      1. daaner
        21.01.2016 20:44

        Хотя рега прошла))))

        Я весьма скрупулезен к личной информации, тестировалась ли у Вас защита сервера данных?
        Не хотелось бы где-то прочитать статью, что БД финдо утекла «Васе Пупкину» со всеми хешами, пассами, емайлами и данными из облоков


        1. brauny
          22.01.2016 16:56
          +2

          Тестирование защиты проводим систематически. В ближайших планах – масштабное тестирование с помощью сторонней компании, которая на этом специализируется.


      1. Nashev
        21.01.2016 21:08
        +1

        Вопрос был про то, где хранится индекс и где работает программа, его создающая


    1. brauny
      22.01.2016 16:54
      +1

      Индекс хранится в дата центрах Microsoft по тем данным, к которым пользователь разрешает Findo иметь доступ.
      Конечно, Findo не забирает с компьютера и из почты письма или файлы. Понятно, что кто в gmail или dropbox данные не хранит, или не хранил, когда они только появились, тот и в Findo не будет. Новому сервису в такой сфере дейтсвительно нужно время, чтобы завоевать доверие пользователей. Это прада


  1. datsenko
    22.01.2016 00:47

    интересно)


  1. Akr0n
    22.01.2016 05:29

    Когда-то у Google и Yandex были десктопные приложения для поиска, они индексировали все на дисках, плюс выдавали и результаты из Интернета, было довольно удобно… Потом эти проекты закрыли.


  1. Quickie
    22.01.2016 05:31

    Findo будет ориентирован на массовый рынок – пока с англоязычной аудиторией. Сейчас искать можно только на английском языке, но Ян не исключает, что ABBYY добавит другие языки в зависимости от спроса в разных регионах.

    Добавлю капельку к спросу. Мне, как русскоязычному пользователю, продукт интересен. Причем и для личных, и для корпоративных целей.


    1. brauny
      22.01.2016 16:59
      +1

      Спасибо, капельку получили) где ужно искать каждый день — если это не секрет, конечно :)


      1. Quickie
        25.01.2016 02:32

        Не обязательно же каждый день искать, но когда требуется найти, то хочется сократить время на поиски, особенно если есть возможность сразу везде да еще и на человеческом языке. :)


        1. brauny
          25.01.2016 09:07

          Понятно, спасибо!


  1. Infanty
    22.01.2016 10:24

    В 2009 был похожий прототип на Яндекс.Старте, тогда подобные технологии мало кого интересовали. Очень рад, что ABBYY двигает рынок и технологии на рынке поиска. К тому же в последние годы появилось множество ПО для подобного анализа больших данных. Буду надеется, что у них взлетит, тогда в этот сегмент рынка хлынут инвестиции и мы сможем увидеть новые компании подобные «Google».


    1. brauny
      22.01.2016 16:59
      +1

      спасибо!


  1. elingur
    22.01.2016 10:32

    Ну судя по тому, что по самым грубым подсчетам Compreno может индексировать одно предложение в секунду, то говорить о полноценном интернет-поисковике просто глупо — загнется на дневном потоке одного фейсбука. Скорее всего это локальный поисковик по небольшим объемам информации, которые можно будет скармливать индексатору.


    1. brauny
      22.01.2016 17:04
      +1

      Findo — поисковый сервис по личным почте и файлам, Gmail, Google Drive, Dropbox, компьютер, мобильный телефон (пока iOS). Скоро появится Evernote. Работа над сервисом продолжается, Facebook многие просят :)


  1. Samoglas
    22.01.2016 11:06

    На на стареньком ноуте с 2 Гб памяти до сих пор нет SSD, поэтому виндовый полнотекстовый поиск бесполезен, очень медленно. Evrething работает мгновенно, но ищет только по именам файлов и папок. Десктопные приложения Гугла и Яндекса заброшены и потому не пользуюсь, так что интерес к Findo огромный. Но так и не понял, будет ли храниться только локально индекс Windows-приложения, например, как работает Google Desktop, дополняя выдачу на странице Google результатами поиска на локальном жестком диске, или индекс с локального компьютера уйдет в облако с неизвестными последствиями, но, конечно же, для нашего удобства?


    1. brauny
      22.01.2016 17:13
      +1

      вы правы. Индекс хранится в дата центрах Microsoft.
      Мы понимаем, доверие пользователей нужно завоевать и на это понадобится время.


      1. Samoglas
        25.01.2016 07:50

        Это засада. Потому что получится, что саму структуру моих данных нужно будет подстраивать под программу, а должно быть наоборот. То есть тщательно сортировать, что можно, что нельзя индексировать. Соответственно, это и найти будет нельзя. И все равно, пароли или конфиденциальная информация так или иначе утечет, у меня случалось такое за 20 лет использования компов. Или по моей ошибке или по ошибке в коде программы (о злом умысле разговор даже не завожу).

        Содержимое винта — единственное, что осталось у пользователей в секрете, по крайней мере, хочется на это надеяться. Все остальное корпорации и спецслужбы уже знают и давать это добровольно — ну уж нет.
        Такой хоккей нам не нужен, ставить не буду, хотя очень нуждаюсь в инструменте для поиска. Это не то, что нужно. Безопасность данных важнее удобства.


        1. brauny
          25.01.2016 09:07
          +1

          В любом случае, спасибо за комментарий


  1. worldmind
    25.01.2016 16:17

    Подумалось, раз compreno пока не годится для всеинтернетного поиска, то может можно сделать какие-нибудь нишевые поисковики? Например, по википедии или по научным статьям. В таком случае объём данных для поиска сильно меньше, а ценность более высокая. Многие запросы в гуглояндексах выдают первую ссылку на википедию и этого часто достаточно, возможно такого поиска будет достаточно для значительной части запросов.
    Иногда пользуюсь wolframalpha для поиска статистических данных, типа «число убийств в год на тысячу жителей в стране» или рейтинг стран по чему-нибудь, но у вольфрама язык запросов достаточно тупой, он мимикрирует под естественный, но шаг в сторону и уже не работает, возможно тут compreno мог бы показать себя. В таком случае нужно анализировать определённый набор сайтов (ООН, всемирный банк и т.п.)


    1. brauny
      26.01.2016 11:08

      Compreno – это базовая технология, которая может использоваться для разных задач, в том числе, и для той, что описываете вы. Браться за все задачи невозможно, мы в ABBYY выбираем наиболее приоритетные для нас с точки прибыли.
      Сейчас сфокусировались на разработке решений для корпоративного рынка. Это решения, которые позволяют анализировать информацию, извлекать важные объекты и факты, классифицировать документы, расширять возможности корпоративных поисковых систем. Но, конечно, Compreno могут лицензировать и другие компании под свои задачи.
      Спасибо за ваш интерес :)


  1. worldmind
    25.01.2016 16:19

    Вероятно ABBYY придётся спроектировать какую-нибудь железяку для ускорения работы compreno )