Термин «Big Data» стал очень популярным за последние несколько лет. Сейчас чуть не на каждом сайте обсуждается Big Data и все, что с этим связано. Конечно, данные, которые собираются и анализируются для нужд организаций или общества — все это изменяет наши жизни, улучшает их.

Правда, в этом году тренд Big Data становится уже не таким быстрорастущим, как ранее. Некоторые области бизнеса, кажется, разочаровываются в данных. Сегодня в дискуссиях, идущих в отношении Big Data, все больше слышны голоса скептиков.


Данные по Google Trends, статистика по Big Data

И дело не в том, что анализ данных и соответствующее ПО становится менее ценным для организаций. Наоборот, анализ данных, как дисциплина, сфера ИТ, далек от исчерпания своих возможностей. Все это весьма ценно, и с течением времени эта сфера становится все более доступной и ценной.

Тем не менее, Big Data имеет к этому не слишком большое отношение. Это просто термин, шаблон, который нуждается в переосмысливании.

Необходимость в более точной терминологии



Проблема в том, что мало кто понимает, что именно собой представляет Big Data. И понимание людей в этом отношении весьма различно. Кто-то может сказать, что любой набор данных объемом в терабайты — это «Big Data». Еще кто-то оспорит это, считая, что Big Data — это только информация, которая может быть полезной после ее обработки. Тем не менее, большинство разговоров о Big Data ведется компаниями, производителями оборудования, которые не слишком беспокоятся о том, чтобы дать точное определение термину. Чаще всего это определение дается тогда, когда сложно дать иное.

Все больше специалистов сейчас предлагает перестать использовать словосочетание Big Data как термин, и определиться с тем, о каких типах данных мы говорим: структурированные или нет, 1 миллион строк или 100 миллионов, внешние или внутренние данные. Это поможет понять, насколько информация, имеющаяся в нашем распоряжении, может быть полезной.

Достижение «плато продуктивности»



Отчет 2014 Hype Cycle от Gartner, опубликованный в августе прошлого года, позиционирует Big Data как одну из сфер, которые находятся «на пути к разочарованию». Это означает, что первоначальные мечты и ожидания по отношению к Big Data могут не оправдаться.



Специалисты Gartner считают, что Big Data вскоре достигнет плато продуктивности. Произойти это должно за период времени от 5 до 10 лет. Другой интересный аспект — бурное развитие «Интернета вещей» и носимой электроники. Это, в частности, стало причиной приобретения Pentacho компанией Hitachi за $500 миллионов.

Данные никуда не денутся, их становится все больше, и сейчас появляются все новые методы анализа информации. Тем не менее, переоцененному термину «Big Data» нужно дать отдохнуть, и вместо этого обратить внимание на различные направления аналитики, а также технологий и практик, берущих начало в аналитике данных.

Комментарии (9)


  1. Crank
    31.03.2015 17:51

    Мне вспоминаются похожие статейки о веб 2.0 лет 7 назад.


  1. A3a
    31.03.2015 18:36

    Конечно же стоит использовать.

    Это означает, что первоначальные мечты и ожидания по отношению к Big Data могут не оправдаться.
    Вряд ли не оправдаются, опять же
    Наоборот, анализ данных, как дисциплина, сфера ИТ, далек от исчерпания своих возможностей. Все это весьма ценно, и с течением времени эта сфера становится все более доступной и ценной.
    А анализ «больших данных» тем более. Плюс к этому по Hype Cycle за Big Data бежит Data Science, который тесно связан с Big Data и по отчету достигнет «плато продуктивности» через 2 года, можно сделать вывод что они оба не застрянут в «яме разочарования».

    А что касается самого термина Big Data то это только обобщенное красивое и короткое название того, что за ним скрывается, информация в разной вариации, больших объемах, различных типах (структурированные, не структурированные) с высокой скоростью поступления.


  1. BalinTomsk
    31.03.2015 20:49

    Big Data насколько я помню это когда возможности сервера не хватает чтобы обработать весь обьем данных.
    Скажем у нас в компании 70 миллионов активных клиентских соединений и самая сильнонагруження база Oracle в мире на HP Superdome и никому в голову не приходет назвать это BigData.

    Поэтому когда люди пишут у них BigData на домашнем компютере они как минимум кривят душой.


    1. unkinddragon
      31.03.2015 23:06

      Big Data это когда вместо одного Superdome стоит 100 серверов supermicro, которые все вместе стоят в 10 раз дешевле.


      1. Rulexec
        01.04.2015 02:21

        Нет, это горизонтальное масштабирование, а не BigData.


    1. Crank
      01.04.2015 11:34

      О, ужас! Получается что бигдата — это проделки маркетологов? =)


  1. BalinTomsk
    01.04.2015 00:00

    ---которые все вместе стоят в 10 раз дешевле

    А база-то где? Big Data это не пачка контроллеров.


    1. unkinddragon
      01.04.2015 00:12

      База распределена на всех этих серверах, каждый из которых и хранит данные, и умеет выполнять над ними задачи.


  1. BalinTomsk
    01.04.2015 01:57

    В гугле полторы ссылки на союз слов supermicro и BigData. Идея в том что поставив 10 серверов вы 10 раз ускорите работу базы данных сродни идей что 10 пограммистов сделают продукт в 10 раз быстрее.

    Хотя бы потом что соединения между серверами медленные.