Первая система для обработки больших объемов данных появилась в конце 19 века. Американский инженер Герман Холлерит создал ее для того, чтобы обрабатывать результаты переписи населения США. Компания Холлерита — первый ИТ-стартап — нашла частных инвесторов и государственные заказы, создала новую отрасль, и привлекла сотни клиентов. Однако ее монопольное положение на этом рынке было недолгим — вскоре появился конкурент, который смог предложить пользователям более низкие цены и новые технологии.
О первой в истории ИТ войне систем рассказывает исследователь истории науки и техники, автор Центра непрерывного образования факультета компьютерных наук НИУ ВШЭ Антон Басов.
Как стать первым монополистом на рынке обработки данных
Согласно Конституции США, «исчисление фактического населения штатов» должно производиться каждые десять лет. Первая перепись населения бывших тринадцати колоний прошла еще в 1790 году. С тех пор количество американского населения росло, считать его становилось все сложнее. Обработка результатов переписи 1880 года заняла восемь лет и закончилась незадолго до проведения новой переписи. Стало ясно, что считать население вручную больше невозможно.
Вопросом механизации переписи занялись двое — Джон Шоу Биллингс и Герман Холлерит. Биллингс был крайне разносторонним человеком: хирург по образованию, он стал одним из главных врачей американской армии, сыграл важную роль в создании больницы Джонса Хопкинса при одноименном университете и Нью-Йоркской публичной библиотеки. Как представитель руководителя медицинской службы армии США, Биллингс участвовал в анализе данных переписей 1870 и 1880 годов.
Как раз во время работы над результатами переписи 1880 года, Биллингс познакомился с сотрудником Бюро переписи населения Германом Холлеритом. Холлерит, недавний выпускник Колумбийского горного училища, работал в Бюро над статистикой машин и механизмов в промышленности.
Работа счетчиков в Бюро переписи была утомительной. Видимо, наблюдая за ней, Биллингс сказал Холлериту: «Должна же быть какая‑то машина для выполнения этой механической работы».
Холлерит загорелся идеей. Спустя некоторое время он показал Биллингсу модель счетной машины. Вдвоем они потратили много времени, пытаясь улучшить систему, пока Биллингсу не наскучило — он все‑таки был врачом, а не механиком. Однако он выполнил главную задачу — заинтересовал Холлерита вопросом и даже обрисовал в общих чертах решение: каждая единица данных записывается с помощью перфораций на отдельную карточку, которая затем обрабатывается с помощью специальных устройств.
В 1884 году Холлерит увольняется из Бюро переписи и подает первую заявку на патент. К 1889 году он получает три патента — US395 781, US395 782, US395 783 — в которых описываются все части его системы:
Данные заносятся на карточки с помощью перфоратора. Каждое отверстие соответствует наличие какого‑либо признака — пола, возраста, цвета кожи.
Оператор пропускает карточки через табулятор. Когда в определенном месте карточки есть отверстие, оно позволяет замкнуть электрическую цепь и прибавить единицу на счетчике. Таким образом, каждый счетчик подсчитывает количество карт, на которых имеется тот или иной признак.
-
Когда карточка прочитывается, автоматически открывается одна из ячеек сортировального ящика, куда помещается карточка (сортировальный ящик может сортировать только в пределах одного признака, например по возрасту: до одного года, от 1 до 10 лет, от 11 до 20 и так далее).
Перфокарты можно пропускать через табулятор снова и снова, сортируя их по разным признакам и их сочетаниям.
Как и любой основатель технологического стартапа, Холлерит с переменным успехом ищет спонсоров и клиентов. В 1886 году он получает первый крупный подряд — его система используется для анализа демографической статистики в Балтиморе. Затем последовали испытания в Нью-Джерси и Нью-Йорке, а также в офисе руководителя медицинской службы армии США. Скорее всего, Холлерит получил все эти подряды не без поддержки Биллингса.
В 1889 году Холлерит отправил набор оборудования для обработки перфокарт на всемирную выставку в Париже, где тот удостаивается золотой медали. Тогда же Бюро переписи населения объявляет конкурс систем для обработки данных переписи 1890 года. Система Холлерита выигрывает и он подписывает договор на поставку оборудования.
Скорость работы системы была огромной для того времени. Первые результаты были обнародованы уже через шесть недель после дня переписи. В целом обработка результатов переписи 1890 года заняла три года (против восьми для переписи 1880 года). Использование системы Холлерита позволило сэкономить порядка пяти миллионов долларов при общей стоимости переписи около 12 миллионов.
Холлерит решил не продавать оборудование Бюро переписей, а давать его в аренду. После окончания обработки данных машины вернулись к нему и он начал искать других клиентов. Холлериту удалось продать новую технологию двум потребителям — иностранным правительствам и крупному бизнесу. С одной стороны, его машины начали применять для переписей населения в Австрии, Канаде, Италии, России и других странах. С другой, Холлерит начал внедрять счетно-аналитические машины для работы с перфокартами в страховых компаниях, на железных дорогах и других предприятиях, где нужно было быстро и эффективно обрабатывать большие массивы информации.
Как правительство США решило «войти в айти»
При подготовки переписи 1900 года никаких сомнений, использовать ли систему Холлерита, не осталось. Холлерит предложил Бюро переписей усовершенствованное оборудование: табулятор с автоматическим считыванием карт (до этого карты считывались по одной на ручном прессе), автоматическую сортировочную машину вместо сортировального ящика, новый перфоратор.
Однако последствия переписи 1900 года ознаменовали конец монополии Холлерита на поставку оборудования для работы с перфокартами. В 1902 году появилось постоянное Бюро переписи населения, руководителем которого в 1903 году стал статистик Саймон Норт. Изучив договоры с Холлеритом, Норт приходит к выводу, что арендная плата слишком высока. Холлерит отказывается идти на уступки, и Бюро не перезаключает договор. Вместо этого Норт создает при Бюро переписи собственную механическую мастерскую.
Задачей мастерской стало создание собственного оборудования. Времени до следующей переписи было достаточно, а срок действия первых патентов Холлерита уже истекал — поэтому мастерская могла просто скопировать его старые машины и внести в них небольшие усовершенствования. Сотрудники мастерской начали именно с этого, постепенно переходя к разработке нового, более совершенного оборудования.
У табуляторов Холлерита, даже с автоматическим вводом перфокарт, была проблема — данные с карт не записывались, а только отображались на счетчиках. Переписывать их приходилось вручную, что было утомительно и приводило к ошибкам. К 1907 году мастерская Бюро разработала первый печатающий табулятор.
Другой проблемой переписи было перфорирование карт, то есть пробивка в них отверстий. Кажется, что проколоть отверстие в куске бумаги несложно — но попробуйте проделать это несколько тысяч (или даже десятков тысяч) раз за день, да еще так, чтобы отверстия были только в нужных местах. Перфораторы Холлерита хотя и помогали пробить отверстие в нужном месте карты, но требовали от оператора большого физического усилия.
Для переписи 1910 года сотрудник мастерской Джеймс Легранд Пауэрс предлагает перфоратор новой конструкции — с автоматической подачей перфокарт, удобной клавиатурой и электродвигателем для пробивания отверстий. Пауэрс, талантливый инженер и изобретатель, приложил руку ко многим разработкам мастерской Бюро переписей и получил несколько патентов.
Пауэрс по праву может считаться одним из пионеров ИТ-индустрии. Несмотря на это, он совершенно забыт, а в его биографии зияют многочисленные дыры. Точно известно немногое: Пауэрс родился в 1871 году в Одессе. В 1889 году он переехал в США и работал механиком в крупных компаниях, в том числе в Western Electric.
Неизвестно, когда именно он стал сотрудником мастерской Бюро переписи, но он определенно работал там между 1907 и 1911 годами. По всей видимости, правительство США дало ему разрешение запатентовать его изобретения, хотя они были сделаны им на государственной службе.
Во время переписи 1910 года было собрано все имевшееся тогда оборудование. Для пробивки карт использовались как новые перфораторы Пауэрса, так и старые перфораторы Холлерита. Сортировальные машины были тоже Холлерита, построенные им для переписи 1900 года и сильно переделанные (сам Холлерит, узнав о переделке своих машин, подал в суд за нарушение своего патента. В итоге — неожиданный поворот — суд аннулировал патент, так как Холлерит сначала построил сортировальные машины для Бюро переписи, а только потом запатентовал их). А вот табуляторы были уже собственной разработки мастерской Бюро. Несмотря на эту пеструю смесь, перепись прошла успешно.
Впрочем, уже к переписи 1920 года стало понятно, что силами одной только мастерской обойтись все равно не получится. Во время следующих переписей Бюро вернулось к практике аренды или покупки оборудования, которое не имело смысла изготавливать своими силами. Другие правительственные учреждения тоже арендовали или покупали оборудование вместо того, чтобы делать его самостоятельно (например, почтовая служба использовала оборудование и Холлерита и Пауэрса).
Кто выиграл первую войну стандартов?
В 1911 году в отрасли перфокарт произошли два важных события.
Во-первых, Tabulating Machine Company Холлерита слилась с тремя другими компаниями в холдинг Computing-Tabulating-Recording Company. Холлерит продал контрольный пакет акций и стал в новой компании консультантом. В 1915 году президентом компании стал Томас Уотсон-старший, который занимал этот пост до 1956 года.
Во-вторых, Джеймс Пауэрс уволился из мастерской Бюро переписи и учредил Powers Tabulating (с 1914 года — Accounting) Machine Company.
Итак, на рынке оборудования для обработки перфокарт появились две конкурирующие компании. Почему же именно это событие можно считать началом первой войны систем в истории ИТ? Все дело в патентах. Пауэрс не мог использовать наработки Холлерита (да, срок жизни первых патентов уже истек, однако и сортировочная машина, и автоматический ввод карт в табулятор все еще были защищены), а поэтому был вынужден изобретать собственные решения.
В основе всех машин Холлерита лежал принцип электрического считывания перфокарт: отверстие в карте позволяет замкнуться контактам и активировать тот или иной механизм. Пауэрс решил не пытаться обойти решение Холлерита, а просто заменить электричество механикой. В разработанных им сортировальных машинах и табуляторах считывающий механизм напоминал пишущую или счетную машинку: на карточку опускались подпружиненные штифты; там, где в ней были отверстия, штифты проходили насквозь и приводили в действие счетные или печатающие механизмы.
К 1914 году Пауэрс предлагал набор из четырех машин для обработки перфокарт: перфоратор, новоизобретенный контрольник для проверки правильности пробивки, сортировочную машину и печатающий табулятор. С технической точки зрения его оборудование было совершеннее, чем у Computing-Tabulating-Recording, которая предлагала клиентам три машины — клавишный перфоратор без мотора, сортировку и табулятор со счетчиками.
Однако и Computing-Tabulating-Recording не собиралась сдаваться. Для начала они обложили Powers Accounting Machine Company данью: в 1914 года Пауэрсу пришлось купить лицензию на использование патентов в обмен на 25 % выручки от аренды машин и 18 % выручки от продажи перфокарт. Не совсем ясно, какие патенты Computing-Tabulating-Recording мог использовать Пауэрс; видимо, он опасался дорогостоящих судебных процессов, которые бы подорвали и без того слабые финансы компании.
Сработала и ставка Холлерита на бизнес. Он начал поставлять свое оборудование частным компаниям еще в 1890 году, одновременно с проведением тогдашней переписи. Спустя двадцать пять лет у Computing-Tabulating-Recording было уже 550 клиентов, использовавших 1076 табуляторов и 827 сортировальных машин для обработки 660 миллионов перфокарт в год. Пауэрс, хороший инженер, но плохой предприниматель, не мог похвастаться такими цифрами. К 1918 году коммерческие неурядицы ему надоели и он ушел из основанной им компании, новым руководителем которой стал инженер Вильям Ласкер.
Хотя Герман Холлерит и Джеймс Пауэрс отошли от дел, их компании продолжали развиваться. Вступление Америки в Первую мировую войну дало бизнесу новый толчок — правительству понадобились системы для обработки данных о солдатах на фронте и экономическом положении в тылу. После войны этот тренд продолжился — задача обработки данных переписи населения отошла на второй план, а счетно-аналитические машины стали использовать для самых разных задач, от бухгалтерского учета до классификации растений.
В 1924 году Computing-Tabulating-Recording сменила название на International Business Machines. А в 1927 году Powers Accounting Machine Company объединилась с семью другими компаниями в Remington Rand.
Еще до войны у обеих компаний появились подразделения в Великобритании, Франции, Германии. В 1929 году британское и французское представительство компании Пауэрса объединились под названием Powers-Samas (или Samas-Powers, от французского Société Anonyme des Machines à Statistiques). Забавно, что Пауэрс, совершенно забытый как человек, продолжал жить в названии компании до 1950-х годов, причем не только в Европе, а по всему британскому Содружеству.
В завершении этого исторического разбора попробуем ответить на вопрос — кто же все-таки выиграл первую войну систем в истории ИТ? Видимо, она окончилась ничьей. Именно конкуренция заставила компании Холлерита и Пауэрса продолжать совершенствовать свою продукцию и создавать инновации — сперва в области счетно-аналитических машин, а затем в компьютерах. Показательно, что Бюро переписи населения США, с которого началась вся эта история, пользовалось продукцией обеих компаний: до Второй мировой войны — оборудованием IBM; а после, в 1952 году Бюро приобрело свой первый компьютер — UNIVAC I — у Remington Rand.
Основанные больше ста лет назад компании продолжают работать и сегодня — IBM сама по себе, а Remington Rand — как часть компании Unisys.
Источники
«Перфокарты. Технико-исторические заметки» Евгения Колесникова. Одна из наиболее подробных книг по вопросу истории перфокарт и счетно-аналитической техники.
The Development of Punch Card Tabulation in the Bureau of the Census, 1890–1940, Leon Edgar Truesdell. Подробная история механизации работ в Бюро переписи населения США.
Punched-Card Systems and the Early Information Explosion, 1880–1945, Lars Heide. История первых систем обработки больших объемов данных в социально-историческом контексте.
Комментарии (2)
checkpoint
04.04.2024 23:57Вторая статья за сегодня про дела "Межделмаш". Что говорят по этому поводу астрологи ?
muxa_ru
Кто-нибудь пытался переобработать исходные записи и проверить, насколько точно были пробиты отверстия в тех перфокартах?