Программист из Канады Джозеф Ярощак опубликовал базу, которая насчитывает 2,1 млн сообщений Usenet, одной из старейших компьютерных сетей для общения и обмена файлами. Она появилась еще в 80-е годы. Сеть используется по сей день.
Ярощак опубликовал сообщения за период с февраля 1981 года по июнь 1991-го. Он брал материалы из архива UTZOO NetNews Archive, записанного на 141 магнитной ленте программистом из Университета Торонто Генри Спенсером.
Автор базы утверждает, что это самые ранние из ныне опубликованных в сети переписок представителей университетов, которым в то время был доступен интернет.
Этот последний дамп архива является частью еще более крупного проекта Ярощака. В прошлом месяце он запустил сайт архива Usenet. Всего там размещено 317 млн записей из 10 тысяч уникальных новостных групп Usenet. Ярощак планирует довести этот показатель до миллиарда.
Программист преобразовал плёночные записи в базу данных PostgreSQL, которую он выгрузил на Usenet Archives. Ярощак также выложил конвертеры для PHP, JavaScript, Java и Python на GitHub.
«Эти посты проливают свет на то, как мыслило интернет-сообщество на заре интернета», — говорит он, отмечая, что в архиве есть важный для историков и исследователей контент.
Сам Ярощак, системный архитектор из Онтарио, впервые познакомился с Usenet в 2000 году, когда нашел постоянную работу в Канаде благодаря размещению вакансии в этой сети.
См. также:
Allister2
Некоторая коррекция инфы:
опубликовал базу — он не опубликовал базу, он взял давно лежащие в публичном доступе файлы, сконвертировал их в PostgreSQL базу, написал к ней веб-интерфейс и приделал к нему цензурирование статей (он объясняет это SEO практиками), видимо это путь к дальнейшей монетизации проекта, когда его индексируют поисковики ;)