Я провел небольшой эксперимент и по результатам собрал небольшой toolchain и freeware утилит. Вот этим всем и хочу поделиться.
Итак, первое что было сделано — проведена попытка удалить данные средствами самого Adobe Acrobat по соответствующей инструкции. Результат есть, но его никак нельзя назвать удовлетворительным, т.к. во-первых это стрельба из пушки по воробьям, а во-вторых объём файла на выходе почему-то увеличился почти на порядок.
Затем, среди кучи crapware была найдена чудесная windows утилита BeCyPDFMetaEdit, но она уверенно справляется с PDF v 1.6 и ниже, а для более новых ревизий формата результат не гарантирован.
Ultimate решение как водится пришло из мира *nix и сообщества сторонников свободного ПО с отрытым исходным кодом. Это связка из утилит ExifTool, QPDF и Xpdf, каждая их которых доступна также и под Windows. Т.к. лицензии этих утилит не запрещают их свободно распространять без изменений, то я смело собрал их в едином архиве (WINx64) со скриптом и элементарной инструкцией по применению. Если кратко, то Вы распаковываете архив, кладете подлежащий очистке pdf файл в получившуюся папку и затем перетаскиваете его на DEMETA.bat. Скрипт отработает и ваш файл станет девственно чист.
askubuntu.com/questions/27381/how-to-edit-pdf-metadata-from-command-line
gist.github.com/hubgit/6078384
www.sno.phy.queensu.ca/~phil/exiftool
qpdf.sourceforge.net
stackoverflow.com/questions/19263643/windows-equivalent-for-unixs-pdfinfo
www.foolabs.com/xpdf/download.html
www.becyhome.de/becypdfmetaedit/description_eng.htm
Комментарии (9)
RealSaniok
20.03.2017 22:42Как то раз стояла задача подредактировать метаданные. Pdf Metadata Editor ( https://github.com/zaro/pdf-metadata-editor ) с задачей справилась
llgruff
20.03.2017 23:50Пользуюсь FileOptimizer скачать можно на sourceforge.
Проверил на первом pdf:
Оригинал 2 308 766 b
FileOptimizer 1 928 541 b
DEMETA.bat 1 928 399 b
fpinger
21.03.2017 05:45— Почему растут pdf файлы при их изменении?
— Потому что в них добавляются копии изменённых объектов и меняется таблица актуальных объектов в конце файла, но при этом старые, не актуальные объекты остаются в теле документа.
— Но я удалил объекты.
— Поверь мне, они остались.saege5b
22.03.2017 08:31Там не только копии.
Интерпретация и реализация тоже ещё тот цирк.
Абзац можно записать одним куском, а можно посимвольно.
Картинку можно сохранить одним потоком, а можно сотней мелких кусочков. Попутно перекодировав абы как.
Причём ни Микрософт, ни Адобе, ни Автодеск на эту тему не заморачиваются.
А уж авторы мелких утилиток вообще не напрягаются.
ZAZmaster
А почему мега? Можете на github выложить?
zilia
Дело привычки. Я не заявляю на сборку никаких прав и одобряю всяческое распространение. Если Вы разместите архив на GitHub, буду признателен.