PDF (Portable Document Format)

Материал из Национальной библиотеки им. Н. Э. Баумана
Последнее изменение этой страницы: 20:18, 6 июня 2018.
Portable Document Format
 Portable Document Format
Разработчики: Adobe Systems
Выпущена: 1993
Предыдущий выпуск: 2.0
Операционная система: Windows NT, Windows Phone, macOS, Linux, Android, iOS, Apple TV, Tizen, OS/2
Платформа: IA-32, x64, ARM, MIPS, PowerPC
Веб-сайт www.adobe.com/ru/

Portable Document Format (PDF) — межплатформенный формат электронных документов, разработанный фирмой Adobe Systems с использованием ряда возможностей языка PostScript. В первую очередь предназначен для представления полиграфической продукции в электронном виде.[Источник 1]


Общие сведения

Чаще всего PDF-файл является комбинацией текста с растровой и векторной графикой, реже — текста с формами, сценариями на языке JavaScript, 3D-графикой и другими типами элементов.

История

PDF начинался с мечты о безбумажном офисе одного из основателей компании Adobe Джона Уорнока. Первоначально он задумывался как внутренний проект компании по созданию формата файлов для распространения документов, которые могли бы быть прочитаны на любом компьютере под любой операционной системой.

У Adobe уже были две более-менее подобные технологии: PostScript как машинно- и платформо-независимая технология описания документов и Adobe Illustrator как пример приложения, работающего на различных платформах (в действительности на двух: Windows и Mac) и способного открывать и визуализировать простые PostScript-файлы, созданные других приложениях. Инженеры Adobe объединили эти технологии и создали новый формат (PDF, который является оптимизированной версией PostScript) и несколько приложений для создания и визуализации файлов этого формата.[Источник 2]

PDF 1.0

Впервые Adobe сообщила о новой технологии на конференции Сиболд в Сан Хосе в 1991 году. Тогда она называлась "IPS" что расшифровывается как "Interchange PostScript". Версия PDF 1.0 была показана на выставке Comdex Fall в 1992 году. Программа для создания PDF, Acrobat, была выпущена в середине 1993 года. Эта версия не была принята препресс-сообществом. Она уже содержала внутренние связи и закладки, шрифты уже могли внедряться, но цветовое пространство поддерживалось только RGB.

PDF 1.1

Acrobat 2 появился в сентябре 1994 года. Он поддерживал новый формат PDF 1.1 в котором добавилась поддержка для:

  • внешних линков;
  • потоков статей;
  • функций безопасности;
  • машинно-независимого цвета;
  • комментариев.

В Acrobat 2.0 также добавили несколько полезных новшеств, включая новую архитектуру Acrobat Exchange, поддерживающую плагины и возможность поиска в PDF-файлах. Adobe стала одним из крупнейших пользователей PDF. Вся документация компании стала распространяться в этом формате. В Acrobat 2.1 была добавлена мультимедийная поддержка, и с тех пор стало возможным вставлять аудио- и видеоданные в PDF-документы. В 1995 году Adobe начала включать поддержку PDF во многие свои приложения, включая FrameMaker 5.0 и PageMaker 6.

PDF 1.2

В 1996 году Adobe выпустила Acrobat 3.0 (кодовое название: Amber) и соответствующие спецификации PDF 1.2. PDF 1.2 был первой версией PDF, которую реально было использовать в препрессе. Кроме форм, были добавлены следующие препресс-опции:

  • поддержка спецификации OPI 1.3;
  • поддержка цветового пространства CMYK;
  • поддержка спотовых цветов;
  • поддержка параметров растрирования и оверпринта.

Выпуск плагина для просмотра PDF-файлов в браузере Netscape увеличил популярность PDF в растущем Интернете. Adobe также добавила возможность связывать PDF-файлы с HTML-страницами и наоборот. PDF также начал использоваться и в графической индустрии. Первоначально, рынок черно-белой цифровой печати стал использовать PDF для печати на быстрых цифровых машинах Xerox.

Несмотря на то, что PDF активно продвигался на рынок, реакция рынка была замедленной. В основном, это было связано с тем, что для его использования требовались дополнительные программы, а также из-за его ограничений и недоработок. Кроме того, этот формат не являлся открытым стандартом и, несмотря на все его достоинства в препресс-области, слишком легко было сделать PDF-файл, неприменимый в препресс.

PDF/X-1

Чтобы решить вышеописанную проблему, был создан консорциум препресс-компаний, который выпустил стандарт PDF/X-1 в 1998 году. PDF/X-1 основывается на спецификации PDF 1.2, но имеет очень жесткие ограничения. При использовании файлов PDF/X-1 вы можете быть уверены в том, что все шрифты включены, все изображения включены в высоком разрешении и т.д.

Несмотря на то, что PDF/X-1 базируется на PDF 1.2, в него было добавлено несколько дополнительных операторов. Они описаны в документе 5188 компании Adobe и включают:

  • возможность включать дополнительные данные;
  • поддержка ICC-цветов;
  • поддержку параметров bleed, trim и art-box;
  • флаг, показывающий, что документ подвергался треппингу.

PDF 1.3

Acrobat 4, выпущенный в апреле 1999 года, поддерживал PDF 1.3. Новые спецификации PDF включают поддержку для:

  • 2-байтных CID шрифтов;
  • спецификации OPI 2.0;
  • нового цветового пространства, под названием DeviceN, для поддержки спотовых цветов;
  • сглаживания теней, технологии, позволяющей создавать эффектные градиенты (переходы из одного цвета в другой);
  • комментариев

Illustrator 9 и PDF 1.4

В середине 2000 года Adobe сделала сверхъестественный шаг: был выпущен Illustrator 9. При его запуске выяснялась особенность: это было первое приложение, которое поддерживало PDF1.4 и его функции прозрачности. Это был первый раз, когда Adobe не сопроводила выпуск новой версии PDF новой версией пакета Acrobat. Также не были выпущены полные спецификации PDF1.4, хотя документ 5407 компании Adobe декларировал поддержку прозрачности в PDF1.4.

Acrobat 5

В мае 2001 года был выпущен Acrobat 5 и PDF 1.4 окончательно стал реальностью. Для препресса полезные новшества заключались в следующем:

  • появилась поддержка прозрачности, что дало возможность видеть одни объекты сквозь другие;
  • улучшенные функции безопасности, включая 128-битное шифрование и возможность задавать качество печати (например, можно установить печать PDF только с низким разрешением).

Для остальных пользователей также появился ряд полезных нововведений в формате PDF 1.4:

  • Улучшенная поддержка JavaScript, включая JavaScript 1.5 и улучшенная интеграция с базами данных;
  • "Tagged PDFs" - PDF-файлы, содержащие структурированную информацию о данных, содержащихся в файле.

Поздние версии

PDF 1.5 (версия ПО Acrobat 6.0, 2003 год): * JPEG 2000;

  • связанное мультимедиа;
  • объектные потоки;
  • перекрестные потоки, слои.

PDF 1.6 (версия ПО Acrobat 7.0, 2005 год):

PDF 1.7 (версия ПО Acrobat 8.0, 2006 год)

PDF 1.7, AEL3 (версия ПО Acrobat 9.0, 2008 год):

PDF 1.7, AEL5 (версия ПО Acrobat 9.1, 2009 год):

  • XFA 3.0.

PDF 1.7, AEL8 (версия ПО Acrobat X (10), 2011 год)

Средства для чтения PDF-документов

Adobe Reader - это бесплатное программное обеспечение для просмотра, печати, подписания и комментирования документов PDF. Это единственное средство просмотра документов PDF, которое позволяет открывать содержимое PDF всех типов и взаимодействовать с ним, включая заполняемые формы и мультимедиа.[Источник 3]

Foxit Reader - приложение является наиболее успешным конкурентом Adobe Reader, которое позволяет добавлять к документам аннотации, но в то же время не дает возможность редактировать файлы.

Sumatra PDF - программа, поглощающая минимум системных ресурсов. Способна работать в любых операционных системах и отличается наличием портативной версии, которую можно запускать с флешки. Также ей присуща корректная работа во время масштабирования черно-белых изображений.

Cool PDF Reader - программа обусловливается наличием необходимого инструментария для просмотра документов, а также их сохранения и печати. Есть опция, позволяющая конвертировать рассматриваемый формат в PNG, GIF, JPG, TXT и т. д.

Редактирование PDF

Adobe Acrobat — пакет программ, предназначенный для создания и просмотра электронных публикаций в формате PDF. PDF-XChange Viewer — многофункциональная программа для просмотра и редактирования PDF документов. Apache OpenOffice.org Writer — текстовый процессор и визуальный (WYSIWYG) редактор HTML, входит в состав OpenOffice и является свободным программным обеспечением. Writer позволяет сохранять документы в различных форматах, включая Microsoft Word, RTF, XHTML, PDF и OASIS Open Document Format

Библиотеки для работы с PDF

iTextSharp

Библиотека iText позволяет создавать и манипулировать PDF документами. Она предоставляет разработчикам совершенствовать веб и прикладные приложения с помощью динамической генерации и/или манипуляции над PDF документами. Разработчики могут использовать iText для:[Источник 4]

  • передачи PDF в браузер;
  • генерировать динамические документы из XML файлов или базы данных;
  • использовать много интерактивных возможностей PDF;
  • добавлять закладки, число страниц, водяные знаки и т.д.;
  • разделять, объединять и манипулировать PDF страницами;
  • автоматизация заполнения PDF форм;
  • добавлять цифровую подпись в PDF файл.

iText доступен для двух языков: Java и C#.

Report.NET

Report.NET – это мощная библиотека, которая поможет сгенерировать PDF документы в простым и гибким способом. Документ может быть создан с помощью данных, которые были получены из любого ADO.NET data set. Возможности библиотеки:

  • полностью написана на C# для Microsoft .NET framework;
  • очень компактный код (Hello World: 6 строк);
  • поддерживает графические объекты: текст, линии, прямоугольники, изображения jpeg;
  • легкость выравнивания и трансформации графических объектов;
  • ASP.NET может генерировать динамические PDF страницы;
  • XML Documentation (Comment Web Pages).

PDFsharp

PDFsharp — это библиотека на C#, которая создаёт PDF документы. Можно создавать PDF документы, рисовать на экране или отправлять на печать любого принтера. PDFsharp может изменять, объединять и разделять существующие PDF файлы или перемещать страницы из существующих PDF файлов в новые PDF документы. PDFsharp – это библиотека с открытым исходным кодом, которая легко создает PDF документы из любого .NET языка.

SharpPDF

SharpPDF — это C# библиотека, которая может создавать различные объекты в PDF документах за несколько шагов. Она создана для .NET framework 1.1 и может создавать 100% совместимые PDF файлы.

Возможности библиотеки:

  • можно использовать с Windows Forms для генерации новых pdf файлов или сохранить их в базу данных;
  • можно использовать с Web Applications (ASP.NET) для генерации pdf файлов или сразу отправить результат в браузер.

PDFjet Open Source Edition

PDFjet — библиотека с открытым исходным кодом для динамического создания PDF документов из Java и .NET.

ASP.NET FO PDF

FO PDF похожа на ASP.NET Server Controls, написана на C#. Она получает DataTable и несколько других параметров для генерации XSL FO и рендерит DataGrid как PDF отчёт используя NFOP (Apache FOP Port in J#) PDF Formatter.

PDF Clown

PDF Clown – это C# 2.0 библиотека для чтения, обработки и записи файлов PDF с несколькими слоями абстракции, чтобы удовлетворить различные стили программирования: от нижнего уровня (PDF Object Model) до высшего (PDF структуры документа и потокового содержания).

Источники

  1. Документ в формате PDF: что это?//pauk-info. URL: http://pauk-info.ru/dokument-v-formate-pdf-chto-ehto/# (дата обращения: 29.05.2018)
  2. Всё о PDF//mikeudin. URL: http://mikeudin.net/rudtp/pdf.php-id=2.htm (дата обращения: 29.05.2018)
  3. Portable Document Format//wikipedia. Дата обновления: 29.03.2018 URL: https://ru.wikipedia.org/wiki/Portable_Document_Format (дата обращения: 06.06.2018)
  4. Обзор библиотек для работы с PDF//harb [2006 - 2018]. URL: https://habr.com/post/112707/ (дата обращения: 29.05.2018)

Ссылки