Формат файлов

Материал из Национальной библиотеки им. Н. Э. Баумана
Последнее изменение этой страницы: 18:53, 10 января 2019.
Версия от 18:53, 10 января 2019; konstantin kartsev (обсуждение | вклад) (Расширение файлов в Linux)

(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)
Форматы файлов
Ajhvfn afqkjd .jpg


Формат файла -спецификация структуры данных, записанных в компьютерном файле. Идентификатор формата файла, как правило, указывается в конце имени файла в виде «расширения». Расширение имени файла помогает идентифицировать формат данных, содержащихся в файле, программам, которые могут с ним работать. Иногда формат данных дополнительно указывается в начале содержимого файла.

Спецификации

Для многих форматов файлов существуют опубликованные спецификации, в которых подробно описана структура файлов данного формата, то, как программы должны кодировать данные для записи в этот формат и как декодировать их при чтении. Большинство таких спецификаций свободно доступны, некоторые распространяются за плату.

Иногда компании могут считать определённые форматы файлов своей коммерческой тайной и не публиковать их. Хорошо известный пример — форматы файлов пакета Microsoft Office. В некоторых случаях компания, выпустившая приложение, просто не считает нужным тратить время на написание подробной спецификации.

Если спецификация формата недоступна, то для обеспечения совместимости программы с данным форматом приходится заниматься обратной разработкой. В большинстве или во всех странах форматы файлов не защищены законами об авторских правах. Однако в некоторых странах патентами могут быть защищены алгоритмы, используемые для кодирования данных в какой-либо формат. Например, в широко распространённом формате GIF использовался патентованный алгоритм (срок действия патентов в разных странах истек в 2003-2004 гг.), что привело к разработке альтернативного формата PNG.[Источник 1]

Определение типа файла

Тип файла — это информация для быстрой идентификации содержимого файла операционной системой и пользователем без необходимости считывания всего содержимого файла. Благодаря этой информации пользователь приблизительно знает тип содержащейся информации в файле, а в операционной системе может быть сопоставлена программа для обработки файлов данного типа. Для того, чтобы правильно работать с файлами, программы должны иметь возможность определять их тип. По историческим причинам, в разных операционных системах используются разные подходы для решения этой задачи.[Источник 1]

Расширение файла

Расширение файла - это часть имени файла, которое отделяется от основного имени точкой. Прежде всего, по расширению можно понять какое содержимое находится в файле: музыка, видео, изображение, база данных или архив. Например, в файле "filename.txt" расширение ".txt" указывает на то, что это текстовый документ, который можно открыть, например, в блокноте.

Каждый файл создан какой-то программой и для чего-то предназначен. Форматов файлов существует тысячи, но лишь небольшую часть из них удается напрямую открыть какой-либо программой.

На данный момент типов файлов насчитывается более 6500 уникальных расширений файлов и 7500 форматов. На одно расширение может приходиться несколько форматов файлов, т.к. файл одного и того же расширения может содержать различные данные и, соответственно, открываться различными приложениями.

Файл с расширением .doc

Файл DOC - документ Microsoft Word, без сомнения, самой популярной программы для работы с текстами. Word входит в поставку всех версий офисного пакета Microsoft Office.

Файлы формата DOC содержат самую разную информацию о форматировании текста - шрифты, их начертание, выравнивание текста, отступы, абзацы, списки, колонки и т.д.

Документы Microsoft Word также могут включать в себя изображения, диаграммы, таблицы, сценарии. Кроме различных объектов, текста и информации о его форматировании, файл DOC содержит параметры самого документа, печати. [Источник 2]
Doc.jpeg

Начиная с Microsoft Word версии 2007 по умолчанию для новых документов используется формат .DOCX.

Открывается:

  • Microsoft Word
  • Corel WordPerfect X7
  • OpenOffice
  • Kingsoft Writer
  • SoftMaker Office
  • LibreOffice
  • Microsoft WordPad
  • Apple Pages
  • Planamesa NeoOffice

Файл с расширением .docx

Файл DOCX - документ, созданный с помощью Microsoft Word 2007 или более новой версии Office. Формат файла основан на Open XML и использует сжатие по алгоритму ZIP для уменьшения размера файла. Для открытия файла DOCX в Microsoft Office 2000, Office XP и Office 2003, необходимо установить пакет совместимости Microsoft Office Compatibility Pack (FileFormatConverters.exe) с официального сайта Microsoft.[Источник 3]
Docx.jpeg

Открывается:

  • Microsoft Word 2016
  • Средство просмотра Microsoft Word
  • Corel WordPerfect X7
  • OpenOffice
  • ThinkFree Office Write
  • SoftMaker Office
  • Kingsoft Writer
  • LibreOffice
  • Apple Pages
  • Apple Preview
  • Planamesa NeoOffice

Файл с расширением .mov

Файл MOV используется для хранения фильмов и других видеоматериалов. Формат файла и технология сжатия видео разработаны компанией Apple. Совместим как с платформой Mac OS, так и с Windows.

Проигрыватель Windows Media воспроизводит не все версии формата. Для просмотра файлов MOV поздних версий рекомендуется использовать программу Apple QuickTime Player.[Источник 4]
Mov.jpeg

Открывается:

  • Apple QuickTime Player
  • Eltima Elmedia Player
  • Roxio Toast 16 Titanium
  • Roxio Popcorn
  • VideoLAN VLC media player

Файл с расширением .pdf

Файл .PDF - документ, созданный с помощью программы Adobe Acrobat, соответствующего плагина для web-браузера, либо стороннего софта. Формат PDF на сегодняшний день приобрел огромную популярность благодаря тому, что он поддерживается практически всеми устройствами и операционными системами. Поэтому документы этого формата отлично подходят для обмена данными между пользователями.

PDF-документы могут быть открыты с помощью бесплатной версии Adobe Reader или web-плагина, который доступен для большинства интернет-браузеров. В некоторых браузерах, в частности, в Google Chrome обеспечена поддержка этого формата даже без установленного плагина. Редактировать файлы PDF можно с помощью платной версии Adobe Reader. Также, существует огромное количество программ как для открытия и работы с данным форматом, так и для конвертации других документов из/в этот формат.

Файлы PDF могут содержать текст, изображения, формы, аннотации и другие данные. Примечательно то, что отображение документа не зависит от платформы - что в Windows, что, к примеру, в Mac OS, документы будут выглядеть одинаково, также, как и при печати.[Источник 5]

Pdf.png

Открывается:

  • Adobe Reader
  • Google Chrome
  • Sumatra PDF
  • Evince
  • IrfanView
  • LibreOffice
  • Icecream PDF Converter
  • Foxit Reader
  • Adobe Acrobat DC
  • IMSI TurboPDF
  • Corel WordPerfect X7
  • Nuance Power PDF Standard
  • LULU Soda PDF
  • Solid PDF Tools
  • Informative Graphics Brava! Reader

Магические числа

Магические числа Другой способ, широко используемый в UNIX-подобных операционных системах, заключается в том, чтобы сохранить в самом файле некое «магическое число» (сигнатуру) — последовательность символов, по которой может быть опознан формат файла. Первоначально этот термин использовался для специального набора 2-байтовых идентификаторов, сохраняемых в начале файла (эта практика перекочевала и в другие ОС, например, MZ в MS-DOS), однако, любая последовательность символов, характерная для данного формата, может быть использована как «магическое число».

Для определения формата файла служит команда file, которая использует файл /usr/share/misc/magic

 
 $ file /bin/ls
 /bin/ls: ELF 32-bit LSB executable, Intel 80386, version 1 (SYSV), dynamically linked (uses shared libs), for GNU/Linux 2.6.18, stripped
 $ file notes.txt
 notes.txt: UTF-8 Unicode text
 $ file leave_2009-10-12.odt
 leave_2009-10-12.odt: OpenDocument Text##!i##

Строки с так называемыми «шебангами» в файлах скриптов — особая разновидность «магических чисел». Здесь сигнатура — человекочитаемый текст, который определяет программу - интерпретатор скрипта. [Источник 1]

Метаданные

Некоторые файловые системы позволяют сохранять дополнительные атрибуты для каждого файла, то есть «метаданные». Эти метаданные можно использовать для хранения информации о типе файла. Такой подход используется в компьютерах Apple Macintosh. Метаданные поддерживаются такими современными файловыми системами, как HPFS, NTFS, ext2, ext3 и другими. Недостатком этого метода является плохая переносимость — при копировании файлов между файловыми системами разных типов метаданные могут быть потеряны. [Источник 1]

Расширение файлов для Windows

Вид расширения Тип (формат) файла Программа\утилита
.exe Исполняемый файл (программный бинарный файл) Любая рабочая программа Windows, DOS, Symbian, OS/2
.msi Инсталлятор программ (установщик) Пакет программ, требующих установки (MS Office, например)
.doc(docx) Документ Word (Word 2007 и выше) M MS Word, одно из приложений Office
.xls(xlsx) MS Excel, одно из приложений Office
.txt Текстовый файл простого формата (документ) Блокнот
.ppt(pptx) Файл презентаций PowerPoint MS PowerPoint, одно из приложений Office
.accdb База данных Access MS Access, одно из приложений Office
.mp3, .flac, .ape, .ogg, .waw, .ac3, .wma, .m4a, .aac и другие форматы З вуковой (цифровой) файл Любой аудио-плеер (не только Windows) с необходимыми кодеками
.bmp, .jpg(jpeg), .png, .gif, .tiff, .ico, .raw Файл изображения Стандартные менеджеры изображений, иногда специальные программы для конкретного формата (MOPM,ACDC,Stone)
.avi, .wmw, .mkv, .3gp, .flv, .mpeg, .mp4, .mov, .vob Видео файлы Различные плееры, главное условие - установлен необходимый кодек для вывода изображений соответствующего формата
.swf, .flv Флеш или видео файлы в интернете Воспроизводятся любым браузером с установленным flash-проигрывателем
.rar, .zip, .7z, .tar, .gzip, .gz, .jar Архивный контейнер В большинстве случает хватает WinRar и 7-Zip для работы со всеми популярными архивами
.html, .htm, .php Веб-страница Браузеры
.dll Программный модуль Не должен открываться, подключается в виде библиотеки различными компонентами MS Windows при возникновении необходимости
.ini Конфигурационный файл Используется Windows для загрузки настроек различных компонентов, к которым относится конкретный ini-файл
.bat Пакетный файл. Имеет свой синтаксис, может быть создан из обычного тестового файла заменой расширения И спользуется командным интерпретатором (CMD.exe/Command.com) для выполнения заложенных в bat-файл последовательных команд.
.iso, .mds/.mdf, .vdf, .img, .daa, .vcd, .nrg Файл образа диска Различные форматы открываются различными программами. Например, Alcohol, UltraISo, VirtualCD, Nero, Daemon Tools, PowerIso и другими.
.djvu Файл сжатых изображений. Используется для точной передачи информации (сканированные книги, исторические документы) без потери данных. Любая программа для чтения djvu-файлов. WinDJView, DJVUReader и т.д.
.pdf Файл электронного документа, подходит для передачи любой полиграфической продукции и прочего Adobe Reader, Foxit PDF Reader и прочие

[Источник 6]

Расширение файлов MacOS

Файлы приложений .app

Программы, запускаемые под Mac OS X, имеют расширения app. (от слова application). Расширение приложения скрыто от глаз пользователя, и вы видите только название самой программы. А вот программы Windows Mac OS X запускать не может, несмотря на прекрасное понимание файлов данных PC - текст, изображения, музыка. Но в невозможности работать в Windows приложениями есть огромный плюс - злобные вирусы черви и трояны, портящие жизнь почти всем PC-пользователям, совершенно безвредны для Маков.

  • .pkg: файлы с секретом
  • .pkg (от слова Packages) - это дистрибутивы программ. При двойном щелчке запускается программа-инсталятор, которая уставит новое приложение на ваш компьютер. Но секрет состоит в том, что packages - это вовсе и не файл. Это представленная в виде одного файла папка, внутри которой прячутся дистрибутивы программы.

Packages применяется для того, чтобы скрыть от пользователя не нужные ему служебные файлы. Гораздо удобней, когда дистрибутив программы, представляет собой не папку с сотней-другой непонятных файлов, среди которых нужно еще найти выискивать название setup или install, а один единственный файл, имеющий ясное название. Кроме того, файлы из Packages не участвуют в поиске, то есть не замусоривают результаты поиска ничего не говорящими названиями файлов.[Источник 7] Создать свой Package очень просто: сделайте новую папку, поместите туда ваши файлы, после чего переименуйте папку, добавив в конце имени .pkg. Mac OS X уточнит, хотите ли вы изменить расширение (этот вопрос всегда задается при смене расширения), после чего папка преобразуется в единый файл с иконкой в виде раскрытой коробки. Разумеется, для того, чтобы сделать работающий дистрибутив туда должны быть помещены определенные файлы, иначе это будет просто скрытые от глаз пользователя файлы в папке, представленной как один пакет.

'Packages' - это целая технология скрытия файлов, и .pkg не единственный в своем роде. В таком пакете сохраняют проекты, например, iDVD и DVD Studio Pro. Кстати, упомянутый выше тип .app тоже является Packages. Каждая программа - это один единственный файл, а не тысячи файлов, разбросанных по разным каталогам по всему диску, как это происходит в Windows [Источник 7]

Образы диска. Image

Весьма популярное с давних пор на Маках решение - образы диска dmg и img. img применялся в Classic системе, а с появлением Мак OS X применяется более новый формат dmg, хотя и старый также поддерживается. Что такое образ диска - гораздо проще показать, чем рассказать. Дважды щелкните на такой файл мышкой, после чего на вашем рабочем столе (Desktop) появится иконка нового диска, словно вы только что подключили к вашему Маку новый диск. Пользоваться таким виртуальным диском можно так же, как и обычным внешним диском, - просматривать, редактировать и удалять файлы, копировать и перемещать их на свой «настоящий» диск. В основном образы дисков используется для распространения программ через интернет. И здесь нельзя не упомянуть о втором способе установки программ на Маке. Если, заглянув на смонтированный диск, вы не нашли файла инсталляции pkg то, скорее всего, вы видите саму программу. Просто перетащите ее в папку Applications, и все, инсталляция завершена. Для того чтобы создать свой собственный образ диска, воспользуйтесь уже упоминавшийся программой Disk Utility.

Файлы архивов

Для удобства передачи файлов по сети и экономии места на диске при длительном хранении применяются архивы. Архив это файл, внутри которого заключены в специальном сжатом виде другие файлы. Для создания и чтения архивов используются специальные программы - архиваторы и распаковщики. Самым распространенным распаковщиком на маках является бесплатная программа Stuffit Expander. Это крайне полезное приложение, которое открывает почти все известные архивы, кодированные файлы, и образы диска. Самыми популярными архивами на маках являются архивы созданные с помощью программы Stuffit от фирмы Аlladin (не путать со Stuffit Expander - это только бесплатная версия, исключительно для распаковки, а не создания архивов):

  • .sit - наиболее распространенный в среде маков архив,
  • .sitx - относительно недавно появившаяся новая версия формата sit, обеспечивающая лучшее сжатие
  • .sea - самораспаковывающаяся версия архива sit для Classic системы.

Кроме перечисленных Stuffit Expander, прекрасно справляется и другими архивами: rar, zip, а также с юниксовыми форматами, gzip, tar, gz, zip.

Кодированные файлы

Расширения .bin и .hqx. Отмирающая технология, однако, еще можно встретить такие файлы. Эти форматы были специально придуманы для передачи Маковских файлов по интернету и на другие платформы, для решения описанной выше проблемы, когда при пересылке терялась ветвь ресурсов и важная часть файла пропадала. Поэтому, во избежание потерь, использовалось специальное кодирование одного или нескольких файлов. При этом данные, в отличие от архива, не сжимаются, так что размер такого кодированного файла, может быть даже больше, чем суммарный объем содержимого. Для распаковки можно использовать опять же Stuffit Expander.[Источник 7]

Текстовые файлы

На iMac используются те же форматы текстовых документов, что и на PC.

  • .txt - простой текстовый файл
  • .rtf - форматированный текст.

Если у вас установлен MS Office for Maс, вы можете работать с файлами .doc. Впрочем, существуют и альтернативные текстовые процессоры для Мака, пришедшие из миров Unix и Linux, позволяющие работать с файлами doc. .pages - файл созданный в программе Pages из нового пакета Apple iWork.

PDF

  • .pdf. Формат PDF и работа с ним заслуживают отдельной статьи, поэтому кратко. Для работы с файлами в формате pdf на РС обычно используют Adobe Acrobat, но для Мак OS X это внутренний, “родной” формат для системы. В этом формате она хранит большинство служебной информации и графики. Просматривать такой файл можно при помощи встроенной программы Preview, а создавать свои pdf в Мак OS X вы можете из любой программы, у которой есть функция печати.[Источник 7]

Расширение файлов в Linux

Файлы в Linux могут иметь расширения, которых вы ранее не встречали, могут иметь не одно расширение, или не иметь его вовсе. Имена файлов могут начинаться с символа «.», а также могут включать другие символы, в том числе пробелы.

Сжатые и архивные файлы

  • .bz2 — файл, сжатый при помощи bzip2
  • .gz — файл, сжатый при помощи gzip
  • .tar — файл, заархивированный при помощи tar (сокращение от tape archive), также известный как tar файл
  • .tbz — файл, заархивированный tar и сжатый bzip
  • .tgz — файл, заархивированный tar и сжатый gzip
  • .zip — файл, сжатый при помощи алгоритма сжатия ZIP, обычно используемого приложениями MS-DOS. Для Linux более привычен алгоритм сжатия gzip, так что архивы .zip в Linux достаточно редки[Источник 8]

Форматы файлов

  • .au — аудиофайл
  • .gif — изображение формата GIF
  • .html/.htm — HTML-файл
  • .jpg — изображение формата JPEG
  • .pdf — документ в электронном виде; PDF расшифровывается как Portable Document Format (формат переносимых документов)
  • .png — изображение формата PNG (сокращение от Portable Network Graphic — переносимая сетевая графика)
  • .ps — файл PostScript; формат для печати
  • .txt — обычный текстовый файл ASCII
  • .wav — аудиофайл
  • .xpm — файл изображения

Системные файлы

  • .lonf — конфигурационный файл. Конфигурационные файлы часто имеют также расширение .cfg
  • .lock — файл блокировки; отмечает программу или устройство как уже используемое
  • .rpm — файл менеджера пакетов Red Hat Package Manager, используемый для установки программного обеспечения

Файлы программ и скриптов

  • .c — файл с исходным текстом программы, написанной на языке С
  • .cpp — файл с исходным текстом программы, написанной на языке C++
  • .h — заголовочный (так называемый header) файл для программы, написанной на языке C или C++
  • .o — объектный файл
  • .pl — Perl-скрипт
  • .py — Python-скрипт
  • .so — файл библиотеки
  • .sh — shell-скрипт
  • .tcl — TCL-скрипт[Источник 8]

Определение типа файла

Расширения файлов используются не всегда и часто используются неверно. Что делать, если файл не имеет расширения или оно не соответствует типу файла?

В этом случае может быть полезна команда file.

Например, вам попался файл с названием example без расширения. Используя команду file, вы сможете увидеть тип файла:


file example 
example: ASCII text
Из этого примера видно, что файл example является текстовым. Любой файл, распознанный как текстовый, может быть прочитан при помощи команд cat, more или	less или открыт при помощи текстовых редакторов, например, gedit или vi.
##!i##

Скрытые файлы Файлы, название которых начинается с точки, называются скрытыми файлами или «dot» файлами. Увидеть такие файлы можно и с помощью графического файлового менеджера, такого как Наутилус, и из оболочки командной строки. В Наутилусе выберите Вид (View)->Показывать скрытые файлы (Show Hidden Files). В командной строке воспользуйтесь для просмотра содержимого каталога командой ls -al. Просматривая скрытые файлы в своем домашнем каталоге, вы можете удивиться их количеству. Эти скрытые файлы обычно бывают конфигурационными файлами приложений. Их прячут, чтобы предотвратить их случайное изменение и не загромождать окно просмотра домашнего каталога.

Пробелы в именах файлов Хотя имена файлов в Linux и могут содержать пробелы, управление такими файлами из командной строки может вызвать некоторые затруднения. Командная строка воспринимает пробел как разделитель между именами файлов или командами и может неверно истолковать такие имена. При совершении действий над файлами, содержащими в имени пробелы, такие имена файлов заключаются в кавычки.[Источник 8]

Символы в именах файлов

Имена файлов могут содержать знаки пунктуации. Однако имейте в виду, что эти специальные знаки имеют в командной строке специальное назначение и их использование может вызвать ошибку. Обычно рекомендуется не использовать в именах файлов специальные символы. Если вы все же решили включить в имя файла какой-то специальный символ, при совершении действий над таким файлом необходимо заключить его имя в кавычки.

Существуют специальные символы, которые не могут входить в имя файла. Например, нельзя включить в имя файла символ «/», потому что так обозначается каталог. Нельзя назвать файл «.», поскольку так обозначается текущий каталог, или «..», поскольку так обозначается каталог, расположенный на уровень выше текущего.

Файлы с несколькими расширениями Имена файлов могут иметь несколько расширений. Знак «.» может находиться в середине имени файла и не являться границей между собственно именем и расширением, или же файл действительно может иметь не одно расширение. Несколько расширений может появиться в результате применения к файлу нескольких программ или команд. Чаще всего это происходит при сжатии файлов.[Источник 8]

Источники

  1. 1,0 1,1 1,2 1,3 Формат файлов//Wikipedia. [2018-2018]. URL:https://ru.wikipedia.org/wiki/Формат_файла (дата обращения: 21.12.2018).
  2. Файл с расширением DOC //Open-file.ru. [2018-2018]. URL:https://open-file.ru/types/doc (дата обращения: 21.12.2018).
  3. Файл с расширением DOCX //Open-file.ru. [2018-2018]. URL:https://open-file.ru/types/docx (дата обращения: 21.12.2018).
  4. Файл с расширением MOV //Open-file.ru. [2018-2018]. URL:https://open-file.ru/types/mov (дата обращения: 21.12.2018).
  5. Файл с расширением PDF //Open-file.ru. [2018-2018]. URL:https://open-file.ru/types/pdf (дата обращения: 21.12.2018).
  6. Файловая система и форматы файлов Windows // Ne-zalko.ru [2018-2018]. URL: http://ne-zhalko.ru/vse-o-windows/rasshirenie-fayla-tip-fayla.php (дата обращения: 09.01.2018).
  7. 7,0 7,1 7,2 7,3 Файловая система и форматы файлов MacOS //Мак Центр. [2018-2018]. URL: http://maccentre.ru/lib/2170/2.php (дата обращения: 09.01.2018).
  8. 8,0 8,1 8,2 8,3 Файловая система и форматы файлов Linux //Linux-ink.. [2018-2018]. URL: http://www.linux-ink.ru/static/SL.4.x_Docs/Russification/Docs/sbs-sl-ru/s1-managing-files.html (дата обращения: 09.01.2018).