7.2. ФОРМАТЫ ФАЙЛОВ

Насколько много существует программных средств, настолько же велико количество применяемых форматов (типов) файлов.

Формат или тип файла показывает, в каком виде хранятся данные в файле, какие операции над ними допустимы, сведения о том, кому и зачем эти данные нужны.

Формат файла используется операционной системой, чтобы связать с эти форматом определенную программу, которая предназначена для работы с файлами заданного формата.

Пользовательские интерфейсы современных ОС предоставляют возможность ассоциировать определенные действия с файлами различных форматов.

Так, например программа Explorer — пользовательская оболочка  Windows — позволяет связать ту или иную программу с файлами, имеющими определенное расширение, например, программу MS Word с файлами, имеющими расширение .DOC. Когда пользователь нажимает левой кнопкой мыши на иконке, представляющей такой файл, то автоматически запускается MS Word. Эти же ассоциации доступны и из командной строки — можно напечатать start Доклад.DOC и опять-таки запустится MS Word.

Такое связывание очень просто в реализации и реализуется не только в Explorer, но и в простых текстовых оболочках вроде Norton Commander. От ОС при этом требуется только дать возможность каким-то образом различать типы файлов.

Первые попытки ассоциировать с файлом признак типа были сделаны еще в 60 гг. При этом идентификатор типа добавлялся к имени файла в виде короткой, но мнемонической последовательности символов — расширения (extension). В большинстве современных ОС расширение отделяется от имени символом ‘.’ (точка). При этом, например, файлы на языке C будут иметь расширение ".c", на C++ ".сpp", а документы в формате Excel — ".xls".

Таким образом, расширения являются вполне приемлемым и очень удобным способом идентификации типа файла. Одно из удобств состоит в том, что для использования этого метода не нужно никаких или почти никаких усилий со стороны ОС: просто программы договариваются интерпретировать имя файла определенным образом.

 Многие ОС, разработанные в 70-е гг., такие как MS DOS, VAX/VMS, CP/M, разделяли название файла на собственно имя и расширение, интерпретируя точку в имени файла как знак препинания. В таких системах имя может содержать только одну точку и соответственно иметь только одно расширение (например command.com). Напротив, в ОС нового поколения (MS Windows 9x/NT/2000/XP) реализована поддержка имен файлов свободного формата, которые могут иметь несколько каскадированных расширений (например my.foto.tiff).

Однако никакие средства операционной системы не могут навязать прикладным программам правил выбора расширения для файлов данных. Это иногда приводит к неприятным коллизиям. Например, почти все текстовые процессоры от Лексикон до Word XP включительно используют расширение файла .doc (сокращение от document), хотя форматы файлов у различных процессоров и даже у разных версий одного процессора сильно различаются. Поэтому в текущий момент к заданному расширению может быть привязана, только одна программа, работающая с данным типом файлов.

Таблица 7.2 Обзор форматов файлов

Название формата

Его назначение

.C, .CPP

Формат файлов, содержащих программу, написанную на языке С или С++.

.SYS

Системный файл, используется операционной системой.

.RTF

Универсальный формат хранения форматируемых текстов.

.TIFF

Расширение TIF (Tag Image Format) является форматом, который широко применяется для устройств сканирования изображения. Позволяет хранить монохромные или цветные изображение в виде битовых карт

.XLS

Табличный файл в формате MS Excel.

.BMP

Расширение BMP – формат, предназначенный для хранения графической информации в виде набора писселей.

.MDB

Расширение базы данных в формате MS Access.

.WMF

Расширение WMF – формат, который применяется для хранения графических изображений в векторном виде

.DOC

Расширение DOC – общепринятый формат для хранения текстов. Используется многими программами обработки текстов (например MS Word).

ТХТ

Расширение ТХТ или DOC – общепринятый формат для хранения текстов. Используется многими программами обработки текстов. Однако внутренняя структура различных файлов с расширением ТХТ несколько различается, поэтому нельзя говорить о полной взаимозаменяемости