Назад | Вперед

Тема 9. Сложные варианты структурированных данных в Паскале

Файловый тип данных
Текстовые файлы
Компонентные файлы
Бестиповые файлы
Последовательный и прямой доступ к файлам

Файловый тип данных

Введение файлового типа в язык ПАСКАЛЬ вызвано необходимостью обеспечить возможность работы с периферийными (внешними) устройствами ЭВМ, предназначенными для ввода, вывода и хранения данных.
Файловый тип данных или файл определяет упорядоченную совокупность произвольного числа однотипных компонент.
Общее свойство массива,  множества и записи заключается в том, что количество их компонент определено на этапе написания программы, тогда как  количество компонент файла в тексте программы не определяется и может быть произвольным.
Понятие файла  достаточно  широко.  Это может быть обычный файл на диске, коммуникационный порт ЭВМ,  устройство печати,  клавиатура или другие устройства.
При работе с файлами выполняются операции ввода - вывода. Операция ввода означает   перепись  данных  с внешнего устройства (из входного файла) в  основную память ЭВМ, операция вывода - это пересылка данных из основной памяти на внешнее устройство (в выходной файл).
Файлы на внешних устройствах часто называют  физическими  файлами.
Их имена  определяются  операционной системой.  В программах на языке Паскаль имена файлов задаются с помощью строк. Например, имя файла на диске может иметь вид:
  'A:LAB1.DAT'
  'c:\ABC150\pr.pas'
  'lab3.pas'.
Операционная система  MS-DOS не делает особого различия между файлами на дисках и лентах и устройствами ЭВМ и портами коммуникаций.  В TURBO PASCAL  могут использоваться имена устройств и портов,  определенные в MS-DOS, например:
  'CON',  'LPT1',  'PRN',  'COM1',  'AUX',  'NUL'.
С файловой системой TURBO PASCAL связано понятие  буфера  ввода - вывода. Ввод  и вывод данных осуществляется через буфер. Буфер - это область в памяти,  которая выделяется для каждого файла. При записи в файл вся  информация сначала направляется в буфер и там накапливается до тех пор,  пока весь объем буфера не будет заполнен. Только после этого или после специальной команды сброса происходит передача данных на внешнее устройство. При чтении из файла данные вначале считываются в буфер, причем данных считывается не столько, сколько запрашивается, а сколько поместится в буфер.
Механизм буферизации  позволяет  более быстро и эффективно обмениваться информацией с внешними устройствами.
Для работы  с  файлами  в программе необходимо определить файловую переменную. TURBO  PASCAL поддерживает три файловых типа:   текстовые файлы, компонентные файлы, бестиповые файлы.
Описание файловых переменных текстового типа  производится  с  помощью служебного слова Text, например:
  var tStory: Text;
Описание компонентных файлов имеет вид:
  var fComp: File of T;
где T  -  тип  компоненты файла.
Примеры описания файловой переменной компонентного типа:
type M= array[1..500] of Longint;
var f1: File of Real;
      f2: File of Integer;
      fLi: File of M;
Бестиповые файлы описываются с помощью служебного слова File:
 var f: File;
Файловые переменные,  которые описаны в программе,  называют логическими файлами.  Все основные процедуры и функции,  обеспечивающие ввод - вывод данных,  работают только с логическими файлами. Физический файл должен быть связан с логическим до выполнения процедур открытия файлов.
TURBO PASCAL вводит ряд процедур и функций,  применимых для  любых типов файлов:  Assign,  Reset,  Rewrite,  Close,  Rename, Erase, Eof, IOResult.
Процедура Assign( var  f; FileName: String ) связывает логический файл f с физическим файлом,  полное  имя  которого  задано  в  строке FileName.
Процедура Reset( var f ) открывает логический файл f для последующего чтения данных или,  как говорят,  открывает входной файл.  После успешного выполнения процедуры Reset файл готов к чтению из него первого элемента.
Процедура Rewrite( var f )  открывает логический файл f для последующей записи  данных (открывает выходной файл). После успешного выполнения этой процедуры файл готов к записи в него первого  элемента.
Процедура Close( var  f )  закрывает  открытый до этого логический файл. Вызов процедуры Close необходим при завершении работы с файлом.
Если  по  какой-то  причине  процедура Close не будет выполнена, файл все же  будет создан на внешнем устройстве,  но содержимое последнего буфера в него  не будет перенесено.  Для входных файлов использование оператора закрытия файла необязательно.
Логическая функция EOF( var f ): Boolean возвращает значение TRUE, когда при чтении достигнут конец файла.  Это означает, что уже прочитан последний элемент в файле или файл после открытия оказался пуст.
Процедура Rename( var f; NewName: String ) позволяет переименовать физический файл на диске, связанный с логическим файлом f. Переименование возможно после закрытия файла.
Процедура Erase( var f )  уничтожает физический файл на диске, который был связан с файловой переменной f.  Файл к моменту вызова процедуры Erase должен быть закрыт.
Функция  IOResult: Integer возвращает целое число, соответствующее коду последней ошибки ввода - вывода.  При нормальном завершении операции функция вернет значение 0. Значение функции IOResult необходимо присваивать какой - либо переменной,  так как при каждом вызове функция обнуляет свое значение. Функция IOResult работает только при выключенном режиме проверок ошибок ввода - вывода или с ключом  компиляции {$I-}.


Наверх

Текстовые файлы  

Особое место в языке ПАСКАЛЬ занимают текстовые файлы,  компоненты которых имеют символьный тип.  Для описания текстовых файлов в  языке определен стандартный тип Тext:
  var    TF1, TF2: Text;
Текстовые файлы  представляют  собой  последовательность строк,  а строки - последовательность символов.  Строки имеют переменную длину, каждая строка завершается признаком конца строки.
С признаком конца строки связана функция EOLn(var T:Text):Boolean, где Т - имя  текстового  файла.  Эта функция принимает значение TRUE, если достигнут конец строки, и значение  FALSE, если  конец строки не достигнут.
Для операций над текстовыми файлами,  кроме перечисленных, определены также операторы обращения к процедурам:
  ReadLn(T) - пропускает строку до начала следующей;
  WriteLn(T) -  завершает  строку файла,  в которую производится запись, признаком конца строки и переходит к началу следующей.
Для работы с текстовыми файлами введена расширенная форма операторов ввода и вывода. Оператор

  Read(T,X1,X2,...XK)

эквивалентен группе операторов
begin
  Read(T,X1);
  Read(T,X2);
  ...........
  Read(T,XK)
end;
Здесь Т - текстовый файл, а переменные Х1, Х2,...ХК могут быть либо  переменными  целого, действительного или символьного  типа,  либо строкой. При чтении значений переменных из файла они преобразуются из текстового представления в машинное.
Оператор
Write(T,X1,X2,...XK)
эквивалентен группе операторов
begin
  Write(T,X1);
  Write(T,X2);
  ...........
  Write(T,XK)
end;
Здесь Т  -  также текстовый файл,  но переменные Х1, Х2,...ХК могут быть целого, действительного, символьного, логического типа или строкой. При записи значений переменных в файл они преобразуются из внутреннего представления в текстовый.
К текстовым файлам относятся стандартные файлы INPUT, OUTPUT.
Рассмотренные ранее операторы ввода - вывода являются частным случаем операторов обмена с текстовыми файлами, когда используются стандартные файлы ввода - вывода INPUT, OUTPUT.
Работа с этими файлами имеет особенности:
-имена этих файлов в списках ввода - вывода не указываются;
-применение процедур  Reset,  Rewrite и Close к стандартным файлам ввода - вывода запрещено;
-для работы с файлами INPUT,  OUTPUT введена разновидность функции EOLn без параметров.
TURBO PASCAL вводит дополнительные процедуры и функции, применимые только к текстовым файлам,  это SetTextBuf,  Append, Flush, SeekEOLn, SeekEOF.
Процедура SetTextBuf( var f: Text; var Buf; BufSize: Word ) служит для увеличения  или уменьшения буфера ввода - вывода текстового файла f. Значение  размера буфера для текстовых файлов по  умолчанию  равно 128 байтам.  Увеличение размера буфера сокращает количество обращений к диску.  Рекомендуется изменять разиер буфера до открытия файла. Буфер файла начнется с первого байта переменной Buf.  Размер буфера задается в необязательном параметре BufSize,  а если этот параметр  отсутствует, размер буфера определяется длиной переменной Buf.
Процедура Append( var f:  Text )  служит для специального открытия выходных файлов. Она применима к уже существующим физическим файлам и открывает из для дозаписи в конец файла.
Процедура Flush(  var  f: Text )  применяется  к открытым выходным файлам. Она  принудительно записывает данные из буфера в файл независимо от степени его заполнения.
Функция SeekEOLn( var f: Text ): Boolean возвращает значение True, если до конца строки остались только пробелы.
Функция SeekEOF( var f:  Text ): Boolean возвращает значение True, если до конца файла остались строки, заполненные пробелами.


Наверх

Компонентные файлы

Компонентный или типизированный файл - это файл с объявленным  типом его компонент. Компонентные файлы состоят из машинных представлений значений переменных,  они хранят данные в том же виде,  что и память ЭВМ.
Описание величин файлового типа имеет вид:
type M= File Of T;
где М - имя файлового типа, Т - тип компоненты. Например:
type
  FIO= String[20];
  SPISOK=File of FIO;
var
  STUD, PREP: SPISOK;
Здесь STUD,   PREP  - имена файлов,  компонентами которых являются строки.
Описание файлов можно задавать в разделе описания переменных:
var
  fsimv: File of Char;
  fr: File of Real;
Компонентами файла могут быть все скалярные типы,  а из структурированных - массивы, множества, записи. Практически во всех конкретных реализациях языка ПАСКАЛЬ конструкция "файл файлов" недопустима.
Все операции  над  компонентными  файлами  производятся  с помощью стандартных процедур:
  Reset, Rewrite, Read, Write, Close.
Для ввода - вывода используются процедуры:  Read(f,X) и  Write(f,X);
где f - имя логического файла,  Х - либо переменная,  либо массив, либо строка,  либо множество, либо запись с таким же описанием, какое имеет компонента файла.
Выполнение процедуры  Read(f,X)  состоит в чтении с внешнего устройства одной компоненты файла и запись ее в X. Повторное применение процедуры Read(f,X) обеспечит чтение следующей компоненты файла и запись ее в X.
Выполнение процедуры Write(f,X) состоит в записи X на внешнее устройство как одной компоненты. Повторное применение этой процедуры обеспечит запись X как следующей компоненты файла.
Для работы  с компонентными файлами введена расширенная форма операторов ввода и вывода:  Read(f,X1,X2,...XK)  и Write(f,X1,X2,...XK) .
Здесь f - компонентный файл, а переменные Х1, Х2,...ХК должны иметь тот-же тип, что и объявленный тип компонент файла f.


Наверх

Бестиповые файлы

Бестиповые файлы позволяют записывать на диск произвольные участки памяти ЭВМ и считывать их с диска в память.  Операции обмена с бестиповыми   файлами   осуществляется   с  помощью  процедур  BlockRead  и BlockWrite.
Кроме  того,  вводится расширенная форма процедур Reset и Rewrite. В остальном принципы работы остаются такими же, как и с компонентными файлами.
Перед использованием логический файл
  var  f: File;
должен быть  связан  с  физическим с помощью процедуры Assign.  Далее файл должен быть открыт для чтения или для  записи  процедурой  Reset или Rewrite, а после окончания работы закрыт процедурой Close.
При открытии файла длина буфера устанавливается по умолчанию в 128 байт. TURBO  PASCAL  позволяет изменить размер буфера ввода - вывода, для чего следует открывать файл расширенной записью процедур
  Reset(var f: File; BufSize: Word )
или
  Rewrite(var f: File; BufSize: Word )
Параметр BufSize задает число байтов, считываемых из файла или записываемых в него за одно обращение. Минимальное значение BufSize - 1 байт, максимальное - 64 К байт.
Чтение данных из бестипового файла осуществляется процедурой
  BlockRead( var f: File; var X; Count: Word; var QuantBlock: Word );
Эта процедура осуществляет за одно обращение чтение в переменную X количества блоков,  заданное параметром Count,  при этом длина  блока равна длине  буфера.  Значение Count не может быть меньше 1.  За одно обращение нельзя прочесть больше, чем 64 К байтов.
Необязательный параметр  QuantBlock возвращает число блоков (буферов), прочитанных текущей операцией BlockRead. В случае успешного завершения операции чтения QuantBlock = Count, в случае аварийной ситуации параметр QuantBlock будет  содержать  число  удачно  прочитанных блоков. Отсюда  следует,   что  с  помощью параметра QuantBlock можно контролировать правильность выполнения операции чтения.
Запись данных в бестиповой файл выполняется процедурой
  BlockWrite( var f: File; var X; Count: Word; var QuantBlock: Word );
которая осуществляет  за  одно обращение запись из переменной X количества блоков,  заданное параметром Count, при этом длина блока равна длине буфера.
Необязательный параметр  QuantBlock возвращает число блоков (буферов), записанных успешно текущей операцией BlockWrite.


Наверх

Последовательный и прямой доступ к файлам

Смысл последовательного  доступа  заключается в том, что в каждый момент времени доступна лишь одна компонента из  всей  последовательности. Для  того,  чтобы обратиться (получить доступ)  к компоненте с номером К,  необходимо просмотреть от начала файла К-1 предшествующую компоненту. После обращения к компоненте с номером К можно обращаться к компоненте с номером К+1. Отсюда следует, что процессы формирования (записи) компонент   файла и просмотра (чтения)  не могут произвольно чередоваться. Таким  образом, файл вначале строится при помощи последовательного добавления  компонент в конец,  а затем может последовательно просматриваться от начала до конца.
Рассмотренные ранее  средства работы с файлами обеспечивают последовательный доступ.
TURBO PASCAL  позволяет применять к компонентным и бестиповым файлам, записанным  на диск, способ прямого доступа. Прямой доступ означает возможность   заранее определить в файле блок,  к которому будет применена операция ввода - вывода.  В случае бестиповых  файлов  блок равен размеру буфера,  для компонентных файлов блок - это одна компонента файла.
Прямой доступ  предполагает,  что файл представляет собой линейную последовательность блоков.  Если файл содержит n блоков, то они нумеруются от 1 через 1 до n.  Кроме того, вводится понятие условной границы между блоками, при этом условная граница с номером 0 расположена перед блоком с номером 1,  граница с номером 1 расположена перед блоком с номером 2 и,  наконец,  условная граница с номером n  находится после блока с номером n.
Реализация прямого доступа осуществляется с помощью функций и процедур FileSize, FilePos, Seek и Truncate.
  Функция FileSize( var f ):  Longint возвращает количество блоков в открытом файле f.
  Функция FilePos( var f ):  Longint возвращает  текущую  позицию  в файле f. Позиция в файле - это номер условной границы. Для только что открытого файла текущей позицией будет граница с номером 0.  Это значит, что  можно записать или прочесть блок с номером 1.  После чтения или записи первого блока текущая позиция переместится  на  границу  с номером 1,  и можно будет обращаться к ьлоку с номером 2. После прочтения последней записи значение FilePos равно значению FileSize.
Процедура Seek( var f; N: Longint) обеспечивает назначение текущей позиции в файле (позиционирование).  В параметре N должен быть  задан номер условной границы, предшествующей блоку, к которому будет производиться последующее обращение.  Например, чтобы работать с блоком 4, необходимо задать значение N, равное 3. Процедура Seek работает с открытыми файлами.
Процедура Truncate( var f )  устанавливает в текущей позиции признак конца файла и удаляет (стирает) все последующие блоки.
Пример. Пусть на НМД имеется текстовый файл ID.DAT, который содержит числовые   значения  действительного  типа  по два числа в каждой строке - значения аргумента и функции соответственно.  Количество пар чисел не более 200.  Составить программу, которая читает файл, значения аргумента и функции записывает в одномерные массивы, подсчитывает их количество,    выводит на экран дисплея и записывает в файл компонентного типа RD.DAT.
Program F;
var
   rArg, rF: Array[1..200] of Real;
    inf: Text;
   outf: File of Real;
    n, l: Integer;
begin
  Assign(inf,'ID.DAT');
   Assign(outf,'RD.DAT');
  Reset(inf);
   Rewrite(outf);
  n:=0;
  while not EOF(inf) do
   begin
    n:=n+1;
     ReadLn(inf,rArg[n],rF[n])
  end;
  for l:=1 to n do
  begin
     WriteLn(l:2,rArg[l]:8:2,rF[l]:8:2);
     Write(outf,rArg[l], rF[l]);
   end;
close(outf)
end.


Наверх

Назад | Вперед