Открывает ли файл управляющий элемент open file
Открывает файл для чтения или записи файлового потока.
Синтаксис:
Параметры:
Возвращаемое значение:
Описание:
Функция open() открывает файл для чтения или записи при помощи файлового потока. Если файл не может быть открыт, бросается исключение OSError .
Функция возвращает файловый объект, который имеет методы, позволяющие читать и записывать информацию различными способами.
Аргумент file - это строка, определяющая абсолютное или относительное расположение открываемого файла в файловой системе или целочисленный файловый дескриптор файла. Если задан файловый дескриптор, он закрывается, когда возвращаемый файловый поток закрывается, если для closefd не установлено значение False .
Значения аргумента mode :
- r - открывает файл только для чтения,
- w - открыт для записи (перед записью файл будет очищен),
- x - эксклюзивное создание, бросается исключение FileExistsError , если файл уже существует.
- a - открыт для добавления в конец файла (на некоторых Unix-системах пишет в конец файла вне зависимости от позиции курсора)
- + - символ обновления (чтение + запись).
- t - символ текстового режима.
- b - символ двоичного режима (для операционных систем, которые различают текстовые и двоичные файлы).
Варианты использования режимов:
Аргумент buffering - необязательное целое число, используемое для установки политики буферизации.
- 0 - отключить буферизацию, только для бинарного режима;
- 1 - построчная буферизация, только для текстового режима; число > 1 - размер буфера в байтах.
- -1 - по умолчанию.
У текстовых файлов, если buffering не задан, используется построчная буферизаця. Двоичные файлы буферизируются кусками фиксированного размера. Этот размер определяется эвристикой, пытающейся определить размер блока устройства, на котором находится файл, в случае неудачи использует io.DEFAULT_BUFFER_SIZE . Для многих систем буфер равен 4096 или 8192 байт.
Аргумент encoding - это имя кодировки, используемой для декодирования или кодирования файла. Это аргумент следует использовать только в текстовом режиме. Кодировка по умолчанию зависит от платформы, но может использоваться любая кодировка текста, поддерживаемая Python.
Аргумент error является необязательным и указывает как должны обрабатываться ошибки кодирования и декодирования. Следует использовать только для текстовых файлов.
Доступны стандартные обработчики ошибок:
Это работает следующим образом:
Аргумент closefd по умолчанию True . Если аргумент closefd=False и вместо имени файла был задан его дескриптор, то при закрытии файла функцией open() , базовый дескриптор файла будет оставаться открытым. Если задано имя файла, closefd должно быть True (по умолчанию), иначе возникнет ошибка.
Необязательный аргумент opener (по умолчанию None ), пользовательский объект поддерживающий вызов, который следует использовать для открытия файла. Этот объект получая на входе file и flags , должен возвращать открытый дескриптор файла.
Дополнительно смотрите функцию os.open() , которая открывает файл и возвращает его файловый дескриптор. Вновь созданный дескриптор не наследуется .
В следующем примере используется параметр dir_fd функции os.open() , чтобы открыть файл относительно данного каталога:
Итоговый класс меняется в зависимости от операции:
- в режиме чтения двоичных файлов он возвращает io.BufferedReader ;
- в двоичном режиме записи и в двоичном режиме добавления он возвращает io.BufferedWriter ;
- в режиме чтения/записи - io.BufferedRandom .
Когда отключена буферизация, исходный поток возвращает подклассы io.RawIOBase , io.FileIO .
Примеры чтения из файла и записи в файл.
Чтение и вывод на печать стазу всего файла
Чтение всего файла и вывод на печать построчно
Создадим файл newfile.txt и запишем в него строку. Если файл с таким именем уже существует, то данные внутри файла сотрутся.
Открываем файл на запись с помощью менеджера контекста и пишем данные в конец файла.
Эта статья посвящена работе с файлами (вводу/выводу) в Python: открытие, чтение, запись, закрытие и другие операции.
Файлы Python
Файл — это всего лишь набор данных, сохраненный в виде последовательности битов на компьютере. Информация хранится в куче данных (структура данных) и имеет название «имя файла» (filename).
В Python существует два типа файлов:
Текстовые файлы
Это файлы с человекочитаемым содержимым. В них хранятся последовательности символов, которые понимает человек. Блокнот и другие стандартные редакторы умеют читать и редактировать этот тип файлов.
Текст может храниться в двух форматах: ( .txt ) — простой текст и ( .rtf ) — «формат обогащенного текста».
Бинарные файлы
В бинарных файлах данные отображаются в закодированной форме (с использованием только нулей (0) и единиц (1) вместо простых символов). В большинстве случаев это просто последовательности битов.
Они хранятся в формате .bin .
Любую операцию с файлом можно разбить на три крупных этапа:
- Открытие файла
- Выполнение операции (запись, чтение)
- Закрытие файла
Открытие файла
Метод open()
В Python есть встроенная функция open() . С ее помощью можно открыть любой файл на компьютере. Технически Python создает на его основе объект.
- file_name = имя открываемого файла
- access_mode = режим открытия файла. Он может быть: для чтения, записи и т. д. По умолчанию используется режим чтения ( r ), если другое не указано. Далее полный список режимов открытия файла
Пример
Создадим текстовый файл example.txt и сохраним его в рабочей директории.
Следующий код используется для его открытия.
В этом примере f — переменная-указатель на файл example.txt .
Следующий код используется для вывода содержимого файла и информации о нем.
Стоит обратить внимание, что в Windows стандартной кодировкой является cp1252 , а в Linux — utf-08 .
Закрытие файла
Метод close()
После открытия файла в Python его нужно закрыть. Таким образом освобождаются ресурсы и убирается мусор. Python автоматически закрывает файл, когда объект присваивается другому файлу.
Существуют следующие способы:
Способ №1
Проще всего после открытия файла закрыть его, используя метод close() .
После закрытия этот файл нельзя будет использовать до тех пор, пока заново его не открыть.
Способ №2
Также можно написать try/finally , которое гарантирует, что если после открытия файла операции с ним приводят к исключениям, он закроется автоматически.
Без него программа завершается некорректно.
Вот как сделать это исключение:
Файл нужно открыть до инструкции try , потому что если инструкция open сама по себе вызовет ошибку, то файл не будет открываться для последующего закрытия.
Этот метод гарантирует, что если операции над файлом вызовут исключения, то он закроется до того как программа остановится.
Способ №3
Инструкция with
Еще один подход — использовать инструкцию with , которая упрощает обработку исключений с помощью инкапсуляции начальных операций, а также задач по закрытию и очистке.
В таком случае инструкция close не нужна, потому что with автоматически закроет файл.
Вот как это реализовать в коде.
Чтение и запись файлов в Python
В Python файлы можно читать или записывать информацию в них с помощью соответствующих режимов.
Функция read()
Функция read() используется для чтения содержимого файла после открытия его в режиме чтения ( r ).
Синтаксис
- file = объект файла
- size = количество символов, которые нужно прочитать. Если не указать, то файл прочитается целиком.
Пример
Функция readline()
Функция readline() используется для построчного чтения содержимого файла. Она используется для крупных файлов. С ее помощью можно получать доступ к любой строке в любой момент.
Пример
Создадим файл test.txt с нескольким строками:
Посмотрим, как функция readline() работает в test.txt .
Обратите внимание, как в последнем случае строки отделены друг от друга.
Функция write()
Функция write() используется для записи в файлы Python, открытые в режиме записи.
Если пытаться открыть файл, которого не существует, в этом режиме, тогда будет создан новый.
Синтаксис
Пример
Предположим, файла xyz.txt не существует. Он будет создан при попытке открыть его в режиме чтения.
Переименование файлов в Python
Функция rename()
Функция rename() используется для переименовывания файлов в Python. Для ее использования сперва нужно импортировать модуль os.
- src = файл, который нужно переименовать
- dest = новое имя файла
Пример
Текущая позиция в файлах Python
В Python возможно узнать текущую позицию в файле с помощью функции tell() . Таким же образом можно изменить текущую позицию командой seek() .
В Python при работе с файлами наиболее распространённой функция open() , создающая объект типа файл, который в зависимости от ситуации позволяет читать или записывать данные. Мы используем функцию open() почти всегда с оператором with , согласно официальному справочнику и онлайн руководствам. Основная форма показана ниже.
Запустив код, видим, что файл с именем hello.txt был создан в рабочей директории. Чтобы проверить, что строка Hello World! записана в файл, откроем его:
Мы можем прочитать файл, открыв его с помощью функции open() , задав режим чтения ( r ).
Возможно, многие з н ают, почему для открытия файла здесь мы применяем оператор with . Те, кто не знает, просмотрите сперва следующий код:
В коде выше мы изменили файл, добавив к нему дополнительную строку (заметьте, что для добавления мы используем режим a ). Когда мы закончили с оператором with , то обнаружили, что файл был закрыт, хотя мы не вызывали метод close() явно для файлового объекта. И это в точности то, что делает оператор with — автоматически закрывает файл при выходе.
И что же в этом такого? Рассмотрим следующий тривиальный пример:
Сначала мы изменили файл, добавив некоторые новые данные, но забыли закрыть его после выполнения операции. Когда мы снова читаем файл, мы не видим изменения, которые вроде бы добавили, что может спровоцировать ошибки в коде. Если же мы используем оператор with , каждая операция с файлом очищается Python, автоматически закрывая файл. Что более важно, мы можем производить более сложные операции с файлом, некоторые из которых могут включать исключения, которые остановят работу программы. При таких возможных сценариях у нас всё ещё будет шанс закрыть файл безопасно и автоматически с помощью with .
В более широком смысле оператор with для открытия файла — это пример использования менеджера контекста.
Что такое менеджер контекста? Это объект Python, который выполняет за вас рутинную работу, когда вы используете определённые ресурсы. В частности, менеджер контекста задаёт временный контекст и ликвидирует его после выполнения операций.
Если говорить об операции открытия файла, работу менеджера контекста можно продемонстрировать с помощью операторов try , except и finally . Рассмотрим следующий псевдокод для возможной реализации оператора with :
Менеджер контекста открывает файл и создаёт объект, с которым дальше будет производиться работа. Когда мы завершим операцию и любые исключения, выброшенные в процессе выполнения операции, менеджер контекста закроет файл. Поскольку файлы являются совместно используемыми ресурсами и находятся в вашей ответственности (задачу управления ими помогают решать менеджеры контекста), критически важно, чтобы вы освободили их после того, как выполните операции, чтобы другие процессы получили к ним доступ.
Как мы уже обсудили, оператор with лучше всего применять в ситуациях, когда нам необходимо работать с чем-то коллективно используемым. Один из ярких примеров — работа с данными в многопоточных проектах. Вам наверняка известно, к какому беспорядку приводит ситуация, когда несколько потоков получают доступ к одному и тому же массиву данных: одна операция добавляет данные, в то время как другая читает старые данные в другой файловой операции.
Например, один поток пытается добавить данные в словарь, а другой в то же время пытается выполнять итерирование словаря. Всё слишком быстро выходит из-под контроля. Для решения этой проблемы мы можем использовать блокировку потока, чтобы уменьшить беспорядок в данных. Важно заметить, что, поскольку мы хотим получить полный контроль над ресурсами на временной основе, лучше всего применить оператор with . Взгляните на следующий пример:
Как видим, оператор with может кардинально улучшить осмысленность вашего кода. Что ещё более важно, блокировка снимается автоматически, когда операция завершается с оператором with . Без использования менеджера контекста, то есть оператора with , нам придётся управлять этими ресурсами вручную и очень осторожно. Если мы забудем снять блокировку, наша программа столкнётся с неожиданными проблемами.
Создавать менеджеры контекста можно, чтобы самостоятельно управлять некоторыми ресурсами. Одним из способов создания является реализация методов для протокола менеджера контекста. Можете представить это себе как утиную типизацию — мы просто определим магические методы __enter__ и __exit__ без формального согласования протокола или реализации интерфейса, как это можно сделать и в других языках программирования. Следующий код демонстрирует эту концепцию:
Как показано выше, мы просто определили класс, в котором реализованы методы __enter__ и __exit__ , способные управлять контекстом за нас. С синтаксической точки зрения, мы можем использовать этот класс в операторе with , как в строке 12. Выведенный текст показывает нам порядок, в котором эти операции хорошо координируются. В частности, созданный экземпляр (строка 15) вызовет метод __enter__ (строка 16) для запуска контекста, затем мы сами выполняем операции (строка 17), и, наконец, менеджер контекста выйдет из управления, вызвав метод __exit__ .
Вы обнаружите, что самостоятельная реализация специальных методов __enter__ и __exit__ для создания менеджера контекста может оказаться утомительной. С модулем contextlib в стандартной библиотеке Python намного проще управлять контекстом. Полный обзор этого модуля выходит за рамки данной статьи, я просто расскажу о конкретном методе для создания менеджера контекста. Но сперва давайте немного вернёмся назад, потому что здесь уместно упомянуть декораторы.
Декораторы — это функции, которые изменяют поведение других функций, не затрагивая их ключевые функциональности. Другими словами, декорированная функция выполнит то, что ей и положено, но декоратор придаст ей дополнительные действия. Рассмотрим концепцию декоратора на коротком примере:
Для декораторов вам просто нужно создать функцию, которая принимает другую функцию в качестве входных данных. Декорация — это операция, определённая в функции-декораторе. В данном случае мы просто будем делать записи до и после вызова функции. Чтобы использовать декоратор, напишем имя функции с префиксом @ . Можно сказать, что вызов декорированной функции (строка 15) успешно привёл к дополнительному логированию до и после вызова функции.
Теперь, разобравшись с декораторами, рассмотрим пример использования модуля contextlib , который поможет нам с управлением контекстом в следующем фрагменте кода:
Используем функцию-декоратор contextmanager для декорирования функции context_manager_example . В теле функции вы можете заметить нечто необычное — ключевое слово yield . Вы уже должны были встретиться с этим словом, когда изучали генераторы — итераторы, отображающие элементы, когда их об этом просят (так называемое ленивое вычисление). В этих случаях “ yield ” означает “продукт”.
Однако в нашем случае это слово означает “уступать”. В частности как только менеджер контекста (декорированная функция context_manager_example ) завершает настройку, она уступает выполнение коду с оператором with . После завершения операции контроль возвращается к функции. Важно, что yield в Python специально обрабатывается, поэтому он запускается в том месте, где был запущен. Вот почему функция print , следующая за ключевым словом yield , вызывается только один раз сразу после завершения операций в операторе with .
В этой статье мы рассмотрели концепцию менеджеров контекста на примере операции с файлами, включающей оператор with . Мы усвоили, что именно менеджер контекста помог нам выполнить вспомогательную работу, закрыв файл.
В более широком смысле менеджеры контекста полезны для управления ресурсами конкретной программы или других программ на компьютере, предназначенных для совместного использования. Менеджеры контекста помогают ответственно управлять получением и освобождением этих совместных ресурсов. Мы также рассмотрели, как можно переопределять методы __enter__ и __exit__ для создания собственных классов менеджера контекста. Кроме того, рассмотрели альтернативный метод применения модуля contextlib для создания менеджеров контекста с использованием декораторов.
Однако мы осветили не все вопросы. Например, сигнатура функции метода __exit__ имеет другие параметры, которые мы не реализовали, например, обработку исключений. Полная реализация этих параметров должна оцениваться в индивидуальном порядке.
Иногда недостаточно просто отображать данные на консоли. Данные могут быть очень большими, и только ограниченный объем данных может отображаться на консоли, поскольку память является энергозависимой, невозможно восстановить сгенерированные программой данные снова и снова.
Реализация обработки файлов немного длиннее и сложнее в других языках программирования, но в Python она проще и короче.
В Python файлы обрабатываются в двух режимах как текстовые или двоичные. Файл может быть в текстовом или двоичном формате, и каждая строка файла заканчивается специальным символом. Следовательно, файловая операция может выполняться в следующем порядке:
Открытие файла
Python предоставляет функцию open(), которая принимает два аргумента: имя файла и режим доступа, в котором осуществляется доступ к файлу. Функция возвращает файловый объект, который можно использовать для выполнения различных операций, таких как чтение, запись и т. д.
Доступ к файлам можно получить с помощью различных режимов, таких как чтение, запись или добавление. Ниже приведены подробные сведения о режимах доступа для открытия файла.
Режим доступа | Описание | |
---|---|---|
1 | r | Он открывает файл в режиме только для чтения. Указатель файла существует в начале. Файл по умолчанию открывается в этом режиме, если не передан режим доступа. |
2 | rb | Открывает файл в двоичном формате только для чтения. Указатель файла существует в начале файла. |
3 | г + | Открывает для чтения и записи. Указатель файла также существует в начале. |
4 | rb + | в двоичном формате. Указатель файла присутствует в начале файла. |
5 | w | Только для записи. Он перезаписывает файл, если он существовал ранее, или создает новый, если файл с таким именем не существует. Указатель имеется в начале файла. |
6 | wb | Открывает файл для записи только в двоичном формате. Перезаписывает файл, если он существует ранее, или создает новый, если файл не существует. Указатель файла существует в начале файла. |
7 | w + | Для записи и чтения обоих. Он отличается от r + в том смысле, что он перезаписывает предыдущий файл, если он существует, тогда как r + не перезаписывает ранее записанный файл. Он создает новый файл, если файл не существует. Указатель файла существует в начале файла. |
8 | wb + | Он открывает файл для записи и чтения в двоичном формате. Указатель файла существует в начале файла. |
9 | а | В режиме добавления. Указатель файла существует в конце ранее записанного файла, если он существует. Он создает новый файл, если не существует файла с таким же именем. |
10 | ab | В режиме добавления в двоичном формате. Указатель существует в конце ранее записанного файла. Он создает новый файл в двоичном формате, если не существует файла с таким же именем. |
11 | а + | Он открывает файл для добавления и чтения. Указатель файла остается в конце файла, если файл существует. Он создает новый файл, если не существует файла с таким же именем. |
12 | ab + | Открывает файл для добавления и чтения в двоичном формате. Указатель файла остается в конце файла. |
Давайте посмотрим на простой пример, чтобы открыть файл с именем «file.txt»(хранящийся в том же каталоге) в режиме чтения и распечатать его содержимое на консоли.
В приведенном выше коде мы передали filename в качестве первого аргумента и открыли файл в режиме чтения, поскольку мы упомянули r в качестве второго аргумента. Fileptr содержит объект файла, и если файл открывается успешно, он выполнит оператор печати.
Метод close()
После того, как все операции будут выполнены с файлом, мы должны закрыть его с помощью нашего скрипта Python, используя метод close(). Любая незаписанная информация уничтожается после вызова метода close() для файлового объекта.
Мы можем выполнить любую операцию с файлом извне, используя файловую систему, которая в данный момент открыта в Python; поэтому рекомендуется закрыть файл после выполнения всех операций.
Синтаксис использования метода close() приведен ниже.
Рассмотрим следующий пример.
После закрытия файла мы не можем выполнять какие-либо операции с файлом. Файл необходимо правильно закрыть. Если при выполнении некоторых операций с файлом возникает какое-либо исключение, программа завершается, не закрывая файл.
Мы должны использовать следующий метод, чтобы решить такую проблему.
Оператор with
Оператор with был введен в Python 2.5. Он полезен в случае манипулирования файлами. Используется в сценарии, когда пара операторов должна выполняться с блоком кода между ними.
Синтаксис для открытия файла с помощью оператора приведен ниже.
Преимущество использования оператора with заключается в том, что он обеспечивает гарантию закрытия файла независимо от того, как закрывается вложенный блок.
Всегда рекомендуется использовать оператор with для файлов. Если во вложенном блоке кода возникает прерывание, возврат или исключение, тогда он автоматически закрывает файл, и нам не нужно писать функцию close() . Это не позволяет файлу исказиться.
Рассмотрим следующий пример.
Запись файла
Чтобы записать текст в файл, нам нужно открыть файл с помощью метода open с одним из следующих режимов доступа.
- w: он перезапишет файл, если какой-либо файл существует. Указатель файла находится в начале файла.
- a: добавит существующий файл. Указатель файла находится в конце файла. Он создает новый файл, если файл не существует.
Скриншот файла file2.txt
Мы открыли файл в режиме w. Файл file1.txt не существует, он создал новый файл, и мы записали его содержимое с помощью функции write().
Снимок файла file2.txt
Мы видим, что содержимое файла изменено. Мы открыли файл в режиме и добавили содержимое в существующий файл file2.txt.
Чтобы прочитать файл с помощью сценария Python, Python предоставляет метод read(). Метод read() считывает строку из файла. Он может читать данные как в текстовом, так и в двоичном формате.
Синтаксис метода read() приведен ниже.
Рассмотрим следующий пример.
В приведенном выше коде мы прочитали содержимое file2.txt с помощью функции read(). Мы передали значение счетчика как десять, что означает, что он будет читать первые десять символов из файла.
Если мы используем следующую строку, она распечатает все содержимое файла.
Чтение файл для цикла
Мы можем прочитать файл, используя цикл for. Рассмотрим следующий пример.
Чтение файла построчно
Python упрощает чтение файла построчно с помощью метода readline(). Метод readline() читает строки файла с самого начала, т. е. если мы используем его два раза, мы можем получить первые две строки файла.
Рассмотрим следующий пример, который содержит функцию readline(), которая читает первую строку нашего файла «file2.txt», содержащую три строки.
Пример 1: чтение строк с помощью функции readline()
Мы вызывали функцию readline() два раза, поэтому она считывает две строки из файла.
Python также предоставляет метод readlines(), который используется для чтения строк. Возвращает список строк до конца файла(EOF).
Пример 2: чтение строк с помощью функции readlines()
Создание нового файла
Новый файл можно создать, используя один из следующих режимов доступа с функцией open().
- x: создает новый файл с указанным именем. Вызовет ошибку, если существует файл с таким же именем.
- a: создает новый файл с указанным именем, если такого файла не существует. Он добавляет содержимое к файлу, если файл с указанным именем уже существует.
- w: создает новый файл с указанным именем, если такого файла не существует. Он перезаписывает существующий файл.
Позиции указателя файла
Python предоставляет метод tell(), который используется для печати номера байта, в котором в настоящее время существует указатель файла. Рассмотрим следующий пример.
Изменение позиции указателя файла
В реальных приложениях иногда нам нужно изменить расположение указателя файла извне, поскольку нам может потребоваться прочитать или записать контент в разных местах.
Для этой цели Python предоставляет нам метод seek(), который позволяет нам изменять положение указателя файла извне.
Синтаксис для использования метода seek():
Метод seek() принимает два параметра:
Рассмотрим следующий пример.
Модуль OS Python
Переименование файла
Модуль Python os обеспечивает взаимодействие с операционной системой. Модуль os предоставляет функции, которые участвуют в операциях обработки файлов, таких как переименование, удаление и т. д. Он предоставляет нам метод rename() для переименования указанного файла в новое имя. Синтаксис для использования метода rename() приведен ниже.
Приведенный выше код переименовал текущий file2.txt в file3.txt.
Удаление файла
Модуль os предоставляет метод remove(), который используется для удаления указанного файла. Синтаксис метода remove() приведен ниже.
Создание нового каталога
Метод mkdir() используется для создания каталогов в текущем рабочем каталоге. Синтаксис для создания нового каталога приведен ниже.
Метод getcwd()
Этот метод возвращает текущий рабочий каталог.
Синтаксис для использования метода getcwd() приведен ниже.
Изменение текущего рабочего каталога
Метод chdir() используется для изменения текущего рабочего каталога на указанный каталог.
Синтаксис для использования метода chdir():
Удаление каталога
Метод rmdir() используется для удаления указанного каталога.
Синтаксис использования метода rmdir() приведен ниже.
Он удалит указанный каталог.
Запись вывода Python в файлы
В Python есть требования для записи вывода скрипта Python в файл.
Метод check_call() подпроцесса модуля используется для выполнения сценария Python и записи вывода этого сценария в файл.
Следующий пример содержит два сценария Python. Сценарий file1.py выполняет сценарий file.py и записывает свои выходные данные в текстовый файл output.txt.
Методы, связанные с файлом
Существуют следующие методы для управления файлами в различных операционных системах.
Читайте также: