Формат файла data python
Иногда недостаточно просто отображать данные на консоли. Данные могут быть очень большими, и только ограниченный объем данных может отображаться на консоли, поскольку память является энергозависимой, невозможно восстановить сгенерированные программой данные снова и снова.
Реализация обработки файлов немного длиннее и сложнее в других языках программирования, но в Python она проще и короче.
В Python файлы обрабатываются в двух режимах как текстовые или двоичные. Файл может быть в текстовом или двоичном формате, и каждая строка файла заканчивается специальным символом. Следовательно, файловая операция может выполняться в следующем порядке:
Открытие файла
Python предоставляет функцию open(), которая принимает два аргумента: имя файла и режим доступа, в котором осуществляется доступ к файлу. Функция возвращает файловый объект, который можно использовать для выполнения различных операций, таких как чтение, запись и т. д.
Доступ к файлам можно получить с помощью различных режимов, таких как чтение, запись или добавление. Ниже приведены подробные сведения о режимах доступа для открытия файла.
Режим доступа | Описание | |
---|---|---|
1 | r | Он открывает файл в режиме только для чтения. Указатель файла существует в начале. Файл по умолчанию открывается в этом режиме, если не передан режим доступа. |
2 | rb | Открывает файл в двоичном формате только для чтения. Указатель файла существует в начале файла. |
3 | г + | Открывает для чтения и записи. Указатель файла также существует в начале. |
4 | rb + | в двоичном формате. Указатель файла присутствует в начале файла. |
5 | w | Только для записи. Он перезаписывает файл, если он существовал ранее, или создает новый, если файл с таким именем не существует. Указатель имеется в начале файла. |
6 | wb | Открывает файл для записи только в двоичном формате. Перезаписывает файл, если он существует ранее, или создает новый, если файл не существует. Указатель файла существует в начале файла. |
7 | w + | Для записи и чтения обоих. Он отличается от r + в том смысле, что он перезаписывает предыдущий файл, если он существует, тогда как r + не перезаписывает ранее записанный файл. Он создает новый файл, если файл не существует. Указатель файла существует в начале файла. |
8 | wb + | Он открывает файл для записи и чтения в двоичном формате. Указатель файла существует в начале файла. |
9 | а | В режиме добавления. Указатель файла существует в конце ранее записанного файла, если он существует. Он создает новый файл, если не существует файла с таким же именем. |
10 | ab | В режиме добавления в двоичном формате. Указатель существует в конце ранее записанного файла. Он создает новый файл в двоичном формате, если не существует файла с таким же именем. |
11 | а + | Он открывает файл для добавления и чтения. Указатель файла остается в конце файла, если файл существует. Он создает новый файл, если не существует файла с таким же именем. |
12 | ab + | Открывает файл для добавления и чтения в двоичном формате. Указатель файла остается в конце файла. |
Давайте посмотрим на простой пример, чтобы открыть файл с именем «file.txt»(хранящийся в том же каталоге) в режиме чтения и распечатать его содержимое на консоли.
В приведенном выше коде мы передали filename в качестве первого аргумента и открыли файл в режиме чтения, поскольку мы упомянули r в качестве второго аргумента. Fileptr содержит объект файла, и если файл открывается успешно, он выполнит оператор печати.
Метод close()
После того, как все операции будут выполнены с файлом, мы должны закрыть его с помощью нашего скрипта Python, используя метод close(). Любая незаписанная информация уничтожается после вызова метода close() для файлового объекта.
Мы можем выполнить любую операцию с файлом извне, используя файловую систему, которая в данный момент открыта в Python; поэтому рекомендуется закрыть файл после выполнения всех операций.
Синтаксис использования метода close() приведен ниже.
Рассмотрим следующий пример.
После закрытия файла мы не можем выполнять какие-либо операции с файлом. Файл необходимо правильно закрыть. Если при выполнении некоторых операций с файлом возникает какое-либо исключение, программа завершается, не закрывая файл.
Мы должны использовать следующий метод, чтобы решить такую проблему.
Оператор with
Оператор with был введен в Python 2.5. Он полезен в случае манипулирования файлами. Используется в сценарии, когда пара операторов должна выполняться с блоком кода между ними.
Синтаксис для открытия файла с помощью оператора приведен ниже.
Преимущество использования оператора with заключается в том, что он обеспечивает гарантию закрытия файла независимо от того, как закрывается вложенный блок.
Всегда рекомендуется использовать оператор with для файлов. Если во вложенном блоке кода возникает прерывание, возврат или исключение, тогда он автоматически закрывает файл, и нам не нужно писать функцию close() . Это не позволяет файлу исказиться.
Рассмотрим следующий пример.
Запись файла
Чтобы записать текст в файл, нам нужно открыть файл с помощью метода open с одним из следующих режимов доступа.
- w: он перезапишет файл, если какой-либо файл существует. Указатель файла находится в начале файла.
- a: добавит существующий файл. Указатель файла находится в конце файла. Он создает новый файл, если файл не существует.
Скриншот файла file2.txt
Мы открыли файл в режиме w. Файл file1.txt не существует, он создал новый файл, и мы записали его содержимое с помощью функции write().
Снимок файла file2.txt
Мы видим, что содержимое файла изменено. Мы открыли файл в режиме и добавили содержимое в существующий файл file2.txt.
Чтобы прочитать файл с помощью сценария Python, Python предоставляет метод read(). Метод read() считывает строку из файла. Он может читать данные как в текстовом, так и в двоичном формате.
Синтаксис метода read() приведен ниже.
Рассмотрим следующий пример.
В приведенном выше коде мы прочитали содержимое file2.txt с помощью функции read(). Мы передали значение счетчика как десять, что означает, что он будет читать первые десять символов из файла.
Если мы используем следующую строку, она распечатает все содержимое файла.
Чтение файл для цикла
Мы можем прочитать файл, используя цикл for. Рассмотрим следующий пример.
Чтение файла построчно
Python упрощает чтение файла построчно с помощью метода readline(). Метод readline() читает строки файла с самого начала, т. е. если мы используем его два раза, мы можем получить первые две строки файла.
Рассмотрим следующий пример, который содержит функцию readline(), которая читает первую строку нашего файла «file2.txt», содержащую три строки.
Пример 1: чтение строк с помощью функции readline()
Мы вызывали функцию readline() два раза, поэтому она считывает две строки из файла.
Python также предоставляет метод readlines(), который используется для чтения строк. Возвращает список строк до конца файла(EOF).
Пример 2: чтение строк с помощью функции readlines()
Создание нового файла
Новый файл можно создать, используя один из следующих режимов доступа с функцией open().
- x: создает новый файл с указанным именем. Вызовет ошибку, если существует файл с таким же именем.
- a: создает новый файл с указанным именем, если такого файла не существует. Он добавляет содержимое к файлу, если файл с указанным именем уже существует.
- w: создает новый файл с указанным именем, если такого файла не существует. Он перезаписывает существующий файл.
Позиции указателя файла
Python предоставляет метод tell(), который используется для печати номера байта, в котором в настоящее время существует указатель файла. Рассмотрим следующий пример.
Изменение позиции указателя файла
В реальных приложениях иногда нам нужно изменить расположение указателя файла извне, поскольку нам может потребоваться прочитать или записать контент в разных местах.
Для этой цели Python предоставляет нам метод seek(), который позволяет нам изменять положение указателя файла извне.
Синтаксис для использования метода seek():
Метод seek() принимает два параметра:
Рассмотрим следующий пример.
Модуль OS Python
Переименование файла
Модуль Python os обеспечивает взаимодействие с операционной системой. Модуль os предоставляет функции, которые участвуют в операциях обработки файлов, таких как переименование, удаление и т. д. Он предоставляет нам метод rename() для переименования указанного файла в новое имя. Синтаксис для использования метода rename() приведен ниже.
Приведенный выше код переименовал текущий file2.txt в file3.txt.
Удаление файла
Модуль os предоставляет метод remove(), который используется для удаления указанного файла. Синтаксис метода remove() приведен ниже.
Создание нового каталога
Метод mkdir() используется для создания каталогов в текущем рабочем каталоге. Синтаксис для создания нового каталога приведен ниже.
Метод getcwd()
Этот метод возвращает текущий рабочий каталог.
Синтаксис для использования метода getcwd() приведен ниже.
Изменение текущего рабочего каталога
Метод chdir() используется для изменения текущего рабочего каталога на указанный каталог.
Синтаксис для использования метода chdir():
Удаление каталога
Метод rmdir() используется для удаления указанного каталога.
Синтаксис использования метода rmdir() приведен ниже.
Он удалит указанный каталог.
Запись вывода Python в файлы
В Python есть требования для записи вывода скрипта Python в файл.
Метод check_call() подпроцесса модуля используется для выполнения сценария Python и записи вывода этого сценария в файл.
Следующий пример содержит два сценария Python. Сценарий file1.py выполняет сценарий file.py и записывает свои выходные данные в текстовый файл output.txt.
Методы, связанные с файлом
Существуют следующие методы для управления файлами в различных операционных системах.
Эта статья посвящена работе с файлами (вводу/выводу) в Python: открытие, чтение, запись, закрытие и другие операции.
Файлы Python
Файл — это всего лишь набор данных, сохраненный в виде последовательности битов на компьютере. Информация хранится в куче данных (структура данных) и имеет название «имя файла» (filename).
В Python существует два типа файлов:
Текстовые файлы
Это файлы с человекочитаемым содержимым. В них хранятся последовательности символов, которые понимает человек. Блокнот и другие стандартные редакторы умеют читать и редактировать этот тип файлов.
Текст может храниться в двух форматах: ( .txt ) — простой текст и ( .rtf ) — «формат обогащенного текста».
Бинарные файлы
В бинарных файлах данные отображаются в закодированной форме (с использованием только нулей (0) и единиц (1) вместо простых символов). В большинстве случаев это просто последовательности битов.
Они хранятся в формате .bin .
Любую операцию с файлом можно разбить на три крупных этапа:
- Открытие файла
- Выполнение операции (запись, чтение)
- Закрытие файла
Открытие файла
Метод open()
В Python есть встроенная функция open() . С ее помощью можно открыть любой файл на компьютере. Технически Python создает на его основе объект.
- file_name = имя открываемого файла
- access_mode = режим открытия файла. Он может быть: для чтения, записи и т. д. По умолчанию используется режим чтения ( r ), если другое не указано. Далее полный список режимов открытия файла
Пример
Создадим текстовый файл example.txt и сохраним его в рабочей директории.
Следующий код используется для его открытия.
В этом примере f — переменная-указатель на файл example.txt .
Следующий код используется для вывода содержимого файла и информации о нем.
Стоит обратить внимание, что в Windows стандартной кодировкой является cp1252 , а в Linux — utf-08 .
Закрытие файла
Метод close()
После открытия файла в Python его нужно закрыть. Таким образом освобождаются ресурсы и убирается мусор. Python автоматически закрывает файл, когда объект присваивается другому файлу.
Существуют следующие способы:
Способ №1
Проще всего после открытия файла закрыть его, используя метод close() .
После закрытия этот файл нельзя будет использовать до тех пор, пока заново его не открыть.
Способ №2
Также можно написать try/finally , которое гарантирует, что если после открытия файла операции с ним приводят к исключениям, он закроется автоматически.
Без него программа завершается некорректно.
Вот как сделать это исключение:
Файл нужно открыть до инструкции try , потому что если инструкция open сама по себе вызовет ошибку, то файл не будет открываться для последующего закрытия.
Этот метод гарантирует, что если операции над файлом вызовут исключения, то он закроется до того как программа остановится.
Способ №3
Инструкция with
Еще один подход — использовать инструкцию with , которая упрощает обработку исключений с помощью инкапсуляции начальных операций, а также задач по закрытию и очистке.
В таком случае инструкция close не нужна, потому что with автоматически закроет файл.
Вот как это реализовать в коде.
Чтение и запись файлов в Python
В Python файлы можно читать или записывать информацию в них с помощью соответствующих режимов.
Функция read()
Функция read() используется для чтения содержимого файла после открытия его в режиме чтения ( r ).
Синтаксис
- file = объект файла
- size = количество символов, которые нужно прочитать. Если не указать, то файл прочитается целиком.
Пример
Функция readline()
Функция readline() используется для построчного чтения содержимого файла. Она используется для крупных файлов. С ее помощью можно получать доступ к любой строке в любой момент.
Пример
Создадим файл test.txt с нескольким строками:
Посмотрим, как функция readline() работает в test.txt .
Обратите внимание, как в последнем случае строки отделены друг от друга.
Функция write()
Функция write() используется для записи в файлы Python, открытые в режиме записи.
Если пытаться открыть файл, которого не существует, в этом режиме, тогда будет создан новый.
Синтаксис
Пример
Предположим, файла xyz.txt не существует. Он будет создан при попытке открыть его в режиме чтения.
Переименование файлов в Python
Функция rename()
Функция rename() используется для переименовывания файлов в Python. Для ее использования сперва нужно импортировать модуль os.
- src = файл, который нужно переименовать
- dest = новое имя файла
Пример
Текущая позиция в файлах Python
В Python возможно узнать текущую позицию в файле с помощью функции tell() . Таким же образом можно изменить текущую позицию командой seek() .
Если бы вы были частью индустрии данных, вы бы знали, как работать с разными типами данных. Разные форматы, разное сжатие, разный синтаксический анализ в разных системах - вы можете быстро потерять голову! И я еще не говорил о неструктурированных данных или полуструктурированных данных.
Для любого исследователя данных работа с различными форматами может стать утомительной задачей. В реальном мире люди редко получают аккуратные табличные данные. Таким образом, любой специалист по данным должен знать о различных форматах файлов, общих проблемах с ними и о наилучших/эффективных способах обработки этих данных в реальной жизни.
В этой статье представлены распространенные форматы, о которых должен знать специалист по данным. Сначала я познакомлю вас с различными распространенными форматами файлов, используемыми в отрасли. Позже мы увидим, как читать эти форматы файлов в Python.
Формат файла - это стандартный способ кодирования информации для хранения в файле. Во-первых, формат файла указывает, является ли файл двоичным или ASCII-файлом. Во-вторых, он показывает, как организована информация. Например, формат файла для значений с разделителями-запятыми (CSV) хранит табличные данные в виде простого текста.
2. Почему специалист по данным должен понимать различные форматы файлов?
Обычно файлы, с которыми вы столкнетесь, будут зависеть от приложения, которое вы создаете. Например, в системе обработки изображений вам нужны файлы изображений для ввода и вывода. Таким образом, вы в основном увидите файлы в формате jpeg, gif или png.
Как специалист по обработке данных, вы должны понимать основную структуру различных форматов файлов, их преимущества и недостатки. Если вы не понимаете основную структуру данных, вы не сможете их изучать. Кроме того, иногда вам необходимо принимать решения о том, как хранить данные.
Выбор оптимального формата файла для хранения данных может повысить производительность ваших моделей при обработке данных.
Теперь мы рассмотрим следующие форматы файлов и способы их чтения в Python:
3. Различные форматы файлов и как их читать в Python
Формат файла значений, разделенных запятыми, подпадает под формат файла электронной таблицы.
В файле формата электронной таблицы данные хранятся в ячейках. Ячейки организованы в строки и столбцы. Столбец в файле электронной таблицы может иметь разные типы. Например, столбец может иметь строковый тип, тип даты или целочисленный тип. Некоторые из наиболее популярных форматов файлов электронных таблиц: Comma Separated Values (CSV), Microsoft Excel Spreadsheet (xls) и Microsoft Excel Open XML Spreadsheet (xlsx).
Каждая строка в файле CSV представляет собой наблюдение и обычно называется записью. Каждая запись может содержать одно или несколько полей, разделенных запятой.
Иногда вы можете встретить файлы, в которых поля разделены не запятой, а табуляцией. Этот формат файла известен как TSV (Tab Separated Values).
На рисунке ниже показан файл CSV, который открыт в блокноте.
Приведенный выше код загрузит файл train.csv в DataFrame df.
XLSX - это формат файла Microsoft Excel Open XML. Это формат файла на основе XML, созданный для Microsoft Excel. Формат XLSX был представлен в Microsoft Office 2007.
В XLSX данные организованы в ячейки и столбцы на листе. Каждый файл XLSX может содержать один или несколько листов. Таким образом, рабочая тетрадь может содержать несколько листов.
Давайте загрузим данные из файла XLSX и определим имя листа. Для загрузки данных в Python вы можете использовать библиотеку Pandas.
В формате архива вы создаете файл, который содержит несколько файлов вместе с метаданными. Архивы используются для сбора нескольких файлов данных в один файл. Они применяются для сжатия файлов, чтобы использовать меньше места для хранения.
Существует много популярных компьютерных форматов для создания архивных файлов. Zip, RAR и Tar являются наиболее популярными форматами архивных файлов для сжатия данных.
Таким образом, формат файла ZIP представляет собой формат сжатия без потерь, что означает, что если вы сжимаете несколько файлов с использованием формата ZIP, вы можете полностью восстановить данные после распаковки файла. Формат ZIP использует много алгоритмов сжатия. Вы можете легко определить ZIP-файл по расширению .zip.
Здесь я рассмотрел только один из известных форматов архивов и как открыть его в python. Я не упоминаю другие форматы архивов. Если вы хотите прочитать о различных форматах архивов и их сравнениях, вы можете обратиться к этой ссылке.
В формате Plain Text все записывается в виде простого текста. Обычно этот текст находится в неструктурированной форме, и с ним не связано никаких метаданных. Формат файла TXT может быть легко прочитан любой программой. Но интерпретировать его с помощью компьютерной программы очень сложно.
Давайте рассмотрим простой пример текстового файла.
В следующем примере показаны данные из текстового файла:
Предположим, что приведенный выше текст записан в файле с именем text.txt, и вы хотите прочитать его, это можно сделать следующим образом:
JavaScript Object Notation (JSON) - это открытый текстовый стандарт, разработанный для обмена данными через интернет. Формат JSON используется для передачи структурированных данных через интернет. Формат файла JSON легко читается на любом языке программирования, поскольку он не зависит от языка.
В следующем примере показано, как в типичном файле JSON хранится информация о сотрудниках.
Давайте загрузим данные из файла JSON. Для загрузки данных вы можете использовать библиотеку pandas.
XML также известен как Extensible Markup Language. Как следует из названия, это язык разметки. У него есть определенные правила для кодирования данных. Формат XML является читаемым человеком и машиночитаемым форматом файла. XML - это информативный язык, предназначенный для отправки информации через интернет. XML очень похож на HTML, но имеет некоторые отличия. Например, XML не использует предопределенные теги, как HTML.
Давайте рассмотрим простой пример формата XML-файла.
В следующем примере показан документ XML, который содержит информацию о сотруднике.
Для чтения данных из XML-файла вы можете импортировать библиотеку xml.etree. ElementTree.
Давайте импортируем XML-файл с именем train и напечатаем его корневой тег.
HTML расшифровывается как Hyper Text Markup Language. Это стандартный язык разметки, который используется для создания веб-страниц. HTML используется для описания структуры веб-страниц с использованием разметки. HTML-теги такие же, как XML, но они предопределены. Вы можете легко определить подраздел документа HTML на основе таких тегов, как , представляющих заголовок документа. HTML не чувствителен к регистру.
Каждый тег в HTML заключен в угловую скобку (<>). Тег <! DOCTYPE html> определяет, что документ находится в формате HTML. <html> является корневым тегом этого документа. Элемент <head> содержит заголовочную часть документа. <Title>, <body>, <h1>, <p> представляют соответственно заголовок, тело, заголовок и абзац в документе HTML.
Для чтения HTML-файла вы можете использовать библиотеку BeautifulSoup. Пожалуйста, обратитесь к этому руководству, которое поможет вам разобраться в HTML-документах:
Файлы изображений, вероятно, самый захватывающий формат файлов, используемый в науке о данных. Любое приложение для компьютерного зрения основано на обработке изображений. Поэтому необходимо знать различные форматы файлов изображений.
Обычные файлы изображений являются трехмерными и содержат значения RGB. Но они также могут быть 2-мерными (в оттенках серого) или 4-мерными (включающими интенсивность) - изображениями, состоящими из пикселей и связанных с ним метаданных.
Каждое изображение состоит из одного или нескольких фреймов пикселей. И каждый фрейм состоит из двумерного массива значений пикселей. Пиксельные значения могут быть любой интенсивности. Метаданные, связанные с изображением, могут быть типом изображения (.jpg) или размерами в пикселях.
Теперь давайте проверим тип этого изображения и его форму.
Если вы хотите прочитать об обработке изображений, вы можете обратиться к этой статье. Эта статья научит вас обработке изображений на примере: Basics of Image Processing in Python.
В Hierarchical Data Format (HDF) вы можете легко хранить большое количество данных. Он используется не только для хранения больших объемов или сложных данных, но также для хранения небольших объемов данных.
Может использоваться при любом размере и типе системы.
Он имеет гибкое, эффективное хранилище и быстрый ввод/вывод.
Существует несколько форматов HDF, но HDF5 - это последняя версия, разработанная для устранения некоторых ограничений старых форматов файлов HDF. Формат HDF5 имеет некоторое сходство с XML. Как и XML, файлы HDF5 имеют самоописание и позволяют пользователям указывать сложные взаимосвязи и зависимости данных.
Давайте рассмотрим пример формата файла HDF5, который можно определить с помощью расширения .h5.
PDF (Portable Document Format) - невероятно полезный формат, используемый для интерпретации и отображения текстовых документов вместе со встроенной графикой. Особенностью PDF-файла является то, что он может быть защищен паролем.
С другой стороны, чтение формата PDF программно является сложной задачей. Хотя существует библиотека, которая хорошо справляется с разбором PDF-файла, PDFMiner. Чтобы прочитать файл PDF с помощью PDFMiner, вам необходимо:
Извлечь содержимое файла PDF с помощью следующего кода:
Файл Microsoft Word Docx - это другой формат файла, который регулярно используется организациями для текстовых данных. Он имеет много возможностей, таких как добавление таблиц, изображений, гиперссылок и т. д., что делает docx невероятно важным форматом файла.
Преимущество файла docx перед файлом PDF заключается в том, что файл docx можно редактировать. Вы также можете конвертировать файл DOCX в любой другой формат.
Подобно формату PDF, python имеет библиотеку, созданную сообществом для анализа файла docx. Она называется python-docx2txt.
Чтобы прочитать файл docx в Python, используйте следующий код:
Формат MP3 подпадает под форматы мультимедийных файлов. Форматы мультимедийных файлов аналогичны форматам графических файлов, но они оказываются одним из самых сложных форматов файлов.
В мультимедийных форматах файлов вы можете хранить различные данные, такие как текст, изображения, видео и аудио данные. Например, мультимедийный формат может позволять сохранять текст в виде данных в формате RTF, а не в формате ASCII, который представляет собой простой текстовый формат.
Формат mp3 сжимает звук, отфильтровывая звук, который не слышен людям. Сжатие MP3 обычно позволяет уменьшить размер на 75-95%, что экономит много места.
Файл mp3 состоит из нескольких фреймов. Фрейм может быть дополнительно разделен на заголовок и блок данных. Мы называем эти последовательности фреймов элементарным потоком.
Заголовок в mp3 обычно идентифицирует начало действительного фрейма, а блоки данных содержат (сжатую) аудиоинформацию в терминах частот и амплитуд. Если вы хотите узнать больше о структуре mp3 файлов, вы можете обратиться к этой ссылке.
Для чтения или управления мультимедийными файлами в Python вы можете использовать библиотеку под названием PyMedia.
Формат MP4 используется для хранения видео. Он содержит множество изображений (называемых кадрами), которые воспроизводятся в виде видео в течение определенного периода времени. Есть два метода для интерпретации файла mp4. Одним из них является закрытый объект, в котором все видео рассматривается как один объект. И другой - это мозаика изображений, где каждое изображение в видео рассматривается как отдельная сущность, и эти изображения берутся из видео.
Для MP4 также имеется встроенная библиотека, которая называется MoviePy.
Вы можете установить библиотеку по этой ссылке. Чтобы прочитать видеоклип в формате mp4, в Python используйте следующий код.
Затем вы можете отобразить это в jupyter notebook, как показано ниже
Комментариев нет:
Подпишитесь на RSS
Перевод. Оригинал здесь. Если вы новичек в Linux и ранее использовали iTunes для управления своим iPod/iPhone/iPad, то скорее всего буд.
uTorrent - это легкий и эффективный торрент-клиент для Linux, Windows OS и Mac OS. Установка uTorrent в Linux отличается тем, что здесь uT.
Вы можете запускать скрипты на python в Linux непосредственно из терминала. Знать, как это делается, полезно как программистам, так и пол.
Как вы наверное знаете, Safari является браузером по умолчанию в Mac OS X и iPhone OS. Вышло уже несколько релизов и для Windows, но версии .
Способ сброса пароля root в CentOS 7 кардинально отличается от такового в Centos 6. 1. В загрузочном меню нажмите "е" - реда.
Python содержит несколько инструментов, которые разработчик может использовать для работы с датой и временем. В данном разделе статье мы рассмотрим модули datetime и time. Мы изучим принципы их работы и способы их применения. Начнем с модуля datetime.
Модуль datetime
Мы изучим следующие классы модуля:
- datetime.date
- datetime.timedelta
- datetime.datetime
Благодаря этим классам мы в будущем сможем работать с большей частью случаев, в которых нам понадобятся объекты date и datetime. Также существует класс tzinfo, который применяется для работы с часовыми поясами. Для дополнительной информации об этом классе вы можете обратиться к документации Python.
datetime.date
Python может представлять даты различными способами. Для начала, рассмотрим формат datetime.date, так как это один из самых простых объектов date.
В данном коде показано, как создать простой объект даты. Класс date принимает три аргумента: год, месяц и день. Если вы укажите неправильное значение, вы увидите ошибку ValueError, как в случае выше. В противном случае вы увидите, что объект datetime.date вернулся. Давайте взглянем на еще один пример:
Здесь мы присваиваем объекту date переменную d. Теперь мы можем получить доступ к различным компонентам даты по названиям, таким как d.year или d.month. Давайте посмотрим, какой сейчас день:
Это может быть полезно, когда вам нужно записать, какой сейчас день. Или, если вам нужно выполнить основанный на сегодняшней дате расчет. Мелочь, а приятно.
datetime.datetime
Объект datetime.datetime содержит всю информацию объектов datetime.date плюс datetime.time. Давайте приведем несколько примеров, для лучшего понимания разницы между этим объектом, и объектом datetime.date.
Мы видим, что datetime.datetime принимает несколько дополнительных аргументов: год, месяц, день, час, минута и секунда. Это также позволяет вам указывать информацию о микросекундах и часовом поясе. При работе с базами данных, данные типы объектов будут использоваться достаточно часто. Большую часть вашей работы, вам нужно будет конвертировать форматы date или datetime Python в форматы SQL datetime или timestamp. Обратите внимание на то, что today совместно с datetime.datetime использует два разных метода:
Модуль datetime содержит другой метод, под названием strftime. Этот метод позволяет разработчику создавать строку, отображающую время в более понятной для человека форме. Существует целая таблица параметров форматирования, с которой рекомендуется ознакомиться в документации Python, в секции 8.1.7. Давайте взглянем на несколько примеров, показывающих всю полезность данного метода:
Первый пример – это скорее хитрость. В нем показано, как конвертировать сегодняшний объект datetime в строку, следующую за форматом YYYYMMDD (ГГГГММДД). Второй пример более наглядный.
Есть вопросы по Python?
На нашем форуме вы можете задать любой вопрос и получить ответ от всего нашего сообщества!
Telegram Чат & Канал
Вступите в наш дружный чат по Python и начните общение с единомышленниками! Станьте частью большого сообщества!
Паблик VK
Одно из самых больших сообществ по Python в социальной сети ВК. Видео уроки и книги для вас!
В нем мы присваиваем объект datetime переменной под названием today и применяем два разных параметра форматирования строки. Первый параметр добавляет косые черточки между элементами datetime, а также перегруппировывает datetime, теперь он делится на месяц, день и год. В последнем примере мы создаем временную отметку, которая следует типичному формату: YYYY-MM-DD.HH.MM.SS. Если вам нужно указать год как двухзначный (“YY”), вы можете заменить %Y на %y.
datetime.timedelta
Объект datetime.timedelta отображает длительность времени. Другими словами, это разница между двумя датами или временными отметками. Давайте взглянем на наглядный пример:
Мы создали два объекта datetime. Один указывает на сегодняшний день, второй – на прошедшую неделю. После этого, мы берем разницу между ними. Это возвращает объект timedelta, который мы можем далее использовать, чтобы выяснить, сколько прошло дней или секунд, между этими двумя датами. Если вам нужно узнать количество часов или минут между двумя датами, вам понадобится немножко математики, чтобы выяснить это. Давайте взглянем на проверенный способ:
Отсюда мы узнаем, что в неделе 186 часов и 13 минут. Обратите внимание на то, что мы используем двойную косую черту в качестве нашего оператора деления, также известного как floor division. Теперь мы готовы к тому, чтобы узнать больше о модуле time Python.
Модуль time
Модуль time открывает разработчику Python доступ к нескольким связанным со временем функциям. Модуль основан на «эпохе», точке, с которой начинается время. Для систем Unix, эпоха началась в 1970 году. Чтобы узнать, какая эпоха в вашей системе, попробуйте запустить следующий код:
time . struct_time ( tm_year = 1970 , tm_mon = 1 , tm_mday = 1 , tm_hour = 0 , tm_min = 0 , tm_sec = \Я запустил его на Windows 7, которая также уверена в том, что начало времен датируется 1970м годом. В любом случае, в данном разделе мы ознакомимся со следующими функциями:
Читайте также: