В разделе source файла формата pdb содержится информация
Biopython предоставляет модуль Bio.PDB для манипулирования полипептидными структурами. PDB (Protein Data Bank) является крупнейшим ресурсом по структуре белка, доступным онлайн. Он содержит много различных белковых структур, в том числе белково-белковые, белково-ДНК, белково-РНК-комплексы.
Форматы файлов структуры белка
- Формат файла на основе XML, который не поддерживается Biopython
- Формат файла pdb, который представляет собой специально отформатированный текстовый файл
- Формат файлов PDBx / mmCIF
Файлы PDB, распространяемые Банком Белковых Данных, могут содержать ошибки форматирования, которые делают их двусмысленными или трудными для анализа. Модуль Bio.PDB пытается автоматически устранить эти ошибки.
Модуль Bio.PDB реализует два разных анализатора, один в формате mmCIF, а второй в формате pdb.
Парсер mmCIF
Давайте загрузим пример базы данных в формате mmCIF с сервера pdb, используя следующую команду:
Это загрузит указанный файл (2fat.cif) с сервера и сохранит его в текущем рабочем каталоге.
Здесь PDBList предоставляет опции для просмотра и загрузки файлов с FTP-сервера PDB. Метод retrieve_pdb_file требует имя файла для загрузки без расширения. В файле retrieve_pdb_file также есть возможность указать каталог загрузки, pdir и формат файла file_format. Возможные значения формата файла следующие:
- «MmCif» (по умолчанию, файл PDBx / mmCif)
- «Pdb» (формат PDB)
- «Xml» (формат PMDML / XML)
- «Ммтф» (сильно сжатый)
- «Bundle» (архив в формате PDB для большой структуры)
Здесь, QUIET подавляет предупреждение при разборе файла. get_structure проанализирует файл и вернет структуру с идентификатором 2FAT (первый аргумент).
После выполнения вышеуказанной команды он анализирует файл и печатает возможное предупреждение, если оно доступно.
Мы успешно проанализировали файл и получили структуру белка. Мы узнаем подробности о структуре белка и о том, как его получить, в следующей главе.
База данных программ ( PDB ) - это проприетарный формат файла (разработанный Microsoft ) для хранения отладочной информации о программе (или, как правило, программных модулях, таких как DLL или EXE ). Файлы PDB обычно имеют расширение .pdb . Файл PDB обычно создается из исходных файлов во время компиляции. Он хранит список всех символов в модуле с их адресами и, возможно, именем файла и строкой, в которой был объявлен символ. Эта символьная информация не хранится в самом модуле, поскольку занимает много места.
СОДЕРЖАНИЕ
Приложения
При отладке программы отладчик загружает отладочную информацию из файла PDB и использует ее для поиска символов или определения текущего состояния выполнения исходного кода программы. Microsoft Visual Studio использует файлы PDB в качестве основного формата файла для отладочной информации.
Еще одно использование файлов PDB - это службы, которые собирают данные о сбоях от пользователей и связывают их с конкретными частями исходного кода, которые вызывают сбой (или участвуют в нем).
Компиляторы Microsoft при соответствующих параметрах будут хранить информацию о типах, найденных в скомпилированных источниках, в одной PDB. Информация об отладке, относящаяся к каждому источнику, хранится в скомпилированном объектном файле и содержит ссылки на типы в PDB. Каждая компиляция будет добавлять в PDB любые типы, которые там еще не найдены, так что ссылки в уже скомпилированных объектных файлах остаются действительными.
Компоновщик Microsoft при соответствующих параметрах создает полностью новую базу данных PDB, которая объединяет отладочную информацию, содержащуюся в его модулях ввода, типы, на которые ссылаются эти модули, и другую информацию, генерируемую компоновщиком. Если ссылка выполняется постепенно, существующая PDB модифицируется путем добавления замены только информации, относящейся к добавленным или замененным модулям, и добавления любых новых типов, которых еще нет в PDB.
Файлы PDB обычно удаляются из дистрибутива программы. Они используются разработчиками во время отладки, чтобы сэкономить время и получить представление.
Извлечение информации
Формат PDB задокументирован здесь , информацию можно извлечь из файла PDB с помощью интерфейсов DIA (Debug Interface Access), доступных в Microsoft Windows . Существуют также сторонние инструменты, которые также могут извлекать информацию из PDB, такие как radare2 и pdbparse.
Многопоточный формат
PDB - это единый файл, который логически состоит из нескольких субфайлов, называемых потоками . Он предназначен для оптимизации процесса внесения изменений в PDB, который выполняется путем компиляции и инкрементных ссылок. Потоки могут быть удалены, добавлены или заменены без перезаписи других потоков, а также минимизированы изменения в метаданных, которые описывают потоки.
PDB организован в виде страниц фиксированного размера , обычно 1 КБ, 2 КБ или 4 КБ, пронумерованных последовательно, начиная с 0.
Примечание . Предполагается, что вся числовая информация ( например, номера потоков и страниц) хранится в прямой форме прямого байта для процессоров Intel x86. Код Python pdbparse делает это предположение.
Поток
Каждый поток в PDB занимает несколько страниц, которые не обязательно пронумерованы последовательно. У потока есть номер и длина. Содержимое потока - это объединение его страниц, усеченных до длины потока.
Формат метаданных
Функция метаданных PDB состоит в том, чтобы идентифицировать все потоки компонентов, указывая длину и последовательность страниц для каждого потока. Потоки нумеруются последовательно, начиная с 0. Существует также ненумерованный корневой поток, который содержит некоторые метаданные.
Заголовок
PDB начинается с заголовка, состоящего из:
- Подпись, используемая для идентификации и проверки конкретного формата. Длина подписи зависит от формата.
- Остальная часть заголовка зависит от формата, определяемого подписью.
Заголовок может быть длиннее одной страницы.
Инструменты Microsoft используют два формата PDB:
Версия 7
Подпись "Microsoft C/C++ MSF 7.00\r\n\x1ADS\0\0\0" (32 байта).
Остальная часть заголовка состоит из:
- Размер страницы, 4 байта.
- Указатель таблицы размещения, 4 байта. Смысл этого неизвестен. Кажется, есть таблица распределения, массив из 65 536 бит (8 192 байта), расположенный в конце PDB, а 1 бит означает страницу, которая не используется.
- Количество страниц файла, 4 байта.
- Размер корневого потока, 4 байта.
- зарезервировано, 4 байта.
- Номер страницы списка номеров страниц корневого потока. Он не указывает расположение самого корневого потока, только страницы, содержащей структуру, указывающую на его страницы. На этой странице список номеров страниц корневого потока указывает страницы, на которых хранится корневой поток. Он содержит 4 байта на страницу, чего достаточно для покрытия указанного выше размера корневого потока.
Корневой поток
Корневой поток описывает все потоки PDB, начиная с потока 0. Его содержимое зависит от версии формата PDB.
Версия 2
Корневой поток состоит из:
- Количество потоков, 2 байта.
- Зарезервировано, 2 байта.
- Для каждого потока:
- Размер потока, 4 байта.
- Зарезервировано, 4 байта.
- Список номеров страниц потока, 2 байта на страницу, достаточно, чтобы покрыть размер потока выше.
Версия 7
Корневой поток состоит из:
- Количество потоков, 4 байта.
- Для каждого потока:
- Размер потока, 4 байта.
- Список номеров страниц потока, 4 байта на страницу, достаточно, чтобы покрыть размер потока выше.
Содержимое потока
Инструменты Microsoft хранят разные виды информации в разных пронумерованных потоках. Некоторые номера потоков имеют связанный с ними фиксированный тип информации, а другие потоки идентифицируются в вышеупомянутых потоках фиксированного типа.
Поток 1 используется для проверки того, что PDB - это тот же файл, на который имеется ссылка в потоке исполняемого или объектного файла.
- Версия, 4 байта.
- Отметка даты и времени, 4 байта.
- Возраст, 4 байта. Это количество раз, когда эта PDB изменялась с момента ее создания.
- GUID, 16 байт.
- Общая длина следующих имен, 4 байта. За ними следуют символьные строки с завершающим нулем.
Поток 2 и поток 4 содержат информацию о типах. Записи фактических типов определяют типы, используемые в программе. Структуру этих записей можно найти в файле cvinfo.h, предоставленном Microsoft. Есть две разновидности записей, каждая со своим собственным набором номеров индексов: идентификаторы типов и типы; только типы хранятся в потоке 2, и только идентификаторы типов хранятся в потоке 4. Индексы используются для ссылки на эти записи из записей символов и других записей типов.
- Заголовок:
- Версия, 4 байта.
- Размер заголовка, 4 байта.
- Минимальный и максимальный (последний + 1) индекс для записей типа (по 4 байта).
- Размер следующих данных, 4 байта, до конца потока.
- Номер потока, 2 байта с заполнением 2 байта.
- Хеш-ключ, 4 байта.
- Ведра, 4 байта.
- HashVals, TiOff и HashAdj, каждый из которых состоит из смещения и длины, каждый из 4 байтов.
Поток 3 - это каталог для других потоков. Обратите внимание: его нет ни в версии 2, ни в PDB, созданной компилятором. Поток начинается с заголовка, который дополняется всего до 64 байтов.
Файлы PDB отображают различные компоненты и операторы в исходном коде в свой конечный скомпилированный продукт, который затем может использоваться отладчиком для поиска исходного файла и местоположения в исполняемом файле, в котором он должен остановить процесс отладки.
Вместо этого некоторые файлы PDB могут быть в формате файла Protein Data Bank. Эти файлы PDB представляют собой простые текстовые файлы, которые хранят координаты относительно структур белка.
Другие файлы PDB, вероятно, создаются в формате файлов базы данных Palm или PalmDOC и используются в мобильной операционной системе PalmOS. Некоторые файлы в этом формате используют вместо этого расширение .PRC.
Как открыть файл PDB
Некоторые файлы PDB хранятся в виде обычного текста, например файлы базы данных отладки программы Geneious, и полностью читаемы человеком, если открыты в текстовом редакторе. Вы можете открыть этот тип файла PDB с помощью любой программы, которая может читать текстовые документы, например, встроенной в Windows программы «Блокнот». Некоторые другие средства просмотра и редактирования файлов PDB включают Notepad ++ и Brackets.
Другие файлы базы данных PDB не являются текстовыми документами и полезны только при открытии с программой, для которой они предназначены. Например, если ваш файл PDB каким-либо образом связан с Quicken, попробуйте использовать это программное обеспечение для просмотра или редактирования файла PDB. Visual Studio ожидает увидеть файл PDB в той же папке, что и файл DLL или EXE.
С помощью Avogadro вы можете просматривать и редактировать файлы PDB, являющиеся файлами банка протеиновых данных, в Windows, Linux и macOS. Jmol, RasMol, QuickPDB и USCF Chimera также могут открывать файл PDB. Поскольку эти файлы представляют собой простой текст, вы можете открыть файл PDB и в текстовом редакторе.
Palm Desktop должен иметь возможность открывать файлы PDB в формате файлов базы данных Palm, но вам, возможно, придется сначала переименовать его, чтобы иметь расширение .PRC, чтобы эта программа распознала его. Чтобы открыть файл PalmDOC PDB, попробуйте STDU Viewer.
Как конвертировать файл PDB
Файлы базы данных программы, скорее всего, не могут быть конвертированы в другой формат файла, по крайней мере, с помощью обычного инструмента конвертации файлов. Вместо этого, если есть какой-либо инструмент, который может конвертировать этот тип файла PDB, это была бы та же самая программа, которая может открыть его.
Например, если вам нужно преобразовать файл базы данных PDB из Quicken, попробуйте использовать эту программу для этого. Однако этот тип преобразования, вероятно, не только мало полезен, но и не поддерживается в этих приложениях базы данных (т. Е. Вам, вероятно, не нужно преобразовывать этот тип файла PDB в любой другой формат).
Файлы Protein Data Bank можно конвертировать в другие форматы с помощью MeshLab. Для этого вам может понадобиться сначала преобразовать файл PDB в WRL с PyMOL из меню Файл> Сохранить изображение как> VRML , а затем импортировать файл WRL в MeshLab и использовать файл > Экспорт сетки как меню, чтобы в конечном итоге конвертировать файл PDB в STL или другой формат файла.
Если вам не нужна цветная модель, вы можете экспортировать файл PDB напрямую в STL с помощью USCF Chimera (ссылка для скачивания приведена выше). В противном случае вы можете использовать тот же метод, что и выше (с MeshLab), чтобы конвертировать PDB в WRL с USCF Chimera, а затем экспортировать файл WRL в STL с MeshLab.
Преобразовать PDB в PDF или EPUB, если у вас есть файл PalmDOC, можно несколькими способами, но проще всего, вероятно, использовать онлайн-конвертер PDB, такой как Zamzar. Вы можете загрузить свой файл PDB на этот веб-сайт, чтобы иметь возможность конвертировать его в эти форматы, а также в форматы файлов AZW3, FB2, MOBI, PML, PRC, TXT и другие.
Преобразовать файл PDB в формат FASTA можно с помощью онлайн-конвертера Meiler Lab в PDB в FASTA.
Также возможно конвертировать PDB в CIF (формат кристаллографической информации) онлайн, используя PDBx/mmCIF.
Расширенное чтение файлов PDB
Вы можете прочитать намного больше о файлах базы данных программ от Microsoft, GitHub и Wintellect.
Также есть больше информации о файлах Protein Data Bank; см. Всемирный банк протеиновых данных и RCSB PDB.
Ваш файл все еще не открывается?
Файлы PDB, которые не открываются ни одним из перечисленных выше инструментов, скорее всего, не являются файлами PDB. Может случиться так, что вы неправильно читаете расширение файла; некоторые форматы файлов используют суффикс, который очень похож на «.PDB», когда они действительно не связаны и не работают одинаково.
Например, файл PDF является файлом документа, но большинство программ из приведенного выше не будут корректно отображать текст и/или изображения, если вы попытаетесь открыть их с помощью этих программ. То же самое верно и для других файлов с одинаковыми расширениями файлов, таких как файлы PD, PDE, PDC и PDO.
Если у вас нет файла PDB, изучите расширение файла, которое есть у вашего файла, чтобы вы могли найти соответствующую программу, которая открывает или конвертирует его.
Связь между pdb и cdb:
pdb создан:
предпосылки:
1. cdb должен существовать
2. cdb находится в состоянии чтения и записи.
3. Текущий пользователь является общедоступным пользователем, а текущий контейнер - root.
4. У текущего пользователя есть разрешение на прохождение через PDB.
5. Определите уникальное имя для PDB.Creating a PDB from the Seed :
Параметр ‘FILE_NAME_CONVERT’ используется для клонирования пути сохранения файла данных pdb. Если установлен параметр db_create_file_dest, этот параметр устанавливать не нужно.
Creating a PDB by Cloning an Existing PDB or Non-CDB:
При клонировании pdb или non-pdb и добавлении к cdb вам необходимо указать источник с помощью «from». Источник может быть локальным cdb или не-cdb, или удаленным cdb или не-cdb.
Example 1
Cloning a Local PDB Using No Clauses
Example 2
Cloning a Local PDB With the PATH_PREFIX, FILE_NAME_CONVERT, and SERVICE_NAME_CONVERT Clauses
Example 3
Cloning a Local PDB Using the FILE_NAME_CONVERT, STORAGE, and SERVICE_NAME_CONVERT Clauses
Example 4
Cloning a Local PDB Without Cloning Its Data
1 .With the source PDB pdb1 as the current container, query a table with a large amount of data:The table has over six million rows.
2 . With the root as the current container, change the source PDB to open read-only mode:
3 . Clone the source PDB with the NO DATA clause:
4 . Open the cloned PDB:
5 . With the cloned PDB pdb2 as the current container, query the table that has a large amount of data in the source PDB:
The table in the cloned PDB has no rows.
Cloning a Remote PDB or Non-CDB
предпосылки:
1. Выполните предварительные требования для создания PDB;
2. Текущий пользователь имеет разрешение «CREATE PLUGGABLE DATABASE» в корневом контейнере и целевом pdb,
3. Исходный pdb или исходный код, отличный от cdb, должен быть открыт в режиме только для чтения,
4. При клонировании удаленного PDB необходимо указать db_link для доступа к удаленному CDB. Эта db_link может получить доступ как к удаленному корневому контейнеру, так и к удаленному контейнеру PDB.
5. db_link имеет разрешение «CREATE PLUGGABLE DATABASE» в исходном pdb или не-cdb
6. Если db_link входит в корневой контейнер удаленного cdb, то db_link должна быть общедоступной.
7. Архитектура исходной и целевой системы должна соответствовать следующим требованиям:
. Тот же порядок байтов
. The database options installed on the source platform must be the same as, or a subset of, the database options installed on the target platform.
8. Используйте тот же набор символов и расширенный набор символов.
9. Если pdb создается путем клонирования не-cdb, то cdb и no-cdb должны работать в версии 12.1.0.2 или новее.Example 1 Creating a PDB by Cloning a Remote PDB Using No Clauses
This example clones a remote source PDB named pdb1 to a target PDB named pdb2 given different factors. This example assumes the following factors:
. The database link name to the remote PDB is pdb1_link.
. The PATH_PREFIX clause is not required.
. The FILE_NAME_CONVERT clause and the CREATE_FILE_DEST clause are not required.
Either Oracle Managed Files is enabled, or the PDB_FILE_NAME_CONVERT initialization parameter is set. The files will be copied to a new location based on the Oracle Managed Files configuration or the initialization parameter setting.
. Storage limits are not required for the PDB. Therefore, the STORAGE clause is not required.
. There is no file with the same name as the new temp file that will be created in the target location. Therefore, the TEMPFILE REUSE clause is not required.
Given the preceding factors, the following statement clones the pdb2 PDB from the pdb1 remote PDB:
Когда вам нужно клонировать PDB через не-cdb, вам нужно создать db_link в не-cdb.
Example 1 Creating a PDB by Cloning a Remote Non-CDB
This example creates a new PDB by cloning a remote source non-CDB named mydb to a target PDB named pdb2 given different factors. This example assumes the following factors:
. The database link name to the remote non-CDB is mydb_link.
. The PATH_PREFIX clause is not required.
. The FILE_NAME_CONVERT clause and the CREATE_FILE_DEST clause are not required.
Either Oracle Managed Files is enabled, or the PDB_FILE_NAME_CONVERT initialization parameter is set. The files will be copied to a new location based on the Oracle Managed Files configuration or the initialization parameter setting.
. Storage limits are not required for the PDB. Therefore, the STORAGE clause is not required.
. There is no file with the same name as the new temp file that will be created in the target location. Therefore, the TEMPFILE REUSE clause is not required.
Given the preceding factors, the following statement creates the pdb2 PDB from the remote non-CDB named mydb:
After Cloning a PDB:
If you created the PDB from a non-CDB, then run the ORACLE_HOME/rdbms/admin/noncdb_to_pdb.sql script. This script must be run before the PDB can be opened for the first time.Клонированный pdb использует то же временное табличное пространство, что и исходная база данных.Если исходная база данных использует временное табличное пространство или вручную указывает временное табличное пространство, клону может также потребоваться тот же режим для указания временного табличного пространства.
.Читайте также: