Как химия связана с компьютерами
Характер познавательной деятельности учащихся определяется не только целями и задачами обучения, но и содержанием учебного материала, формами организации работы с ними.
Развитие познавательной деятельности предусматривается и в требованиях предметными умениями, таких, например, как умение пользоваться химическим языком. Химический язык включает в себя несколько компонентов знаний, один из которых символика. Учащиеся 5-7-х классов успешно овладевают этим компонентом, используя компьютерную программу "Химическая энциклопедия”, которая является обучающейся программой и используется на пропедевтических занятиях.
Глава 1. Компьютерные технологии на уроках химии
Характер познавательной деятельности учащихся определяется не только целями и задачами обучения, но и содержанием учебного материала, формами организации работы с ними.
Развитие познавательной деятельности предусматривается и в требованиях предметными умениями, таких, например, как умение пользоваться химическим языком. Химический язык включает в себя несколько компонентов знаний, один из которых символика. Учащиеся 5-7-х классов успешно овладевают этим компонентом, используя компьютерную программу "Химическая энциклопедия”, которая является обучающейся программой и используется на пропедевтических занятиях.
Развитие знаний химического языка продолжается через компьютерную программу " Органическая химия", состоящую из нескольких блоков:
1. номенклатура органических веществ,
2. составление структурных формул,
3. химические свойства органических веществ.
Эта программа успешно используется в 10 - 11 классах как средство самоконтроля при подготовке к обобщающим урокам и контроля знаний.
Отличительная черта компьютерной программы " Производство серной кислоты" - широкое использование моделирования химических процессов, протекающих в специальных устройствах, что позволяет обучаемому сконцентрировать свое внимание на основных особенностях рассматриваемых процессов.
Организовать и тем более достичь развитие познавательной деятельности учащихся в процессе выполнения ими химического эксперимента несомненно сложно. Компьютерная программа "Химик" - одна из форм проведения химического эксперимента, признаки химических реакций сопровождаются изменением цвета, появлением осадка, газа.
Большое значение для развития познавательной деятельности учащихся имеют упражнения в решении расчетных задач. Компьютерную программу "Решение задач по химии " можно использовать как обучающую и контролирующую. В программе представлены задачи разной степени сложности, показаны алгоритмы их решений.
Сегодня компьютерные технологии всё шире используются в практике преподавания не только информатики, но и других дисциплин как математика, физика, биология, химия. Опыт работы показал, что компьютерные технологии непременно должны сочетаться с традиционными формами обучения химии. Полученная здесь информация передается при работе с компьютером, где происходит закрепление знаний повышение их прочности.
Глава 2. Компьютерная химия
Компьютерная химия (Математическая химия) — сравнительно молодая область химии, основанная на применении теории графов к химическим задачам фундаментального и прикладного характера. Исходя из общего определения химии как науки о веществах и превращениях их в друг друга, можно сказать, что вещества (молекулы) моделируются в компьютерной химии молекулярными графами, а превращения веществ (химические реакции) — формальными операциями с графами. Такой формально-логический подход в ряде случаев заметно упрощает алгоритмизацию химических задач, сводя их к типовым задачам комбинаторики и дискретной математики и позволяет искать решения с помощью компьютерных программ. При этом наряду со специальными программами в компьютерной химии могут применяться и универсальные программы: для работы с таблицами, математические программы (например, Maple или Mathematica) и т. д.
В качестве примера типовых задач компьютерной химии можно назвать: поиск зависимостей типа «структура — свойство»; генерацию наборов химических структур, отвечающих заданным параметрам (составу, наличию функциональных групп и т. д.); перечисление всевозможных химических реакций между заданными реагентами (так называемый «компьютерный синтез») и т. д. Наряду с общими химическими задачами в компьютерной химии существует также большая группа узкоспециальных задач, тесно связанных с задачами химической информатики, например, задачи распознавания химических структур при обращении к химическим и физико-химическим базам данных. Эта группа задач в свою очередь тесно связана с проблемой изоморфизма графов.
При решении задач компьютерной химии широко используются различные вычислительные методы и операции с топологическими индексами (инвариантами графов). В ряде случаев формально-логический подход расширяется химическими подходами, например, в дополнение к топологическим индексам, отражающим строение молекулы, используются электроотрицательности атомов в молекуле, отражающие состав вещества. Методы компьютерной химии часто используются в сочетании с методами квантовой химии, молекулярной механики и др. Для обработки результатов вычислительного эксперимента широко применяются методы математической статистики. В некоторых случаях для поиска решений применяются методы искусственного интеллекта.
Особую роль методы компьютерной химии играют в органической химии, что объясняется трудной формализуемостью последней, как по сравнению с другими естественными науками, например, с физикой, так и по сравнению с другими областями химии, например, с неорганической химией. Компьютерная химия имеет большое значение и для многих важнейших областей биохимических исследований, например, при решении задач типа «структура-фармакологическая активность», часто в таких исследованиях методы компьютерной химии дополняются методами моделирования, специфическими для молекулярно-биологических систем.
В период становления и формирования в самостоятельную область новое научное направление нередко получает разные названия у разных авторов. Так произошло и с компьютерной химией: исторически закрепились два названия — «компьютерная химия» и «математическая химия». Так, один из научных журналов, оказавший значительное влияние на становление компьютерной химии, называется «Journal of Mathematical Chemistry». Однако название «математическая химия» представляется неудачным, если учесть, что многие области химии, сформировавшиеся задолго до появления компьютерной химии, изначально были основаны на математическом фундаменте, например, физическая химия, кинетика и катализ, квантовая химия. При том, что ряд основополагающих работ в компьютерной химии был выполнен во время ЭВМ первых поколений, развитие компьютерной химии стало возможным только с появлением современных компьютеров. Несмотря на то, что сегодня компьютеры используются практически во всех областях современной химии как для теоретических так и для экспериментальных исследований, именно компьютерная химия гораздо больше многих других областей химии зависит от уровня развития компьютерных технологий. Такая зависимость связана прежде всего со спецификой важнейших алгоритмов теории графов, многие из которых имеют экспоненциальную вычислительную сложность — теоретическая оценка времени, затраченного на исполнение алгоритма, является экспоненциальной функцией от размера графа, то есть от количества его вершин и ребер, или говоря общехимическим языком — от числа атомов и химических связей в молекуле.
С другой стороны, многие задачи химической информатики, решаемые с помощью методов компьютерной химии, уже по своей постановке невозможны без использования компьютера, например, формирование и эксплуатация компьютерной базы данных по свойствам химических соединений. Необходимо при этом отметить, что сама химическая информатика возникла задолго до появления компьютеров. Так, были и продолжают широко использоваться многочисленные химические справочники и реферативные журналы, отпечатанные на бумаге. Существуют зарекомендовавшие себя и ставшие классическими методы поиска по этим изданиям с применением всевозможных печатных указателей (авторского, предметного, формульного и т. д.), организуемые без привлечения аппарата компьютерной химии. Таким образом, в отличие от компьютерной химии, химическая информатика, как и подавляющее большинство традиционных областей химии, основана на применении докомпьютерных технологий. В этом и заключается основное методологическое отличие компьютерной химии. С известной долей неточности можно утверждать, что если целью большинства химических исследований является установление некоторых химических закономерностей, то целью исследований в компьютерной химии является, как правило, некоторый алгоритм и реализующая его компьютерная программа, позволяющая искать химические закономерности, эксплуатация такой программы может проходить уже вне области компьютерной химии.
Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Пронкин Павел Геннадьевич, Сорокина Ольга Николаевна, Ботнарь Юлия Васильевна
Применение компьютерной техники с появлением новых технологий передачи, обработки, накопления и представления информации облегчило и ускорило вычислительную работу во многих областях науки, и химии , в частности. Относительно низкая цена и WIMP-интерфейс делает основную часть специализированных решений доступными для широкого круга пользователей. В статье дан краткий обзор существующих направлений прикладных продуктов, систем и информационных технологий , используемых в современной химической практике.
Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Пронкин Павел Геннадьевич, Сорокина Ольга Николаевна, Ботнарь Юлия Васильевна
Компьютер как инструмент исследования при изучении химии и смежных дисциплин Конформационный анализ 1,2-О-цианоэтилиденовых производных углеводов методом молекулярной механики Программный комплекс для прогнозирования растворимости в сверхкритических флюидах Квантово-химические и молекулярно - динамические аспекты прогнозирования свойств собирателей металлов из продуктивных растворов цветных металлов Программа «Xchem» - использование фрагментов химической структуры для поиска и моделирования химических и биологических свойств i Не можете найти то, что вам нужно? Попробуйте сервис подбора литературы.Information technology methods and techniques evolution in fundamental and practical chemistry applications
The evolution of computer science and novel IT achievements offered the challenge to a lot of sciences and particularly to chemistry . The solution of the majority specific problems is available to the wide variety of users due to low price and WIMP interface. This article is a short review of the present IT products which are used in contemporary chemical practice.
Текст научной работы на тему «Эволюция средств и методов информатики в практической и фундаментальной химии»
П. Г. Пронкин, О. Н. Сорокина, Ю. В. Ботнарь
Эволюция средств и методов информатики в практической и фундаментальной химии
Применение компьютерной техники с появлением новых технологий передачи, обработки, накопления и представления информации облегчило и ускорило вычислительную работу во многих областях науки, и химии, в частности. Относительно низкая цена и WIMP-интерфейс делает основную часть специализированных решений доступными для широкого круга пользователей. В статье дан краткий обзор существующих направлений прикладных продуктов, систем и информационных технологий, используемых в современной химической практике.
Компьютерная химия является сравнительно молодой отраслью химии, тесно связанной с информатикой. Эта область химии основана на применении теории графов к химическим задачам фундаментального и прикладного характера. Исходя из наиболее общего определения химии как науки о веществах и их взаимных превращениях, можно сказать, что вещества (молекулы) моделируются в компьютерной химии молекулярными графами, а превращения веществ (химические реакции) — формальными операциями с графами. Такое (формальное) представление задач компьютерной химии позволяет использовать аппарат комбинаторики и дискретной математики и искать решения с помощью компьютерных программ. При этом наряду со специальными программами в компьютерной химии могут применяться и универсальные — для работы с таблицами (Microsoft Excel), математические программы (Mathematica) и т. д.
В качестве примера типовых задач компьютерной химии можно назвать:
• поиск зависимостей типа «структура — свойство»;
• генерация наборов химических структур, отвечающих заданным параметрам (составу, наличию функциональных групп);
• перечисление всевозможных химических реакций между заданными реагентами (так называемый компьютерный синтез).
Наряду с общими химическими задачами в компьютерной химии существует также большая группа узкоспециальных, тесно связанных
с задачами химической информатики, например, задачи распознавания химических структур при обращении кхимическим и физико-химическим базам данных.
Постановка задач современной химической информатики на сегодняшний день уже невозможна без применения ЭВМ. И это несмотря на то, что химическая информатика как наука возникла значительно раньше, чем появились первые компьютеры. Для решения задач ученые тогда использовали многочисленные химические справочники и реферативные журналы, быстрый поиск информации по которым осуществлялся посредством системы указателей (авторского, предметного, формульного). Основные принципы обработки информации, разработанные еще тогда, легли в основу современной химической информатики. Компьютерная же химия направлена на решение сложных многопараметрических задач, путем создания некоторого алгоритма и реализующей его компьютерной программы. В этом заключается основное методологическое отличие химической информатики и компьютерной химии.
Синтез новых лекарственных форм, обеспечивающий эффективное развитие фармацевтической промышленности, требует прогнозирования фармакологического и токсикологического действия разрабатываемых препаратов. С этой целью создаются специализированные банки данных весьма значительного объема, в которых объединяются и упорядочиваются данные о молекулярных структурах известных
соединений и сопоставляются их физико-химические и биологические свойства. Одной из важнейших проблем химической информатики является разработка эффективных способов кодирования структурных формул органических соединений в таких банках данных.
Одним из лучших решений в области представления структурных формул является образ молекулярных структур в привычном для химика двумерном виде, который описывается теорией графов.
Созданные в 1980 годах, первые системы по вводу структурных формул (СФ) работали в пакетном режиме и, естественно, использовали некиедирективныеязыки.Затем возникли системы редактирования СФ, ориентированные на работу с печатающими терминалами в диалоговом режиме. Появление и развитие ПЭВМ существенно упростило технологию кодирования формул химических соединений. Для решения задач создания химических структур, схем реакций в полиграфических целях, использования их при создании баз данных, поиска в информационных системах, программах квантовой химии и других областях создано достаточно много различных программных средств, называемых молекулярными редакторами. Основные режимы работы такого графического редактора: рисование, удаление, редактирование, сборка из фрагментов, создание ароматических комплексов, манипулирование структурными формулами.
Применение современных молекулярных редакторов позволяет химику мыслить в удобной и привычной для него форме, не обликая свои замыслы искусственным языком. Этим объясняются высокие выходные характеристики систем: с помощью молекулярных редакторов можно быстро откорректировать структурную формулу, а навык автоматической работы вырабатывается у пользователя за один сеанс.
Большую значимость в организации автоматизированного хранения,поиска и обработки информации о строении вещества имеют специализированные языки представления структурированных данных. Например, граф структурной формулы химического соединения может быть представлен множеством соответствующих ему дескрипторов, если в каче-
стве языка представления данных выбран де-скрипторный язык.
SMILES (Simplified Molecular Input Line Entry Specification — Спецификация упрощенного представления молекул в строке Ввода) — система правил (спецификация) однозначного описания состава и структуры молекулы химического вещества с использованием таблицы компьютерных символов ASCII. Строка символов, составленная по правилам SMILES, может быть преобразована многими молекулярными редакторами в двумерную или трехмерную структурную формулу молекулы.
На сегодняшний день известны две разновидности этой спецификации — каноническая и изометрическая. Первая спецификация включает правила, позволяющие записать формулу молекулы любого вещества уникальным образом, и применяется для индексирования и проверки уникальности молекул в базах данных. Изометрическая SMILES представляет собой расширения, которые позволяют включать в запись данные о нуклидах, хиральности (свойстве молекулы быть несовместимой со своим зеркальным отражением любой комбинацией вращений и перемещений в трехмерном пространстве) и конфигурациях двойных связей (цис-и трансизомеров). Особенность этой версии спецификации — в точном отражении пространственной структуры веществ-изомеров.
циклогексан записывается как С1ССССС1). Ароматические (непредельные) органические соединения записываются строчными буквами.
В изометрической SMILES конфигурация относительно двойной связи записывается при помощи слэша «/» и «\». Например, F/С = С/F соответствует транс-дифторэтану (атомы фтора находятся по разные стороны двойной связи), а F/С = С\F или F\С = С/F соответствует его изомеру цис-дифторэтану (атомы фтора находятся с одной стороны двойной связи).
Практика применения вызвала распространенное заблуждение, что в компьютерном поиске структур производится сравнение записей-цепочек, в то время как осуществялется гораздо более эффективное сравнение графов, построенных на основании формул SMILES.
Альтернативой подхода к заданию конфигураций химических структур может служить представление химической формулы в виде изоморфного объекта (матрицы смежности). При поиске информации в базе данных каждое из представлений обладает определенными достоинствами и недостатками.
При создании компьютерных систем в области химических исследований ввод, вывод и манипулирование структурными формулами молекул осуществляется молекулярным редактором. Поиск информации в БД осуществляется по любому полю или совокупности полей, включая подструктурный поиск — путем рисования структурного фрагмента и/или фрагментов графическим редактором и внесения их в поисковые предписания на специально разработанном языке запросов. Идентификация химических веществ осуществляется по каноническому коду, программно порождаемому системой.
Таким образом, при решении задач компьютерной химии широко используются различные вычислительные методы и операции с топологическими индексами. В ряде случаев формально-логический подход расширяется химическими подходами, например, в дополнение к топологическим индексам, отображающим строение молекулы, используется электроотрицательность атомов в молекуле соответственно составу вещества.
Методы компьютерной химии часто используются в сочетании с методами квантовой
химии, молекулярной механики. Для обработки результатов вычислительного эксперимента широко применяются методы математической статистики. В некоторых случаях для поиска решений применяются методы искусственного интеллекта.
Первоначально создание программного обеспечения для химической лаборатории оставалось уделом программистов-энтузиастов. Активно разрабатывались программы для обработки результатов химических и физико-химических экспериментов. Примером могут служить программы для вариационного исчисления параметров уравнений химической кинетики и подбора спектральных характеристик. Академические традиции живы, и в настоящее время известен ряд интересных проектов по созданию свободного программного обеспечения.
Для начала отметим проект Jmol. Одноименная программа относится к упомянутым ранее молекулярным редакторам, однако позволяет химику просто и легко использовать возможности трехмерной визуализации химических структур. Проект активно развивается: поощряется модификация пользователями текущего кода программы и в целях удовлетворения их собственных нуждивцелях роста проекта. На сайте проекта практически ежедневно сообщается об изменениях в функциональности программы. Первая буква в названии программы говорит о том, что Jmol базируется на Java. Для реализации графического пользовательского интерфейса используется SWING, разработанная компанией Sun Microsystems библиотека классов JFC. Компоненты SWING обеспечивают адаптацию к графическому интерфейсу платформы, поскольку поддерживают специфические динамически подключаемые элементы. Jmol может использоваться в качестве апплета в web-страницах и позволяет создавать скрипты.
В качестве 2Э-расширения к Jmol разработан редактор химических структур JChemPaint, который также базируется на Java. Программа поддерживает большинство функций, присущих коммерческим аналогам, и позволяет импортировать структуры в растровые изображения, а также в файлы Postscript и Scalable Vector Graphics.
Описанные программы поддерживают SMILES и специализированный язык разметки Chemical Markup Language, CML.
Большинство людей ассоциируют IT в первую очередь с разработкой мобильных приложений, веб-сайтов, игр. Но «фронт» работы программистов гораздо шире. Вряд ли вы с ходу назовёте хоть одну сферу, куда ещё не внедрена электроника.
Чтобы доказать это, перенесёмся в мир химии. О том, как из учёного стать крутым программистом, не меняя сферы деятельности, мы поговорили с основателем компании Nucleomatica, разработчиком ПО для спектроскопии ядерного магнитного резонанса iNMR Джузеппе Балакко.
— Джузеппе, начнём с главного — что такое спектроскопия ядерного магнитного резонанса? Где она применяется?
— Спектроскопия ядерного магнитного резонанса (NMR) позволяет оценить молекулярную структуру вещества, его количественный и качественный состав. С середины ХХ века это один из популярнейших аналитических подходов в химии. Конкретной сферы применения нет: NMR востребована как в научных экспериментах, так и в медицине, промышленности.
К примеру, вы нашли волшебный порошок, который превращает автомобиль в трансформер. Естественно, вы захотите узнать, из чего он состоит, и попробовать его воспроизвести. Самый верный способ установить состав — спектроскопия ядерного магнитного резонанса. Также с помощью NMR компания может контролировать поставщиков сырья.
В медицине ядерный магнитный резонанс используется при диагностике заболеваний головного мозга. В сочетании с МРТ он даже заменяет хирургическую биопсию новообразований.
— Программирование в классическом представлении: на популярных языках в общедоступных средах разработки? Или это работа со специальными языками и ПО?
— Нет, самое обычное программирование, но с обширным кругом задач: работа с устройствами ввода-вывода, протоколами, интерфейсами, аналого-цифровыми и цифро-аналоговыми преобразователями, а также представление этой информации пользователю в удобной форме.
Именно поэтому на рынке фактически нет такой профессии, как NMR-программист. Как правило, это или IT-специалисты широкого профиля, или химики с дополнительным образованием. Кроме того, в NMR есть объективные ограничения: высокая точность требует много времени и ресурсов (гелия, запас которого на планете ограничен, сверхпроводящих магнитов и прочего). То есть услуга дорогостоящая. В перспективе, с открытием новых технологий, NMR может стать более доступной и применяться массово, но пока это не так.
— Какие языки программирования вы используете?
— Преимущественно С, так как требуется большая производительность. Но также приходится иметь дело с C++, Lua, Objective-C и веб-набором HTML–CSS–PHP.
По образованию я не программист, а химик, и всем языкам обучался сам. Первым был BASIC, потом я переключился на Pascal, и затем — на C. Когда начинал карьеру, рынок специализированного ПО был очень мал, поэтому пришлось учиться программировать, чтобы решать профессиональные задачи самостоятельно.
— Можете посоветовать книги?
По C рекомендую книгу «C: a Software Engineering Approac» Питера А. Дарнелла. Она как раз посвящена созданию ПО на инженерном уровне, где важна производительность и надёжность.
По Lua могу посоветовать «Programming in Lua» Роберто Иерусалимши: здесь можно найти ответы на все вопросы по языку.
— Ваше мнение, как лучше обучаться: интернет-курсы, книги, навороченные среды разработки?
— Нет универсального ответа — необходимо всё совмещать. У меня был неудачный опыт онлайн-обучения, но преимущественно потому, что я не мог делиться своими соображениями и замечаниями. Но это частный случай, а в перспективе, безусловно, интернет-курсы — эффективный способ. При этом без книг и онлайн-документации обойтись нельзя.
Что касается использования мощных средств разработки новичками, то это может быть даже полезно, если к ним прилагается качественная документация. Главное — никогда не опускать руки. По своему опыту могу сказать: большинство трудностей, с которыми приходится сталкиваться, связаны не столько с программированием, сколько с нежеланием искать несколько вариантов решения.
Химическая информатика (хемоинформатика, от англ. chemistry, химия) – представляет собой совокупность методов информатики и компьютерных технологий для решения проблем современной химии. Сферы приложения: прогноз физико-химических свойств молекул (в частности, липофильности, или водорастворимости), свойств материалов, токсикологическая и биологическая активность, эколого–токсикологические свойства, разработка новых лекарственных препаратов. Термин хемоинформатика был введен в употребление Ф.К. Брауном в 1998 г.
Он означает совместное использование информационных ресурсов для преобразования данных в информацию и информации в знания для быстрейшего принятия наилучших решений при поиске соединений – лидеров в разработке лекарств и их оптимизации.
Хемоинформатика – это научная дисциплина, охватывающая вопросы дизайна, создания, организации, управления, поиска, анализа, распространения, визуализации и использования химической информации.
Согласно определению, данному А. Варнеком и И. Баскиным: хемоинформатика – это часть теоретической химии, базирующаяся на своей собственной молекулярной модели; в отличие от квантовой химии, в которой молекулы представлены как ансамбли электронов и ядер, и основанного на силовых полях молекулярного моделирования, имеющего дело с классическими «атомами» и «связями», хемоинформатика рассматривает молекулы как объекты в химическом пространстве.
Наиболее полное и развернутое определение хемоинформатики как научной дисциплины содержится в Декларации Обернэ: хемоинформатика – это научная дисциплина, возникшая за последние 50 лет в пограничной области между химией, вычислительной математикой и информатикой. Было осознано, что во многих областях химии огромный объем информации, накопленный в ходе химических исследований, может быть обработан и проанализирован только с помощью компьютеров. Более того, многие из проблем в химии настолько сложны, что для их решения требуются новые подходы, основанные на применении методов информатики. Исходя из этого, были разработаны методы для построения баз данных по химическим соединениям и реакциям, для прогнозирования физических, химических и биологических свойств соединений и материалов, для поиска новых лекарственных препаратов, анализа спектральной информации, для предсказания хода химических реакций и планирования органического синтеза.
Хемоинформатика, наряду с квантовой химией и молекулярным имитационным моделированием, является ветвью теоретической химии и областью вычислительной химии.
Хемоинформатика тесно связана с биоинформатикой, и между ними нет четкой границы. Биоинформатику можно считать частным случаем хемоинформатики для биологических макромолекул, а хемоинформатику – распространением биоинформатики на небиологические молекулы. Есть ряд областей, например, хемогеномика, которые в равной степени относятся и к биоинформатике, и хемоинформатике.
На пересечении хемоинформатики и фармакологии стоит медицинская химия, т.е. фармацевтическая химия. На пересечении хемоинформатики и аналитической химии находится хемометрика. Математическими основами хемоинформатики, связанными с представлением химических соединений в графическом виде (с помощью молекулярных графов), занимается математическая химия.
Основные направления. Хемоинформатика находится на пересечении химии и информатики. В основе хемоинформатики лежит представление о химическом пространстве – совокупности всех доступных химических объектов (химических соединений, реакций, смесей, растворов, каталитических систем, материалов и др.). Отличительной особенностью хемоинформатики является то, что в ее рамках прогнозирование свойств химических объектов осуществляется путем переноса (интерполяции) известных значений свойств от сходных химических объектов. В большинстве случаев химические объекты представимы в виде молекулярных графов, и поэтому методы теории графов находят широкое применение в хемоинформатике. Традиционный подход к обработке химической информации, однако, состоит в отображении химического пространства на дескрипторное пространство, образуемое вычисляемыми для каждого химического объекта векторами молекулярных дескрипторов – числовых характеристик, описывающих химические объекты (в особенности, молекулярные графы). Это дает возможность применять методы математической статистики и машинного обучения (в том числе, интеллектуального анализа данных) для работы с химическими объектами.
Внутреннее и внешнее представление химической информации. В хемоинформатике для внутреннего представления структур химических соединений обычно используются молекулярные графы, которые могут быть при необходимости дополнены информацией о трехмерных координатах атомов, а также о динамике их изменения во времени. Долговременное хранение химической информации и обмен ею между приложениями осуществляется при помощи файлов, организованных в соответствии с типами внешнего представления химической информации.
Простейшим типом внешнего представления структур химических соединений являются линейные нотации в виде строки символов. Исторически первым видом линейных нотаций явилась линейная нотация Висвессера. В настоящее время наиболее распространённой видом линейных нотаций являются строки SMILES.
Второй тип внешнего представления структур химических соединений и реакций между ними основан на непосредственном кодировании матрицы смежности молекулярного графа. Такие форматы как MOL, SDF и RDF, которые в настоящее время являются стандартными для обмена химической информацией, можно считать способами представления в виде текстового файла матрицы смежности молекулярного графа. Этой же целью служат и специфические форматы MOL2, HIN, PCM и др., предназначенные для работы с программами по молекулярному моделированию.
Наконец, третий тип внешнего представления структур химических соединений основан на технологии XML. Наиболее распространённым языком описания химической информации, опирающимся на эти принципы, является CML.
Прогнозирование свойств химических соединений и материалов. Прогнозирование свойств химических соединений в хемоинформатике основано на применении методов математической статистики и машинного обучения для построения моделей, позволяющих по описанию структур
химических соединений предсказывать их свойства (физические, химические, биологическую активность). За моделями, позволяющими прогнозировать количественные характеристики биологической активности, исторически закрепилось англоязычное название QSAR. Аббревиатура QSAR часто трактуется расширенно для обозначения моделей структура – свойство.
Фармакофоры и фармакофорный поиск. Фармакофор – это набор пространственных и электронных признаков, необходимых для обеспечения оптимальных супрамолекулярных взаимодействий со специфической биологической мишенью, которые могут вызывать или блокировать её биологический ответ. При фармакофорном поиске проводится поиск соответствия между описанием фармакофора и характеристиками молекул из базы данных, находящихся в допустимых конформациях.
Молекулярное подобие и поиск по молекулярному подобию. Молекулярное (химическое) подобие – это близость, сходство, подобие структур химических соединений. В качестве количественной меры молекулярного подобия рассматривается величина, возрастающая с уменьшением расстояния между химическими соединениями в дескрипторном пространстве. Поиск по химическому подобию основан на предположении, что подобные соединения обладают подобной биологической активностью.
Виртуальный скрининг – это вычислительная процедура, которая включает автоматизированный просмотр базы данных химических соединений и отбор тех из них, для которых прогнозируется наличие желаемых свойств. Чаще всего он применяется при разработке новых лекарственных препаратов для поиска химических соединений, обладающих нужным видом биологической активности.
Компьютерный синтез – область хемоинформатики, охватывающая методы, алгоритмы и реализующие их компьютерные программы, оказывающие помощь химику в планировании синтеза органических соединений, прогнозировании результатов и дизайне новых типов органических реакций на основе обобщения данных по известным синтетическим превращениям.
Визуализация и исследование химического пространства. Одной из центральных задач хемоинформатики является визуализация и составление карт химического пространства, навигация в нём и выявление неисследованных зон. Анализ химического пространства основан либо на представлении химических объектов (структур и реакций) в виде векторов дескрипторов фиксированного размера, либо на описании химических объектов при помощи молекулярных графов. Для представления химического пространства используются деревья молекулярных остовов.
Молекулярный дизайн химических соединений с заданными свойствами. Одной из важнейших задач хемоинформатики является молекулярный дизайн химических соединений с заданными свойствами. Под этим понимается направленная генерация структур химических соединений (молекулярных графов), которые, в соответствии с моделями, должны обладать набором заранее заданных свойств.
При использовании для этой цели химических моделей QSAR и QSPR, полученных в результате поиска количественных соотношений вида структура–свойство, учёные говорят об «обратном синтезе QSAR» или «обратном синтезе QSPR», либо о решении обратной задачи в проблеме структуры – свойств вещества.
Эти подходы основаны на использовании генераторов молекулярных графов. При использовании физической модели, описывающей взаимодействие лиганд – белок, говорят о методах дизайна химических структур de novo.
Читайте также: