Как сделать нормировку функции
Data Preparation: полет нормальный – что такое нормализация данных и зачем она нужна
Data Preparation: полет нормальный – что такое нормализация данных и зачем она нужна
Нормализация данных – это одна из операций преобразования признаков (Feature Transformation), которая выполняется при их генерации (Feature Engineering) на этапе подготовки данных (Data Preparation). В этой статье мы расскажем, почему необходимо нормализовать значения переменных перед тем, как запустить моделирование для интеллектуального анализа данных (Data Mining).
Что такое нормализация данных и чем она отличается от нормировки и нормирования
В случае машинного обучения (Machine Learning), нормализация – это процедура предобработки входной информации (обучающих, тестовых и валидационных выборок, а также реальных данных), при которой значения признаков во входном векторе приводятся к некоторому заданному диапазону, например, [0…1] или [-1…1] [1].
Следует отличать понятия нормализации, нормировки и нормирования.
Нормировка – это корректировка значений в соответствии с некоторыми функциями преобразования, с целью сделать их более удобными для сравнения. Например, разделив набор измерений о росте людей в дюймах на 2.54, мы получим значение роста в метрической системе.
Нормировка данных требуется, когда несовместимость единиц измерений переменных может отразиться на результатах и рекомендуется, когда итоговые отчеты могут быть улучшены, если выразить результаты в определенных понятных/совместимых единицах. Например, время реакции, записанное в миллисекундах, легче интерпретировать, чем число тактов процессора, в которых были получены данные эксперимента [2].
Нормирование – это процесс установления предельно допустимых или оптимальных нормативных значений в прикладных сферах деятельности, например, нормирование труда. Как правило, нормы разрабатываются по результатам исследовательских, проектных или научных работ, а также на основе экспертных оценок [3].
Зачем нормализовать датасет для Data Mining и Machine Learning
Необходимость нормализации выборок данных обусловлена природой используемых алгоритмов и моделей Machine Learning. Исходные значения признаков могут изменяться в очень большом диапазоне и отличаться друг от друга на несколько порядков. Предположим, датасет содержит сведения о концентрации действующего вещества, измеряемой в десятых или сотых долях процентов, и показатели давления в сотнях тысяч атмосфер. Или, например, в одном входном векторе присутствует информация о возрасте и доходе клиента.
Будучи разными по физическому смыслу, данные сильно различаются между собой по абсолютным величинам [4]. Работа аналитических моделей машинного обучения (нейронных сетей, карт Кохонена и т.д.) с такими показателями окажется некорректной: дисбаланс между значениями признаков может вызвать неустойчивость работы модели, ухудшить результаты обучения и замедлить процесс моделирования. В частности, параметрические методы машинного обучения (нейронные сети, растущие деревья) обычно требуют симметричного и унимодального распределения данных. Популярный метод ближайших соседей, часто используемый в задачах классификации и иногда в регрессионном анализе, также чувствителен к диапазону изменений входных переменных [5].
После нормализации все числовые значения входных признаков будут приведены к одинаковой области их изменения – некоторому узкому диапазону. Это позволит свести их вместе в одной модели Machine Learning [4] и обеспечит корректную работу вычислительных алгоритмов [1].
Практическим приемам Feature Transformation посвящена наша следующая статья, где мы рассказываем, как именно выполняется нормализация данных: формулы, методы и средства. Все эти и другие вопросы Data Preparation рассматриваются в нашем новом курсе обучения для аналитиков Big Data: подготовка данных для Data Mining. Оставайтесь с нами!
В соответствии с корпускулярно -- волновым дуализмом в квантовой физике состояние частицы описывается при помощи волновой функции ($\psi (\overrightarrow,t)$- пси-функция).
Волновая функция -- это функция, которая используется в квантовой механике. Она описывает состояние системы, которая имеет размеры в пространстве. Она является вектором состояния.
Данная функция является комплексной и формально имеет волновые свойства. Движение любой частицы микромира определено вероятностными законами. Распределение вероятности выявляется при проведении большого числа наблюдений (измерений) или большого количества частиц. Полученное распределение аналогично распределению интенсивности волны. То есть в местах с максимальной интенсивностью отмечено максимальное количество частиц.
Набор аргументов волновой функции определяет ее представление. Так, возможно координатное представление: $\psi(\overrightarrow,t)$, импульсное представление: $\psi'(\overrightarrow
,t)$ и т.д.
В квантовой физике целью ставится не точность предсказания события, а оценка вероятности того или иного события. Зная величину вероятности, находят средние значения физических величин. Волновая функция позволяет находить подобные вероятности.
Так вероятность присутствия микрочастицы в объеме dV в момент времени t может быть определена как:
где $\psi^*$- комплексно сопряженная функция к функции $\psi.$ Плотность вероятности (вероятность в единице объёма) равна:
Вероятность является величиной, которую можно наблюдать в эксперименте. В это же время волновая функция не доступна для наблюдения, так как она является комплексной (в классической физике параметры, которые характеризуют состояние частицы, доступны для наблюдения).
Условие нормировки $\psi$- функции
Волновая функция определена с точностью до произвольного постоянного множителя. Данный факт не оказывает влияния на состояние частицы, которую $\psi$- функция описывает. Однако волновую функцию выбирают таким образом, что она удовлетворяет условию нормировки:
Готовые работы на аналогичную тему
где интеграл берут по всему пространству или по области, в которой волновая функция не равна нулю. Условие нормировки (2) значит то, что во всей области, где $\psi\ne 0$ частица достоверно присутствует. Волновую функцию, которая подчинятся условию нормировки, называют нормированной. Если $<\left|\psi\right|>^2=0$, то данное условие означает, что частицы в исследуемой области наверняка нет.
Нормировка вида (2) возможна при дискретном спектре собственных значений.
Условие нормировки может оказаться не осуществимым. Так, если $\psi$ -- функция является плоской волной де-Бройля и вероятность нахождения частицы является одинаковой для всех точек пространства. Данные случаи рассматривают как идеальную модель, в которой частица присутствует в большой, но имеющей ограничения области пространства.
Принцип суперпозиции волновой функции
Данный принцип является одним их основных постулатов квантовой теории. Его смысл в следующем: если для некоторой системы возможны состояния, описываемые волновыми функциями $\psi_1\ \ $ $\psi_2$, то для этой системы существует состояние:
где $C_и\ C_2$ -- постоянные коэффициенты. Принцип суперпозиции подтверждается эмпирически.
Можно говорить о сложении любого количества квантовых состояний:
где $<\left|C_n\right|>^2$ -- вероятность того, что система обнаруживается в состоянии, которое описывается волновой функцией $\psi_n.$ Для волновых функций, подчиненных условию нормировки (2) выполняется условие:
Стационарные состояния
В квантовой теории особую роль имеют стационарные состояния (состояния в которых все наблюдаемые физические параметры не изменяются во времени). (Сама волновая функция принципиально не наблюдаема). В стационарном состоянии $\psi$- функция имеет вид:
где $\omega =\frac<\hbar >$, $\psi\left(\overrightarrow\right)$ не зависит от времени, $E$- энергия частицы. При виде (3) волновой функции плотность вероятности ($P$) является постоянной времени:
Из физических свойств стационарных состояний следуют математические требования к волновой функции $\psi\left(\overrightarrow\right)\to \ (\psi(x,y,z))$.
Математические требования к волновой функции для стационарных состояний
$\psi\left(\overrightarrow\right)$- функция должна быть во всех точках:
- непрерывна,
- однозначна,
- конечна.
Если потенциальная энергия имеет поверхность разрыва, то на подобных поверхностях функция $\psi\left(\overrightarrow\right)$ и ее первая производная должны оставаться непрерывными. В области пространства, где потенциальная энергия становится бесконечной, $\psi\left(\overrightarrow\right)$ должна быть равна нулю. Непрерывность функции $\psi\left(\overrightarrow\right)$ требует, чтобы на любой границе этой области $\psi\left(\overrightarrow\right)=0$. Условие непрерывности накладывается на частные производные от волновой функции ($\frac<\partial \psi><\partial x>,\ \frac<\partial \psi><\partial y>,\frac<\partial \psi><\partial z>$).
Решение:
Запишем условие нормировки для нашего случая в виде:
где $dV=4\pi r^2dr$ (см.рис.1 Из условий понятно, что задача обладает сферической симметрией). Из условий задачи имеем:
Подставим $dV$ и волновые функции (1.2) в условие нормировки:
Проведем интегрирование в левой части:
Из формулы (1.4) выразим искомый коэффициент:
Задание: Каково наиболее вероятное расстояние ($r_B$) электрона от ядра, если волновая функция, которая описывает основное состояние электрона в атоме водорода может быть определена как: $\psi=Ae^/>$, где $r$- расстояние от электрона до ядра, $a$ -- первый Боровский радиус?
Решение:
Используем формулу, которая определяет вероятность присутствия микрочастицы в объеме $dV$ в момент времени $t$:
где $dV=4\pi r^2dr.\ $Следователно, имеем:
В таком случае, $p=\frac$ запишем как:
Для определения наиболее вероятного расстояния производную $\frac$ приравняетм к нулю:
Функция НОРМАЛИЗАЦИЯ в Excel предназначена для нахождения нормализованного значения некоторой величины из распределения, характеризующегося известными показателями стандартного отклонения и среднего.
Примеры использования функции НОРМАЛИЗАЦИЯ в Excel
Значение, определяемое функцией НОРМАЛИЗАЦИЯ, используется для вычисления вероятности нахождения некоторой величины в диапазоне значений. Эту вероятность можно рассчитать в Excel с помощью функции НОРМ.СТ.РАСП. Таким образом, эти функции имеют следующую взаимосвязь: =НОРМ.СТ.РАСП(НОРМАЛИЗАЦИЯ(аргументы)).
Таким образом, функция НОРМАЛИЗАЦИЯ может быть использована для преобразования нормального распределения к стандартному нормальному. У такого распределения дисперсия равна 1, а математическое ожидание – 0. Таким образом, рассматриваемая функция использует следующий алгоритм вычислений:
- Z – вычисляемая величина, распределенная по стандартному нормальному закону;
- x - исходное значение;
- M – математическое ожидание;
- D – дисперсия.
Пример 1. Определить вероятность того, что некоторая величина, которая распределена по нормальному закону, меньше или равна значению 5. Для ряда значений этой величины известны следующие показатели: среднее – 1,7, стандартное отклонение – 2,4.
Вид таблицы данных:
Для нахождения вероятности используем следующую формулу:
Для вычисления вероятности вхождения в диапазон ( Пример 2. Данные о прочности изделий из исследуемой партии приведены в таблице Excel. Определить вероятность того, что потребитель купит партию изделий, прочность которых будет равна 20 Мпа или превысит это значение.
Вид таблицы данных:
Для нахождения вероятности используем следующую формулу:
С помощью функции НОРМ.СТ.РАСП определяем вероятность того, что прочность изделий из партии не будет соответствовать условию (больше 20Мпа). Поэтому искомое значение получаем в виде разности 1 и найденной вероятности. Для определения среднего значения и стандартного отклонений для исследуемого ряда используем функции СРЗНАЧ и СТАНДОТКЛОН.В соответственно.
Волновая функция - это функция состояния электрона (электронов или других элементарных частиц), которая полностью определяет динамические свойства системы. Волновая функция зависит от координат и времени. В общем виде функция состояния системы (волновая функция) записывается в следующем виде
Часто зависимость от времени исключают (Y(q1, q2 . qn)). Здесь аргументы q1, q2 . qn есть координаты пространства и проекция спина одной или нескольких микрочастиц. При этом в отличие от классической механики координаты xi, yi, zi рассматриваются не как функция времени, а как независимые переменные. В квантовой механике волновую функцию находят путем решения волнового уравнения (в частности уравнения Шредингера). При этом применяют только регулярные функции, т.е. функции, подчиняющиеся следующим условиям:
1. Конечность во всем пространстве. В противном случае невозможно определить параметры системы в тех точках, где волновая функция обращается в бесконечность.
2. Однозначность. В любой точке пространства функция принимает одно единственное значение.
3. Непрерывность. Нет разрывов. Функция определена при любых значения аргументов.
В качестве примера рассмотрим волновую функцию для свободного электрона, которая описывает состояние плоской монохроматической волны, распространяющуюся вдоль координаты X
Y = (1.1)
где l - длина волны, n - частота. В зависимости от начальных граничных условий вместо sin может быть cos. В случае стоячей волны вид функции принимает вид
Y= или Y= . (1.2)
В приведенных записях учитывается как положение в пространстве, так и зависимость от времени. В дальнейшем мы будем иметь дело только с функциями, не зависимыми от времени.
В квантовой механике волновая функция представляет собой амплитуду распределения вероятности положения частицы (аналог амплитуды для волнового движения в классической механике). Вероятность найти частицу около точки x - =, а в объеме dt - .
Отметим некоторые свойства волновых функций. Так, если Y - решение волнового уравнения, то и Y1 = СY (где С - константа) является решением этого волнового уравнения.
Другим свойством волновой функции является принцип суперпозиции. Если система может находиться в состояниях, описываемых волновыми функциями Y1 и Y2 (решения волнового уравнения), то она может находиться и в состоянии Y = aY1 + bY2. где a и b простые числа (т.е. Y также решение исходного уравнения). Это легко показать подстановкой новой волной функции в исходное волновое уравнение.
Примером принципа суперпозиции является волновая функция свободного электрона
Y = A( + ) = A. (1.3)
Используя принцип суперпозиции можно получить волновые функции для p-состояния атома (три независимые друг от друга функции).
Y+1 = (x + iy); (1.4)
Y-1 = (x - iy); (1.5)
Yo = z, (1.6)
где - сферически симметричная волновая функция (соответствует s-состоянию атома). = e -ar .
При расчётах в квантовой химии используют нормированные волновые функции. Нормировка волновой функции заключается в определении нормировочного множителя (множителей). Произведём нормировку волновой функции, соответствующей s-электрону в атоме, Y = , т.е. определим множитель С.
Условие нормировки: .
; ==
=
; .
4. Ортогональность волновых функций. Важным свойством волновых функций, используемых в квантовой химии, является их ортогональность.
Условие ортогональности имеет вид:
. (1.7)
Читайте также: