Построить линии уровня функции в excel
В этой статье описаны синтаксис формулы и использование функции LINEST в Microsoft Excel. Ссылки на дополнительные сведения о диаграммах и выполнении регрессионного анализа можно найти в разделе См. также.
Описание
Функция ЛИНЕЙН рассчитывает статистику для ряда с применением метода наименьших квадратов, чтобы вычислить прямую линию, которая наилучшим образом аппроксимирует имеющиеся данные и затем возвращает массив, который описывает полученную прямую. Функцию ЛИНЕЙН также можно объединять с другими функциями для вычисления других видов моделей, являющихся линейными по неизвестным параметрам, включая полиномиальные, логарифмические, экспоненциальные и степенные ряды. Поскольку возвращается массив значений, функция должна задаваться в виде формулы массива. Инструкции приведены в данной статье после примеров.
Уравнение для прямой линии имеет следующий вид:
y = m1x1 + m2x2 +. + b
если существует несколько диапазонов значений x, где зависимые значения y — функции независимых значений x. Значения m — коэффициенты, соответствующие каждому значению x, а b — постоянная. Обратите внимание, что y, x и m могут быть векторами. Функция ЛИНЕЙН возвращает массив . Функция ЛИНЕЙН может также возвращать дополнительную регрессионную статистику.
Синтаксис
ЛИНЕЙН(известные_значения_y; [известные_значения_x]; [конст]; [статистика])
Аргументы функции ЛИНЕЙН описаны ниже.
Синтаксис
Известные_значения_y. Обязательный аргумент. Множество значений y, которые уже известны для соотношения y = mx + b.
Если массив известные_значения_y имеет один столбец, то каждый столбец массива известные_значения_x интерпретируется как отдельная переменная.
Если массив известные_значения_y имеет одну строку, то каждая строка массива известные_значения_x интерпретируется как отдельная переменная.
Известные_значения_x. Необязательный аргумент. Множество значений x, которые уже известны для соотношения y = mx + b.
Массив известные_значения_x может содержать одно или несколько множеств переменных. Если используется только одна переменная, то массивы известные_значения_y и известные_значения_x могут иметь любую форму — при условии, что они имеют одинаковую размерность. Если используется более одной переменной, то известные_значения_y должны быть вектором (т. е. интервалом высотой в одну строку или шириной в один столбец).
Если массив известные_значения_x опущен, то предполагается, что это массив , имеющий такой же размер, что и массив известные_значения_y.
Конст. Необязательный аргумент. Логическое значение, которое указывает, требуется ли, чтобы константа b была равна 0.
Если аргумент конст имеет значение ИСТИНА или опущен, то константа b вычисляется обычным образом.
Если аргумент конст имеет значение ЛОЖЬ, то значение b полагается равным 0 и значения m подбираются таким образом, чтобы выполнялось соотношение y = mx.
Статистика. Необязательный аргумент. Логическое значение, которое указывает, требуется ли вернуть дополнительную регрессионную статистику.
Если статистика имеет true, то LINEST возвращает дополнительную регрессию; в результате возвращается массив .
Если аргумент статистика имеет значение ЛОЖЬ или опущен, функция ЛИНЕЙН возвращает только коэффициенты m и постоянную b.
Дополнительная регрессионная статистика.
Стандартные значения ошибок для коэффициентов m1,m2. mn.
Коэффициент определения. Сравнивает предполагаемые и фактические значения y и диапазоны значений от 0 до 1. Если значение 1, то в выборке будет отличная корреляция— разница между предполагаемым значением y и фактическим значением y не существует. С другой стороны, если коэффициент определения — 0, уравнение регрессии не помогает предсказать значение y. Сведения о том, как вычисляется 2, см. в разделе "Замечания" далее в этой теме.
Стандартная ошибка для оценки y.
F-статистика или F-наблюдаемое значение. F-статистика используется для определения того, является ли случайной наблюдаемая взаимосвязь между зависимой и независимой переменными.
Степени свободы. Степени свободы используются для нахождения F-критических значений в статистической таблице. Для определения уровня надежности модели необходимо сравнить значения в таблице с F-статистикой, возвращаемой функцией ЛИНЕЙН. Дополнительные сведения о вычислении величины df см. ниже в разделе "Замечания". Далее в примере 4 показано использование величин F и df.
Регрессионная сумма квадратов.
Остаточная сумма квадратов. Дополнительные сведения о расчете величин ssreg и ssresid см. в подразделе "Замечания" в конце данного раздела.
На приведенном ниже рисунке показано, в каком порядке возвращается дополнительная регрессионная статистика.
Замечания
Любую прямую можно описать ее наклоном и пересечением с осью y:
Наклон (m):
Чтобы найти наклон линии, обычно записанной как m, возьмите две точки на строке (x1;y1) и (x2;y2); наклон равен (y2 - y1)/(x2 - x1).
Y-перехват (b):
Y-пересечение строки, обычно записанное как b, — это значение y в точке, в которой линия пересекает ось y.
Уравнение прямой имеет вид y = mx + b. Если известны значения m и b, то можно вычислить любую точку на прямой, подставляя значения y или x в уравнение. Можно также воспользоваться функцией ТЕНДЕНЦИЯ.
Если имеется только одна независимая переменная x, можно получить наклон и y-пересечение непосредственно, воспользовавшись следующими формулами:
Наклон:
=ИНДЕКС( LINEST(known_y,known_x's);1)
Y-перехват:
=ИНДЕКС( LINEST(known_y,known_x),2)
Точность аппроксимации с помощью прямой, вычисленной функцией ЛИНЕЙН, зависит от степени разброса данных. Чем ближе данные к прямой, тем более точной является модель ЛИНЕЙН. Функция ЛИНЕЙН использует для определения наилучшей аппроксимации данных метод наименьших квадратов. Когда имеется только одна независимая переменная x, значения m и b вычисляются по следующим формулам:
где x и y — выборочные средние значения, например x = СРЗНАЧ(известные_значения_x), а y = СРЗНАЧ(известные_значения_y).
Функции ЛИННЕСТРОЙ и ЛОГЪЕСТ могут вычислять наилучшие прямые или экспоненциальное кривой, которые подходят для ваших данных. Однако необходимо решить, какой из двух результатов лучше всего подходит для ваших данных. Вы можетевычислить known_y(known_x) для прямой линии или РОСТ(known_y, known_x в) для экспоненциальной кривой. Эти функции без аргумента new_x возвращают массив значений y, спрогнозируемых вдоль этой линии или кривой в фактических точках данных. Затем можно сравнить спрогнозируемые значения с фактическими значениями. Для наглядного сравнения можно отобразить оба этих диаграммы.
Проводя регрессионный анализ, Microsoft Excel вычисляет для каждой точки квадрат разности между прогнозируемым значением y и фактическим значением y. Сумма этих квадратов разностей называется остаточной суммой квадратов (ssresid). Затем Microsoft Excel подсчитывает общую сумму квадратов (sstotal). Если конст = ИСТИНА или значение этого аргумента не указано, общая сумма квадратов будет равна сумме квадратов разностей действительных значений y и средних значений y. При конст = ЛОЖЬ общая сумма квадратов будет равна сумме квадратов действительных значений y (без вычитания среднего значения y из частного значения y). После этого регрессионную сумму квадратов можно вычислить следующим образом: ssreg = sstotal - ssresid. Чем меньше остаточная сумма квадратов по сравнению с общей суммой квадратов, тем больше значение коэффициента определения r 2 — индикатор того, насколько хорошо уравнение, выданное в результате регрессионного анализа, объясняет связь между переменными. Значение r 2 равно ssreg/sstotal.
В некоторых случаях один или несколько столбцов X (предполагается, что значения Y и X — в столбцах) могут не иметь дополнительного прогнозируемого значения при наличии других столбцов X. Другими словами, удаление одного или более столбцов X может привести к одинаковой точности предсказания значений Y. В этом случае эти избыточные столбцы X следует не использовать в модели регрессии. Этот вариант называется "коллинеарность", так как любой избыточный X-столбец может быть выражен как сумма многих не избыточных X-столбцов. Функция ЛИНЕЙН проверяет коллинеарность и удаляет все избыточные X-столбцы из модели регрессии при их идентификации. Удалены столбцы X распознаются в результатах LINEST как имеющие коэффициенты 0 в дополнение к значениям 0 se. Если один или несколько столбцов будут удалены как избыточные, это влияет на df, поскольку df зависит от числа X столбцов, фактически используемых для прогнозирования. Подробные сведения о вычислении df см. в примере 4. Если значение df изменилось из-за удаления избыточных X-столбцов, это также влияет на значения Sey и F. Коллинеарность должна быть относительно редкой на практике. Однако чаще всего возникают ситуации, когда некоторые столбцы X содержат только значения 0 и 1 в качестве индикаторов того, является ли тема в эксперименте участником определенной группы или не является ее участником. Если конст = ИСТИНА или опущен, функция LYST фактически вставляет дополнительный столбец X из всех 1 значений для моделирования перехвата. Если у вас есть столбец с значением 1 для каждой темы, если мальчик, или 0, а также столбец с 1 для каждой темы, если она является женщиной, или 0, последний столбец является избыточным, так как записи в нем могут быть получены из вычитания записи в столбце "самец" из записи в дополнительном столбце всех 1 значений, добавленных функцией LINEST.
Вычисление значения df для случаев, когда столбцы X удаляются из модели вследствие коллинеарности происходит следующим образом: если существует k столбцов известных_значений_x и значение конст = ИСТИНА или не указано, то df = n – k – 1. Если конст = ЛОЖЬ, то df = n - k. В обоих случаях удаление столбцов X вследствие коллинеарности увеличивает значение df на 1.
При вводе константы массива (например, в качестве аргумента известные_значения_x) следует использовать точку с запятой для разделения значений в одной строке и двоеточие для разделения строк. Знаки-разделители могут быть другими в зависимости от региональных параметров.
Следует отметить, что значения y, предсказанные с помощью уравнения регрессии, возможно, не будут правильными, если они располагаются вне интервала значений y, которые использовались для определения уравнения.
Основной алгоритм, используемый в функции ЛИНЕЙН, отличается от основного алгоритма функций НАКЛОН и ОТРЕЗОК. Разница между алгоритмами может привести к различным результатам при неопределенных и коллинеарных данных. Например, если точки данных аргумента известные_значения_y равны 0, а точки данных аргумента известные_значения_x равны 1, то:
Функция ЛИНЕЙН возвращает значение, равное 0. Алгоритм функции ЛИНЕЙН используется для возвращения подходящих значений для коллинеарных данных, и в данном случае может быть найден по меньшей мере один ответ.
Помимо вычисления статистики для других типов регрессии с помощью функции ЛГРФПРИБЛ, для вычисления диапазонов некоторых других типов регрессий можно использовать функцию ЛИНЕЙН, вводя функции переменных x и y как ряды переменных х и у для ЛИНЕЙН. Например, следующая формула:
работает при наличии одного столбца значений Y и одного столбца значений Х для вычисления аппроксимации куба (многочлен 3-й степени) следующей формы:
y = m1*x + m2*x^2 + m3*x^3 + b
Формула может быть изменена для расчетов других типов регрессии, но в отдельных случаях требуется корректировка выходных значений и других статистических данных.
Значение F-теста, возвращаемое функцией ЛИНЕЙН, отличается от значения, возвращаемого функцией ФТЕСТ. Функция ЛИНЕЙН возвращает F-статистику, в то время как ФТЕСТ возвращает вероятность.
Примеры
Пример 1. Наклон и Y-пересечение
Скопируйте образец данных из следующей таблицы и вставьте их в ячейку A1 нового листа Excel. Чтобы отобразить результаты формул, выделите их и нажмите клавишу F2, а затем — клавишу ВВОД. При необходимости измените ширину столбцов, чтобы видеть все данные.
Для начинающих пользователей EXCEL советуем прочитать статью Основы построения диаграмм в MS EXCEL , в которой рассказывается о базовых настройках диаграмм, а также статью об основных типах диаграмм .
При попытке построить диаграмму типа Поверхность на основе одного ряда данных, MS EXCEL может сказать, что ему требуется как минимум 2 ряда. На самом деле, для более или менее наглядной поверхности потребуется как минимум 10 рядов (лучше 20 – для сложных поверхностей). К счастью, ряды не нужно создавать в ручную – достаточно правильно сформировать таблицу с исходными данными.
Построим график функции z=-sin(x*х+y*y)+1 (см. файл примера ).
В качестве источника данных используем таблицу, в которой в верхней строке указаны значения Х, а в левом столбце Y. В остальных ячейках – значения Z для всех пар (Х,Y)
Чтобы значения Z были более информативны - можно использовать Условное форматирование .
Условное форматирование показывает некий вариант изолиний (см. ниже): близкие значения Z выделены одним цветом. Это также позволяет предварительно оценить вид создаваемой диаграммы.
Теперь выделите любую ячейку таблицы и постройте диаграмму типа Поверхность (вкладка Вставка , группа Диаграммы , Кнопка Другие ).
Полученную фигуру можно повращать (кнопка Поворот объемной фигуры на вкладке Макет ).
Для построения диаграммы используется 3 оси: горизонтальная ось (категорий), вертикальная ось (значений), ось Z (рядов значений). Все 3 названия осей требуют пояснения.
Во-первых, ось Z на самом деле является нашей осью Х и отображает имена рядов. Если имена рядов убрать, то изменятся и подписи оси (убрать имена рядов можно нажав кнопку Изменить в окне Выбор источника данных , которое доступно через вкладку Конструктор ).
Этот факт роднит диаграмму Поверхность с Диаграммой График , где по Х отображаются лишь подписи. Т.е. при попытке построить поверхность с неравномерным шагом по Х (например, 1, 2, 5, 9, 77, 103, ..) получим искажения масштаба: значения по Х будут откладываться последовательно 1, 2, 3, … (конечно, Z будет рассчитаны правильно). Интересно, что формат подписей по оси Z можно настроить только изменяя формат ячеек, на которые ссылаются имена рядов (изменение формата на вкладке Число (в окне Формат Оси) ни к чему не приводит).
Во-вторых, по вертикальной оси (значений) на самом деле откладываются значения Z (это очевидно из рисунка).
И, наконец, в-третьих, горизонтальная ось (категорий) – это значения Y (на самом деле опять только подписи). Подписи, как и для Графика можно удалить или изменить нажав кнопку Изменить в окне Выбор источника данных , которое доступно через вкладку Конструктор (на этот раз нужно нажать кнопку расположенную справа).
Так как диаграмма Поверхность – это по сути трехмерный График , в котором одному Х соответствует один Y, то некоторые объемные фигуры отобразить на диаграмме Поверхность не удастся. Например, не удастся отобразить гиперболоид, т.к. каждой паре (Х;Y) на диаграмме Поверхность соответствует только один Z, а для гиперболоида это не так (каждой паре соответствует 2 значения Z). Поэтому, в MS EXCEL придется довольствоваться только половиной гиперболоида.
Как видно из диаграммы, близкие значения Z выделены одним цветом, которые указаны в Легенде. К сожалению, в MS EXCEL невозможно управлять этими уровнями (даже при повороте фигуры количество уровней и диапазоны значений существенно изменяются). Это приводит к тому, что построение изолиний ( линии уровня, контурный график, англ. Contour plot ) реализовано в MS EXCEL в достаточно ограниченном виде: невозможно указать на диаграмме значение изолинии (диапазоны цветов указаны на Легенде), разбиение на диапазоны по Z производится MS EXCEL автоматически и нет возможности на это повлиять. Ниже приведены изолинии для упомянутого выше гиперболоида. Это особый вид диаграммы – Проволочная контурная .
Практически такой же картинки можно добиться простым поворотом фигуры на диаграмме Поверхность .
График функции – графическое представление математического выражения, показывающее его решение. Для построения обычно используются линейные графики с точками, с чем прекрасно справляется Microsoft Excel. Кроме того, в нем еще можно выполнить автоматические расчеты, быстро подставив нужные значения.
Существует огромное количество функций, поэтому в качестве примера я разберу только две самые наглядные, чтобы вы поняли базовые правила составления подобных элементов в таблице.
График функции F(x) = X^2
Функция X^2 – одна из самых популярных математических функций, которую разбирают еще на уроках в школе. На графике необходимо показать точки Y, что в Excel реализовывается следующим образом:
Создайте строку на листе в программе, вписав туда известные значения X.
Сделайте то же самое и с Y. Пока значения этой оси координат неизвестны. Чтобы определить их, нам нужно выполнить простые расчеты.
Поэтому в качестве значения для каждой ячейки укажите формулу, которая посчитает квадрат числа, указанного в строке X. Для этого впишите =A1^2, заменив номер ячейки.
Теперь достаточно зажать левую кнопку мыши на нижней точки готовой ячейки и растянуть таблицу, чтобы формула автоматически подставилась в остальные ячейки, и вы могли сразу ознакомиться с результатом.
Перейдите на вкладку вставки и выберите раздел с рекомендуемыми диаграммами.
В списке отыщите точечную диаграмму, которая подойдет для составления подходящего графика.
Вставьте ее в таблицу и ознакомьтесь с результатом. На следующем скриншоте вы видите параболу и значения X, при которых она получилась правильной (такую часто показывают в примерах на математике).
Всего 7 простых шагов потребовалось для достижения желаемого результата. Вы можете подставлять свои значения в таблицу и изменять их в любое время, следя за тем, как перестраивается график функций.
График функции y=sin(x)
y=sin(x) – вторая функция, которую мы возьмем за пример. Может показаться, что ее составление осуществляется сложнее, хотя на самом деле это не так. Дело в том, что Excel сам посчитает значения, а вам останется только задать известные числа и вставить простой линейный график для вывода результатов на экран.
Если вам будет проще, впишите в отдельную клетку функцию, укажите интервал и шаг. Так вы не запутаетесь при дальнейшем заполнении ячеек.
Добавьте два столбца, в которые будут вписаны значения каждой оси. Это нужно не только для обозначения чисел, но и для их вычисления при помощи функций программы.
Начните вписывать значения X с необходимым интервалом и шагом. Кстати, вы можете заполнить всего несколько полей, а затем растянуть клетки таким же образом, как было показано в предыдущем примере, чтобы они подставились автоматически до конца вашего интервала.
Теперь более сложное, но не страшное действие – определение значения Y. Понятно, что он равняется синусу X, значит, нужно вписать функцию =SIN(A1), где вместо A1 используйте нужную ячейку, а затем растяните функцию на оставшийся интервал.
На следующем скриншоте вы видите результат заполнения таблицы. Используйте округление для удаления лишних знаков после запятой.
Вставьте обычную линейчатую диаграмму и ознакомьтесь с результатом.
На примере этих двух функций уже можно понять, как работает построение графиков в Экселе. При использовании других функций просто учитывайте особенности заполнения ячеек и не забывайте о том, что вам не нужно ничего считать, поскольку Excel все сделает за вас после указания необходимой формулы.
Чтобы правильно построить линейный график функций в Excel необходимо выбрать точечную диаграмму с прямыми отрезками и маркерами. Естественно это не единственный, но весьма быстрый и удобный способ.
Для разного рода данных нужно использовать разные типы графиков. Убедимся в этом, разобрав практический пример с построением математического графика функций в Excel.
Построение графиков функций в Excel
Начнем из анализа и создания графика функций в Excel. Мы убедимся в том, что линейный график в Excel существенно отличается от графика линейной функции, который преподают в школе.
Линейная функция x=y имеет следующие значения: x1=0, x2=1, x3=7. Заполните таблицу этими значениями как показано на рисунке:
Выделите диапазон A1:B4 и выберите инструмент: «Вставка»-«Диаграммы»-«График»-«График с маркерами».
В результате у нас созданы 2 линии на графике, которые наложены одна сверх другой. Так же мы видим, что линии сломаны, а значит, они не соответствуют презентации школьному графику линейной функции. Излом линий, получается, по причине того, что на оси X у нас после значений: 0, 1 сразу идет значение 7 (упущены 2,3,4,5,6).
Вывод один: данный способ графического построения данных нам не подходит. А значит щелкните по нему левой кнопкой мышки (чтобы сделать его активным) и нажмите клавишу DELETE на клавиатуре, чтобы удалить его.
Как построить график линейной функции в Excel
Чтобы создать правильный график функций в Excel выберите подходящий график.
Выделите диапазон A1:B4 и выберите инструмент: «Вставка»-«Диаграммы»-«Точечная»-«Точечная с прямыми отрезками и маркерами».
Как видно на рисунке данный график содержит одинаковое количество значений на осях X и Y. По умолчанию в шаблоне данного графика цена делений оси X равна 2. При необходимости ее можно изменить. Для этого:
- наведите курсор мышки на любое значение оси X чтобы появилась всплывающая подсказка «Горизонтальная ось (значений)» и сделайте двойной щёлочек левой кнопкой мышки;
- в появившемся окне «Формат оси» выберите пункт опции: «Параметры оси»-«цена основных делений»-«фиксированное» и установите значение 1 вместо 2.
- нажмите на кнопку «Закрыть».
Теперь у нас отображается одинаковое количество значений по всем осям.
Очень важно понимать разницу в предназначениях графиков Excel. В данном примере мы видим, что далеко не все графики подходят для презентации математических функций.
Примечание. В принципе первый способ можно было-бы оптимизировать под отображение линейной функции, если таблицу заполнить всеми значениями 0-7. Но это не всегда работающее решение, особенно в том случае если вместо значений будут формулы изменяющие данные. Одним словом если нужно забить гвоздь лучше взять молоток, чем микроскоп. Несмотря на то, что теоретически гвозди можно забивать и микроскопом.
Не существует универсальных графиков и диаграмм, которыми можно отобразить любой отчет. Для каждого типа отчета наиболее подходящее то или иное графическое представление данных. Выбор зависит от того что и как мы хотим презентовать. На следующих примерах вы убедитесь, что выбор имеет большое значение. Существует даже целая наука «Инфографика», которая учит лаконично презентовать информацию с максимальным использованием графики вместо текста, насколько это только возможно.
Читайте также: