Как аппроксимировать график в excel
Функция ЛГРФПРИБЛ в Excel предназначена для определения значений, на основе которых может быть построена экспоненциальная кривая, аппроксимирующая имеющиеся числовые данные, и возвращает массив значений. Для корректной работы рассматриваемой функции ее следует вводить как формулу массива.
Методы аппроксимации табличных данных в Excel
Функция ЛГРФПРИБЛ возвращает данные, необходимые для построения кривой, описываемой следующим уравнением:
Если имеется две и более переменных, это уравнение переписывается следующим образом:
Возвращаемые рассматриваемой функцией данные представляют собой следующий массив:
То есть, имеем массив оснований, возводимых в степени (известные значения переменных x), и коэффициент b.
Пример 1. В таблице приведены данные, характеризующие динамику курса доллара на протяжении 10 лет (с 2006 по 2016 год). Необходимо спрогнозировать курс доллара на 2019 год на основании имеющихся данных.
Вид таблицы данных:
Для расчета тренда (коэффициент, используемый для предсказания последующих значений курса) используем функцию:
- B2:B12 – известные данные зависимой переменной (значения курса);
- A2:A12 – известные данные независимой переменной (года).
Для предсказания курса на 2019 год используем формулу:
Как видно, полученное значение имеет небольшую степень достоверности. Использование данного типа аппроксимации для предсказания курса валют нерационально.
Прогнозирование финансовых результатов методом аппроксимации в Excel
Пример 2. В таблице имеются данные о зарплатах за прошедший год (помесячно). Определить оптимальный способ предсказания размеров зарплат для последующих периодов.
Вид таблицы данных:
Определим коэффициенты достоверности аппроксимации для линейной и экспоненциальной функций с помощью следующих функций (вводить как формулы массива CTRL+SHIFT+Enter):
Поскольку обе функции возвращают результат в виде массива данных, в котором в третьей строке первого столбца содержится искомое значение R^2, используем функцию ИНДЕКС для возврата желаемого результата.
Чем ближе значение R^2 к 1, тем выше точность аппроксимации. Как видно, наибольшую точность обеспечивает экспоненциальная функция. Однако разница не является существенной, поэтому использование функции ЛИНЕЙН является допустимым в данном случае.
Правила метода аппроксимации по функции ЛГРФПРИБЛ в Excel
Функция имеет следующую синтаксическую запись:
=ЛГРФПРИБЛ( известные_значения_y; [известные_значения_x];[конст];[статистика])
Одним из показателей, описывающих качество построенной модели в статистике, является коэффициент детерминации (R^2), который ещё называют величиной достоверности аппроксимации. С его помощью можно определить уровень точности прогноза. Давайте узнаем, как можно произвести расчет данного показателя с помощью различных инструментов программы Excel.
Вычисление коэффициента детерминации
В зависимости от уровня коэффициента детерминации, принято разделять модели на три группы:
В последнем случае качество модели говорит о невозможности её использования для прогноза.
Выбор способа вычисления указанного значения в Excel зависит от того, является ли регрессия линейной или нет. В первом случае можно использовать функцию КВПИРСОН, а во втором придется воспользоваться специальным инструментом из пакета анализа.
Способ 1: вычисление коэффициента детерминации при линейной функции
Прежде всего, выясним, как найти коэффициент детерминации при линейной функции. В этом случае данный показатель будет равняться квадрату коэффициента корреляции. Произведем его расчет с помощью встроенной функции Excel на примере конкретной таблицы, которая приведена ниже.
- Выделяем ячейку, где будет произведен вывод коэффициента детерминации после его расчета, и щелкаем по пиктограмме «Вставить функцию».
Синтаксис этого оператора такой:
Таким образом, функция имеет два оператора, один из которых представляет собой перечень значений функции, а второй – аргументов. Операторы могут быть представлены, как непосредственно в виде значений, перечисленных через точку с запятой (;), так и в виде ссылок на диапазоны, где они расположены. Именно последний вариант и будет использован нами в данном примере.
Устанавливаем курсор в поле «Известные значения y». Выполняем зажим левой кнопки мышки и производим выделение содержимого столбца «Y» таблицы. Как видим, адрес указанного массива данных тут же отображается в окне.
Аналогичным образом заполняем поле «Известные значения x». Ставим курсор в данное поле, но на этот раз выделяем значения столбца «X».
Способ 2: вычисление коэффициента детерминации в нелинейных функциях
Но указанный выше вариант расчета искомого значения можно применять только к линейным функциям. Что же делать, чтобы произвести его расчет в нелинейной функции? В Экселе имеется и такая возможность. Её можно осуществить с помощью инструмента «Регрессия», который является составной частью пакета «Анализ данных».
-
Но прежде, чем воспользоваться указанным инструментом, следует активировать сам «Пакет анализа», который по умолчанию в Экселе отключен. Перемещаемся во вкладку «Файл», а затем переходим по пункту «Параметры».
Около параметров «Метка» и «Константа-ноль» флажки не ставим. Флажок можно установить около параметра «Уровень надежности» и в поле напротив указать желаемую величину соответствующего показателя (по умолчанию 95%).
В группе «Параметры вывода» нужно указать, в какой области будет отображаться результат вычисления. Существует три варианта:
- Область на текущем листе;
- Другой лист;
- Другая книга (новый файл).
Остановим свой выбор на первом варианте, чтобы исходные данные и результат размещались на одном рабочем листе. Ставим переключатель около параметра «Выходной интервал». В поле напротив данного пункта ставим курсор. Щелкаем левой кнопкой мыши по пустому элементу на листе, который призван стать левой верхней ячейкой таблицы вывода итогов расчета. Адрес данного элемента должен высветиться в поле окна «Регрессия».
Способ 3: коэффициент детерминации для линии тренда
Кроме указанных выше вариантов, коэффициент детерминации можно отобразить непосредственно для линии тренда в графике, построенном на листе Excel. Выясним, как это можно сделать на конкретном примере.
-
Мы имеем график, построенный на основе таблицы аргументов и значений функции, которая была использована для предыдущего примера. Произведем построение к нему линии тренда. Кликаем по любому месту области построения, на которой размещен график, левой кнопкой мыши. При этом на ленте появляется дополнительный набор вкладок – «Работа с диаграммами». Переходим во вкладку «Макет». Клацаем по кнопке «Линия тренда», которая размещена в блоке инструментов «Анализ». Появляется меню с выбором типа линии тренда. Останавливаем выбор на том типе, который соответствует конкретной задаче. Давайте для нашего примера выберем вариант «Экспоненциальное приближение».
Например, для нашего случая опытным путем удалось установить, что самый высокий уровень достоверности имеет полиномиальный тип линии тренда второй степени. Коэффициент детерминации в данном случае равен 1. Это говорит о том, что указанная модель абсолютно достоверная, что означает полное исключение погрешностей.
В Экселе существуют два основных варианта вычисления коэффициента детерминации: использование оператора КВПИРСОН и применение инструмента «Регрессия» из пакета инструментов «Анализ данных». При этом первый из этих вариантов предназначен для использования только в процессе обработки линейной функции, а другой вариант можно использовать практически во всех ситуациях. Кроме того, существует возможность отображения коэффициента детерминации для линии трендов графиков в качестве величины достоверности аппроксимации. С помощью данного показателя имеется возможность определить тип линии тренда, который располагает самым высоким уровнем достоверности для конкретной функции.
Отблагодарите автора, поделитесь статьей в социальных сетях.
Помогла ли вам эта статья?
Еще статьи по данной теме:
получены по формуле .y=x+sinx
Берем модель y=a+bx и находим
ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R 0,986714919
R-квадрат 0,973606331
Нормированный R-квадрат 0,971576049
Стандартная ошибка 0,765569136
Наблюдения 1 5
Дисперсионный анализ
df SS MS F Значимость F
Регрессия 1 281,0579051 281,0579051 479,5423556 1,20615E-11
Остаток 13 7,619249319 0,586096101
Итого 14 288,6771544
Коэффициенты Стандартная ошибка t-статистика P-Значение
Y-пересечение 0,113947 0,415978241 0,273925746 0,788445813
Переменная X 1,001887 0,045751507 21,89845555 1,20615E-11
P-Значение показывает, что константу надо обнулить a=0 . Снова обращаемся к Регрессии
ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R 0,997002
R-квадрат 0,994013
Нормированный R-квадрат 0,922584
Стандартная ошибка 0,739847
Наблюдения 15
Дисперсионный анализ
df SS MS F Значимость F
Регрессия 1 1272,235 1272,235 2324,254 4,8053E-16
Остаток 14 7,663227 0,547373
Итого 15 1279,898 ? и здесь напахали TSS=288,6771544 и не должно меняться от вида модели.
То, что называется «приплыли»:
R*-квадрат 0,994013 > 0,9736; F*=2324,254 > 479,542.
Однако, основной показатель RSS=7,619 < SSR*=7,663 говорит, что первоначальная модель, все-таки точнее (в смысле МНК).
Могу предположить, что разработчики Регрессии не учли, что при насильственном изменении модели, Теорема о 3-х дисперсиях не выполняется: TSS 288,6771544 > )
У меня не вопрос. А благодарность разработчикам сайта. Спасибо за понятные и доступные разъяснения при построении требуемых данных.
Задайте вопрос или оставьте свое мнение Отменить комментарий
Прогнозирование – это очень важный элемент практически любой сферы деятельности, начиная от экономики и заканчивая инженерией. Существует большое количество программного обеспечения, специализирующегося именно на этом направлении. К сожалению, далеко не все пользователи знают, что обычный табличный процессор Excel имеет в своем арсенале инструменты для выполнения прогнозирования, которые по своей эффективности мало чем уступают профессиональным программам. Давайте выясним, что это за инструменты, и как сделать прогноз на практике.
Процедура прогнозирования
Целью любого прогнозирования является выявление текущей тенденции, и определение предполагаемого результата в отношении изучаемого объекта на определенный момент времени в будущем.
Способ 1: линия тренда
Одним из самых популярных видов графического прогнозирования в Экселе является экстраполяция выполненная построением линии тренда.
Попробуем предсказать сумму прибыли предприятия через 3 года на основе данных по этому показателю за предыдущие 12 лет.
-
Строим график зависимости на основе табличных данных, состоящих из аргументов и значений функции. Для этого выделяем табличную область, а затем, находясь во вкладке «Вставка», кликаем по значку нужного вида диаграммы, который находится в блоке «Диаграммы». Затем выбираем подходящий для конкретной ситуации тип. Лучше всего выбрать точечную диаграмму. Можно выбрать и другой вид, но тогда, чтобы данные отображались корректно, придется выполнить редактирование, в частности убрать линию аргумента и выбрать другую шкалу горизонтальной оси.
- Линейная;
- Логарифмическая;
- Экспоненциальная;
- Степенная;
- Полиномиальная;
- Линейная фильтрация.
Давайте для начала выберем линейную аппроксимацию.
Способ 2: оператор ПРЕДСКАЗ
Экстраполяцию для табличных данных можно произвести через стандартную функцию Эксель ПРЕДСКАЗ. Этот аргумент относится к категории статистических инструментов и имеет следующий синтаксис:
«X» – это аргумент, значение функции для которого нужно определить. В нашем случае в качестве аргумента будет выступать год, на который следует произвести прогнозирование.
Естественно, что в качестве аргумента не обязательно должен выступать временной отрезок. Например, им может являться температура, а значением функции может выступать уровень расширения воды при нагревании.
При вычислении данным способом используется метод линейной регрессии.
Давайте разберем нюансы применения оператора ПРЕДСКАЗ на конкретном примере. Возьмем всю ту же таблицу. Нам нужно будет узнать прогноз прибыли на 2018 год.
-
Выделяем незаполненную ячейку на листе, куда планируется выводить результат обработки. Жмем на кнопку «Вставить функцию».
В поле «Известные значения y» указываем координаты столбца «Прибыль предприятия». Это можно сделать, установив курсор в поле, а затем, зажав левую кнопку мыши и выделив соответствующий столбец на листе.
Аналогичным образом в поле «Известные значения x» вносим адрес столбца «Год» с данными за прошедший период.
Но не стоит забывать, что, как и при построении линии тренда, отрезок времени до прогнозируемого периода не должен превышать 30% от всего срока, за который накапливалась база данных.
Способ 3: оператор ТЕНДЕНЦИЯ
Для прогнозирования можно использовать ещё одну функцию – ТЕНДЕНЦИЯ. Она также относится к категории статистических операторов. Её синтаксис во многом напоминает синтаксис инструмента ПРЕДСКАЗ и выглядит следующим образом:
=ТЕНДЕНЦИЯ(Известные значения_y;известные значения_x; новые_значения_x;[конст])
Как видим, аргументы «Известные значения y» и «Известные значения x» полностью соответствуют аналогичным элементам оператора ПРЕДСКАЗ, а аргумент «Новые значения x» соответствует аргументу «X» предыдущего инструмента. Кроме того, у ТЕНДЕНЦИЯ имеется дополнительный аргумент «Константа», но он не является обязательным и используется только при наличии постоянных факторов.
Данный оператор наиболее эффективно используется при наличии линейной зависимости функции.
Посмотрим, как этот инструмент будет работать все с тем же массивом данных. Чтобы сравнить полученные результаты, точкой прогнозирования определим 2019 год.
-
Производим обозначение ячейки для вывода результата и запускаем Мастер функций обычным способом. В категории «Статистические» находим и выделяем наименование «ТЕНДЕНЦИЯ». Жмем на кнопку «OK».
Способ 4: оператор РОСТ
Ещё одной функцией, с помощью которой можно производить прогнозирование в Экселе, является оператор РОСТ. Он тоже относится к статистической группе инструментов, но, в отличие от предыдущих, при расчете применяет не метод линейной зависимости, а экспоненциальной. Синтаксис этого инструмента выглядит таким образом:
=РОСТ(Известные значения_y;известные значения_x; новые_значения_x;[конст])
Как видим, аргументы у данной функции в точности повторяют аргументы оператора ТЕНДЕНЦИЯ, так что второй раз на их описании останавливаться не будем, а сразу перейдем к применению этого инструмента на практике.
-
Выделяем ячейку вывода результата и уже привычным путем вызываем Мастер функций. В списке статистических операторов ищем пункт «РОСТ», выделяем его и щелкаем по кнопке «OK».
Способ 5: оператор ЛИНЕЙН
Оператор ЛИНЕЙН при вычислении использует метод линейного приближения. Его не стоит путать с методом линейной зависимости, используемым инструментом ТЕНДЕНЦИЯ. Его синтаксис имеет такой вид:
=ЛИНЕЙН(Известные значения_y;известные значения_x; новые_значения_x;[конст];[статистика])
Последние два аргумента являются необязательными. С первыми же двумя мы знакомы по предыдущим способам. Но вы, наверное, заметили, что в этой функции отсутствует аргумент, указывающий на новые значения. Дело в том, что данный инструмент определяет только изменение величины выручки за единицу периода, который в нашем случае равен одному году, а вот общий итог нам предстоит подсчитать отдельно, прибавив к последнему фактическому значению прибыли результат вычисления оператора ЛИНЕЙН, умноженный на количество лет.
-
Производим выделение ячейки, в которой будет производиться вычисление и запускаем Мастер функций. Выделяем наименование «ЛИНЕЙН» в категории «Статистические» и жмем на кнопку «OK».
Как видим, прогнозируемая величина прибыли, рассчитанная методом линейного приближения, в 2019 году составит 4614,9 тыс. рублей.
Способ 6: оператор ЛГРФПРИБЛ
Последний инструмент, который мы рассмотрим, будет ЛГРФПРИБЛ. Этот оператор производит расчеты на основе метода экспоненциального приближения. Его синтаксис имеет следующую структуру:
= ЛГРФПРИБЛ (Известные значения_y;известные значения_x; новые_значения_x;[конст];[статистика])
Как видим, все аргументы полностью повторяют соответствующие элементы предыдущей функции. Алгоритм расчета прогноза немного изменится. Функция рассчитает экспоненциальный тренд, который покажет, во сколько раз поменяется сумма выручки за один период, то есть, за год. Нам нужно будет найти разницу в прибыли между последним фактическим периодом и первым плановым, умножить её на число плановых периодов (3) и прибавить к результату сумму последнего фактического периода.
-
В списке операторов Мастера функций выделяем наименование «ЛГРФПРИБЛ». Делаем щелчок по кнопке «OK».
Прогнозируемая сумма прибыли в 2019 году, которая была рассчитана методом экспоненциального приближения, составит 4639,2 тыс. рублей, что опять не сильно отличается от результатов, полученных при вычислении предыдущими способами.
Мы выяснили, какими способами можно произвести прогнозирование в программе Эксель. Графическим путем это можно сделать через применение линии тренда, а аналитическим – используя целый ряд встроенных статистических функций. В результате обработки идентичных данных этими операторами может получиться разный итог. Но это не удивительно, так как все они используют разные методы расчета. Если колебание небольшое, то все эти варианты, применимые к конкретному случаю, можно считать относительно достоверными.
Отблагодарите автора, поделитесь статьей в социальных сетях.
Для удобного и наглядного отображения числовых данных в программах MS Excel и Ooo Calc есть замечательный инструмент — «Мастер диаграмм». Работать с инструментом просто и, как говорится, интуитивно понятно. Пройдя несколько раз процедуру создания диаграмм.
. вы поймете и запомните навсегда, как строить графики в Excel. Поняв, как и что нужно делать в Excel, вы легко затем по аналогии сможете при желании сделать график или диаграмму в программе Calc — процедуры разнятся незначительно.
Типов диаграмм очень много — гистограмма, линейчатая, круговая, пузырьковая, сетчатая, биржевая… В MS Excel 2003 – 34 типа и у каждого типа еще по нескольку вариантов. Для решения различных задач визуализации отображения данных в одних случаях лучше может подходить один тип диаграммы, а в других — иной тип. Необходимо делать выбор…
Главная задача графика или диаграммы – понятно и наглядно для широкой аудитории с различной подготовкой и разным восприятием информации донести суть представляемых данных и тенденции их изменения в зависимости от какого-либо параметра.
Так получилось, что за почти 13 лет работы с Excel в 95% случаев я использовал и использую только один тип диаграмм – точечная (в Ooo Calc – Диаграмма XY). Я строю графики в Excel! Почему?
Во-первых, точечная диаграмма легко воспринимается всеми, так как представляет собой график плоской функции одной переменной, с которыми все мы, обучаясь в средней школе, сталкивались. Поэтому графики являются понятным «языком общения» для юриста, инженера, банкира, экономиста, дизайнера — то есть и для технаря и для гуманитария.
Во-вторых, она позволяет наглядно разместить на одной картинке несколько графиков зависимостей различных данных от одного или нескольких параметров.
В-третьих, точечная диаграмма предоставляет широкие возможности анализа числовых данных. Можно построить линии тренда, подобрать уравнение, оценить точность подобранного уравнения, показать планки погрешностей.
В-четвертых, этот тип диаграммы имеет очень, на мой взгляд, удобные и широкие возможности форматирования. Можно раскрасить фон и линии во все цвета радуги, расположить уравнения и значения прямо на поле графика, придать различную толщину линиям, установить разноцветные маркеры разных видов и размеров.
Переходим к делу – строим графики в Excel 2003.
Создание графиков в Excel.
В качестве примера возьмем таблицу «Выпуск металлоконструкций в ноябре 2013 года», в которой представлены плановые и фактические показатели деятельности некоего завода, производящего строительные металлоконструкции.
1. Включаем Excel и помещаем эту таблицу на лист.
2. Мышь «ставим» на любую «чистую» (без записей) ячейку и запускаем мастера диаграмм нажатием на соответствующую пиктограмму на панели инструментов Excel «Стандартная».
3. В выпавшем окне на вкладке «Стандартные» выбираем тип диаграммы «Точечная», на которой значения соединены отрезками и точки обозначены маркерами.
4. Нажимаем на кнопку «Далее>» и в следующем выпавшем окне выбираем вкладку «Ряд» и нажимаем на кнопку «Добавить».
5. Пишем имя первого ряда: «Выпуск-план».
6. «Становимся» мышью в окошко «Значения X:» и выделяем в нашей таблице диапазон ячеек A5…A34. Адреса значений оси X появились в активированном окне.
7. Выделяем мышью содержимое окна «Значения Y:» для замены нужными нам значениями и выделяем в таблице диапазон ячеек B5…B34. Адреса значений оси Y появились в вышеуказанном окне.
8. Нажимаем на кнопку «Добавить» для создания еще одного ряда.
9. Пишем имя второго ряда: «Выпуск-факт».
10. «Становимся» мышью в окошко «Значения X:» и выделяем опять в таблице диапазон ячеек A5…A34. Адреса значений оси X для второго ряда значений появились в окне.
11. Выделяем мышью содержимое окна «Значения Y:» и выделяем в таблице диапазон ячеек C5…C34. Адреса значений оси Y для второго ряда данных появились в вышеуказанном окне.
12. Нажимаем кнопку «Далее>» и в следующем выпавшем окне на вкладке «Заголовки» заполняем окна так, как показано на следующем скриншоте.
13. На вкладке «Линии сетки» добавляем «галочку» к надписи «основные линии» оси X.
14. На вкладке «Легенда» размещаем легенду внизу диаграммы.
15. Нажимаем кнопку «Далее>» и в очередном выпавшем окне выбираем место для расположения диаграммы – на имеющемся листе.
16. Нажимаем кнопку «Готово» и на листе Excel видим графики плана и факта выпуска металлоконструкций по датам.
Первая часть работы завершена, и теперь вы знаете, как строить графики в Excel.
Форматирование графиков в Excel.
Но диаграмма имеет не очень презентабельный вид. Займемся ее форматированием, то есть сделаем внешний вид графиков более красочным и привлекательным.
Изменяем внешний вид поля диаграммы.
1. Щелкаем правой клавишей мыши по серой «Области построения диаграммы» и в выпавшем контекстном меню выбираем «Формат области построения…».
2. Нажимаем на кнопку «Способы заливки», выбираем вкладку «Градиентная» и настраиваем цвета так, как показано на рисунке слева.
3. Нажимаем на кнопку «ОК». В окне «Формат области построения» видим образец, который показывает назначенное нами форматирование.
4. Делаем рамку черной сплошной самой толстой линией.
5. Закрываем окно «Формат области построения нажатием на кнопку «ОК». Диаграмма изменила внешний вид.
Форматируем линии графиков.
1. Щелкаем правой клавишей мыши по линии «Выпуск-план» и в выпавшем контекстном меню выбираем «Формат рядов данных…».
2. Настраиваем вкладку «Вид» так, как на скриншоте, расположенном ниже этого текста.
Линия стала красной и средней толщины, маркер стал белым с красным обрамлением, круглым и имеет размер 6 пт.
Аналогичным образом форматируем линию «Выпуск-факт», только применяем синий цвет и для типа маркера ромбическую форму.
3. Закрываем окно «Формат ряда данных» нажатием на кнопку «ОК», диаграмма еще улучшила внешний вид.
Форматируем оси X и Y.
1. Щелкаем правой клавишей мыши по оси X и в выпавшем контекстном меню выбираем «Формат оси…».
2. Настраиваем вкладку «Шкала» так, как на представленном слева снимке экрана. Цену делений установим 7 дней, конец недели — воскресенье.
Для оси Y пока ничего менять не будем!
Изменяем размеры диаграммы, шрифтов заголовка и названий осей.
Перед завершением процедуры форматирования установим необходимые размеры всей диаграммы и области построения графиков. Для этого необходимо выделить объект щелчком левой кнопки мыши и, нажав и удерживая той же левой кнопкой мыши средний маркер на границе области, перетащить границу в нужное место. Далее – повторить процедуру с другими границами области диаграммы и области построения графиков.
И в завершении следует увеличить размер шрифтов заголовка и названий осей. Это делается с помощью стандартной панели форматирования Excel: выделяется текст и назначаются необходимые размеры и цвет шрифтов. Надписи, включая «легенду», необходимо передвинуть и выровнять на поле диаграммы с помощью мыши.
Все, вот результат – красивые, понятные, аккуратные графики в Excel!
Итоги.
Если посмотреть на столбики чисел исходной таблицы в течение 5 секунд, то кроме вывода о том, что план выпуска металлоконструкций перевыполнен, сказать еще что-либо затруднительно.
Информативность графиков в Excel существенно выше таблицы с числовыми данными!
Я думаю, что все, дочитавшие статью до конца, получили ответ на вопрос, поставленный в заголовке статьи, и теперь знают, как строить графики в Excel.
Подписывайтесь на анонсы статей в окне, расположенном в конце каждой статьи или в окне вверху страницы.
Не забывайте подтвердить подписку кликом по ссылке в письме, которое тут же придет к вам на указанную почту (может прийти в папку «Спам»).
Читайте также: