Как сделать неравномерную шкалу в эксель
Разберёмся как создать и настроить линейный индикатор выполнения (прогресс-бар) в виде диаграммы в Excel.
В современную экономическую жизнь прочно вошли понятия КПЭ (ключевые показатели эффективности, или KPI) и дашборда, которые помогают нам увидеть насколько эффективно выполняются те или иные цели. Грамотная визуализация позволяет сделать это приятным и понятным глазу языком.
Мы уже разбирали с вами примеры пулевой диаграммы, диаграммы в виде спидометра, сейчас остановимся ещё на одном варианте визуализации — индикаторе выполнения (также встречаются названия индикатор процесса или прогресс-бар от английского progress bar).
Для начала давайте поймем, что же это именно такое?
Прогресс бар — это графический элемент в виде полоски (горизонтальной, вертикальной, круговой и т.д.), показывающий статус процесса с помощью заполнения полоски по мере выполнения. Вы часто можете видеть горизонтальный вариант графика во время ожидания загрузки файлов или установки программ.
Сегодня предлагаю подробно рассмотреть линейный вариант графика, который представляет собой простую горизонтальную или вертикальную полосу:
Также в целом можно выделить 2 способа построения графика:
- Без делений на шкале; в этом случае полоска нарисована как единый объект.
- С делениями. В этом случае дополнительно рисуется шкала, которая отображает уровни выполнения (к примеру от 0% до 40% — красная зона, от 40% до 70% — желтая зона и т.д.).
Построение линейного индикатора (прогресс бара)
Вариант 1. Прогресс бар без шкалы
Давайте приступим к построению и начнем с самого простого варианта.
Для начала создадим таблицу, состоящую всего из 2 рядов с данными, в первом будет исходный процент (к примеру 85%), а во втором оставшаяся недостающая часть до 100% (т.е. в данном случае 15% = 100% — 85%):
Выделяем диапазон с данными A1:B2 и строим гистограмму с накоплением (в панели вкладок выбираем Вставка -> Диаграммы -> Линейчатая гистограмма с накоплением):
Как видим Excel не совсем правильно интерпретировал данные и построил график с 2 рядами данных, поэтому для корректного отображения поменяем местами строки и столбцы (выделяем диаграмму и в панели вкладок Конструктор выбираем Строка/Столбец), этим мы добьемся отображения всех данных в одному ряду:
Отлично, диаграмма уже начинает приобретать узнаваемый вид.
Далее устанавливаем минимальную и максимальную границы для оси (щелкаем правой кнопкой мыши по горизонтальной оси и попадаем в настройки Формата оси), как 0 и 1 соответственно, чтобы наша полоска полностью помещалась и показывалась на графике:
В результате мы получаем следующий вид графика:
Уберем ненужные на текущий момент детали в виде названия, дополнительных осей и прочего, чтобы они не отвлекали от построения (их, безусловно, можно не удалять и компоновать на ваше усмотрение):
Как мы видим, полученная полоска занимает не всю ширину диаграммы, снизу и сверху мы видим пустые белые полосы.
Поэтому, чтобы растянуть диаграмму на всю возможную ширину и убрать лишние полосы, установим боковой зазор для ряда равным нулю (выделяем любой ряд с данными, щелкаем правой кнопкой мыши и выбираем Формат ряда данных -> Параметры ряда):
В итоге получаем более компактный вид:
Остались небольшие детали, покрасим части полоски в подходящие цвета и добавим подпись данных на ряд:
Все готово, перейдем к следующему варианту.
Вариант 2. Прогресс бар со шкалой
Отличие этого варианта от предыдущего заключается лишь в дополнительной подложке под полоску, которая показывает уровни выполнения показателя, остальные части практически повторяют предыдущий вариант построения.
Для начала несколько модифицируем нашу таблицу и добавим на нее дополнительные ряды для построения шкалы:
В данном случае я указал шаг шкалы равным 10%, но можно поставить абсолютно любой по вашему усмотрению, главное чтобы сумма всех таких шагов давала 100% (10 шагов по 10% как в примере, или 20 шагов по 5% и т.д.).
Выделяем диапазон с данными A1:B11 и, как и в предыдущем примере, строим линейчатую гистограмму с накоплением:
Повторяем алгоритм и меняем строки и столбцы местами, чтобы диаграмма приобрела необходимый нам вид:
Как мы видим, у нас появилась достаточно длинная полоса, где в начале находится полоска, а в конце как раз разместилась шкала в виде маленьких разноцветных прямоугольников.
Покрасим каждый шаг шкалы в подходящий цвет, для этого левой кнопкой мыши выделяем каждый ряд по отдельности и делаем заливку соответствующим цветом (к примеру, первые 4 шага красим красным, 3 средние — желтым и 3 последние — зеленым):
Так как шкала должна быть подложкой (т.е. находиться позади основного ряда), то поместим основной ряд на второстепенную ось, чтобы он всегда находился над шкалой. Для этого в настройке формата ряда данных указываем построить ряд по вспомогательной оси (именно для ряда с основной полоской):
В результате настройки типов осей получаем:
Далее также для обеих осей указываем 0 и 1 как минимальную и максимальную границы, чтобы график был ровно от 0% до 100%:
Убираем название, оси данных и прочие ненужные в данный момент детали, настраиваем нулевой боковой зазор:
Так как шкала на полученной диаграмме не видна за основной полоской, то для основного ряда с данными установим прозрачность (щелкаем по ряду правой кнопкой мыши, в контекстном меню выбираем Формат ряда данных -> Заливка и границы -> Заливка):
Также добавим подпись данных и получаем:
По усмотрению шкалу можно сделать не сплошной, а с разделителями, для этого установим для каждого ряда шкалы белую границу:
Спасибо за внимание!
Если у вас есть вопросы по теме статьи — пишите в комментариях.
Использование стандартных фильтров в Excel не всегда удобно и ограничено одной таблицей. Для увеличения продуктивности в Excel существуют удобные инструменты, как Временна шкала и Срез . Они позволяют быстро выбирать данные по заданным параметрам, в том числе для нескольких таблиц сразу.
Срезы можно использовать для "Умных" и Сводных таблиц, Временную шкалу только для Сводных.
Сводная таблица является по сути конструктором используя который можно быстро собрать нужные показатели по заданным критериям. Такие таблицы удобно применять для построения различных отчетов. Подробнее о Сводных таблицах смотрите статью: Сводные таблицы в Excel: как создать?
Срез представляет собой фильтр, вынесенный в отдельный графический элемент. Добавить один или несколько Срезов, для "Умной" или Сводной таблицы, можно на вкладке Анализ ► Вставить срез :
Добавление Среза на вкладке Анализ. Для появления вкладки щелкните в любом месте "Умной" или Сводной таблицы, для которой хотите создать срез.
Добавление Среза на вкладке Анализ. Для появления вкладки щелкните в любом месте "Умной" или Сводной таблицы, для которой хотите создать срез.
В появившемся окне выберите столбец или несколько столбцов по которым будем построен фильтр:
Либо, на закладке Вставка ► Срез .
Временная шкала
Временная шкала параметр динамического фильтра, позволяющий легко фильтровать данные по периоду времени на одном из четырех уровней годы , кварталы , месяцы или дни .
Чтобы добавить шкалу на лист, выберите на вкладке Анализ ► Вставить временную шкалу:
Так же можно добавить через вкладку Вставка ► Временная шкала .
В открывшемся окне установите галку на против Дата ► ОK:
Чтобы производить фильтрацию Временной шкалой:
- Нажмите на стрелку рядом с отображаемым временным уровнем и выберите нужный вариант ( год , квартал , месяц или день ):
- Перетащите полосу прокрутки временной шкалы к периоду времени, который вы хотите выбрать;
- В элементе управления отрезком времени нажмите левой кнопкой на плитку периода времени и зажав перетащите ее, будет выбран период.
Чтобы очистить Временную шкалу или Срез, нажмите на шкале в правом верхнем углу кнопку Очистить фильтр .
Как и Cрез для фильтрации данных, Временную шкалу можно добавить один раз и затем использовать в любой момент для изменения диапазона времени Сводной таблицы.
Настройка вида Временной шкалы и Среза
Временную шкалу или Срез можно переместить расположив в более удобном месте, изменить их размер или стиль.
- Чтобы переместить фигуру, просто перетащите ее в нужное место на листе.
- Чтобы изменить размер, нажмите на фигуру, затем выберите нужный размер, перетаскивая маркеры размера или задав его на вкладке Параметры .
- Чтобы изменить стиль, нажмите на фигуру, отобразится меню Инструменты временной шкалы , выберите нужный стиль на вкладке Параметры .
Ис пользование Временной шкалы и Срезов для нескольких Сводных таблиц
Если ваши Сводные таблицы имеют один источник данных, вы можете использовать одну Временную шкалу и несколько Срезов для фильтрации для нескольких таблица.
Щелкните на Временную шкалу или Срез, а затем выберите на вкладке Параметры ► Подключения к отчетам . В открывшемся окне выберите Сводные таблицы, которые вы хотите добавить:
Для использования Временной шкалы для "Умной" таблицы преобразуйте её в Сводную, на вкладке Конструктор ► Сводная таблица или Вставка ► Сводная таблица . Это очень удобно и даёт больше вариантов для маневра.
Подробнее о Временной шкале и Срезах смотрите в видео ⬇⬇⬇
Некоторые статистические данные могут отображаться на диаграммах, даже без создания отдельных рядов. Многие (но не все) диаграммы позволяют дополнить ряд (ряды) данных полосами погрешностей. [1] Полосы погрешностей [2] отображают дополнительную информацию о данных. Например, их можно использовать для изображения ошибки или неопределенности, связанной с каждой точкой данных.
Например (рис. 1) полосы погрешностей могут изображать диапазоны ошибок измерения каждой точки данных. В этом примере полосы погрешностей выражены в процентах: значение плюс-минус 10% от значения. [3]
Рис. 1. График с полосами погрешностей, выраженных в процентах
Полосы погрешностей поддерживаются рядами следующих типов двухмерных диаграмм:
- диаграммы с областями;
- линейчатые диаграммы;
- гистограммы;
- графики;
- точечные диаграммы;
- пузырьковые диаграммы.
Поскольку точечные и пузырьковые диаграммы имеют две оси значений, полосы погрешностей в них можно выводить как для оси х, так и для оси у (а также для обеих осей).
Добавление полос погрешностей в ряд
Для добавления полос погрешностей выделите ряд данных диаграммы, и пройдите по меню Конструктор – Добавить элемент диаграммы – Предел погрешностей и выберите одну из опций: Стандартная погрешность, Процент или Стандартное отклонение (рис. 2). Если выбрать опцию Дополнительные параметры предела погрешностей, откроется диалоговое окно Формат предела погрешностей (рис. 3). В этом окне, помимо трех упомянутых, можно также задать еще две опции предела погрешностей: Фиксированное значение и пользовательское. На рисунке 3 показ выбор, соответствующий пределу погрешностей, изображенному на рис. 1 – относительное значение 10%.
Рис. 2. Добавление предела погрешностей
Рис. 3. Формат предела погрешностей
Остановимся подробнее на формате полос погрешностей. Полосы могут выводиться над точкой, под точкой или в обоих направлениях от точки данных (область Направление меню Формат предела погрешностей, см. рис. 3). Окончание полосы может быть в виде планки или без оной.
Возможно использование пяти типов предела погрешностей:
- Фиксированное значение. Полосы погрешностей откладываются от каждой точки данных на заданную пользователем фиксированную величину. Все полосы погрешностей имеют одинаковую высоту. Обратите внимание: ошибка выражается не в процентах от значения, а в единицах самого значения (по оси y).
- Относительное значение. Полосы погрешностей откладываются от каждой точки данных на величину, определяемую в процентах от значения точки. Например, если задать в поле ввода значение 5%, а значение точки равно 100, то полоса погрешности будет выведена от 95 до 105. Таким образом, длина полосы погрешности зависит от значения точки.
- Стандартное отклонение. Полосы погрешностей откладываются на величину стандартного отклонения (другое название — среднеквадратическое отклонение), равного корню от суммы квадратов отклонений, деленному на квадратный корень от объема выборки. Для обозначения стандартного отклонения обычно используется символ σ (сигма):где – среднее значение по выборке. Все полосы погрешностей имеют одинаковую высоту и откладываются от среднего значения вверх и вниз на заданное (не обязательно целое) число σ. Обратите внимание: расположение полос погрешностей одинаковое для всех точек на диаграмме, поскольку они откладываются не от конкретной точки, а от среднего всех точек. Пример ниже.
- Стандартная погрешность. Как сообщает справка Excel, полосы погрешностей откладываются от каждой точки на величину: , где ny – число значений в ряду. При этом не сообщается, рассчитанные значения откладываются по обе стороны от точки, или вычисленное значение нужно поделить пополам и только половину отложить в каждую сторону от точки. У меня, кстати, не получилось подтвердить приведенную формулу. Более того, при уменьшении целого ряда значений у, стандартная погрешность только росла… Обратите внимание: размер полос погрешностей одинаковый для всех точек, а вот откладываются полосы погрешностей от каждой отдельной точки (а не от среднего значения по всем точкам)
- Пользовательская. Полосы погрешностей определяются значениями, хранящимися в заданном пользователем диапазоне. Обычно диапазон содержит формулы. Об этом подробнее ниже.
Метод стандартного отклонения проиллюстрирован на рис. 3. Здесь на точечную диаграмму нанесена полоса погрешностей по оси у. В отличие от других типов полос погрешностей полоса типа стандартное отклонение выводится относительно среднего арифметического значения всех точек данных. В примере, показанном на рис. 3, среднее ста точек равно 40, а стандартное отклонение — 10. [4] Поэтому полоса погрешностей выводится вокруг среднего плюс-минус отклонение: 40±10. Благодаря полосе погрешности из диаграммы ясно видно, что большинство точек данных (теоретически 68,2%) отличаются от среднего не более чем на величину стандартного отклонения σ.
На рис. 4 показана точечная диаграмма с полосами погрешностей как по оси у, так и по оси х. Оба набора полос погрешностей выводят для каждого значения соответствующие ошибки — плюс-минус 10%. Полосы погрешностей по осям х и у независимы друг от друга. Для них могут быть установлены разные параметры.
Рис. 4. Точечная диаграмма с полосами погрешностей по осям х и у
Форматирование и модификация полос погрешностей
Для изменения формата полос погрешностей дважды щелкните на любой из них. Появится диалоговое окно Формат предела погрешностей. Во вкладке Заливка и границы можно изменить практически любые параметры планки погрешности (рис. 5).
Рис. 5. Вкладке Заливка и границы диалогового окна Формат предела погрешностей
Делая активной горизонтальную или вертикальную планку погрешности можно в диалоговом окне Формат предела погрешностей выбирать вкладку для параметров X-погрешности или Y-погрешности. В диаграммах, отличных от точечных и пузырьковых, вкладка Х-погрешности отсутствует.
Пользовательские полосы погрешностей
Переключатель пользовательская применяется для создания полос погрешностей, величина которых задастся в ячейках рабочего листа. В большинстве случаев сначала нужно создать формулы, вычисляющие погрешности на основе исходных данных. Затем ячейки с формулами должны быть определены как диапазон (диапазоны), используемый полосами погрешностей.
На рис. 6 показан график, отображающий объемы ежемесячных продаж. Полосы погрешностей изображают изменение объемов продаж по сравнению с предыдущим годом. Если полоса погрешности расположена над точкой данных, то в этом месяце прошлого года объем продаж был выше, а если под точкой — ниже. Такое использование полос погрешностей фактически является альтернативой выводу дополнительного ряда данных.
Рис. 6. Пределы погрешностей изображают объемы продаж в эти же месяцы прошлого года
Для построения диаграммы выделяем диапазон А1:В13 и вставляем стандартный график с маркерами. Далее добавляем предел погрешности (как на рис. 2). В качестве величины погрешности устанавливаем тип Пользовательская. Жамкаем кнопку Укажите значения, и для Положительное значение ошибки задаем диапазон D2:D13. Поле Отрицательное значение ошибки оставляем пустым.
[1] Заметка написана с использованием материалов книги Джона Уокенбаха Диаграммы в Excel; книга была написана для Excel2003; более поздние издания мне не известны.
[2] В современных версиях наряду с термином полосы погрешностей используются термины планки погрешности и пределы погрешностей. Я буду использовать все эти термины как синонимы.
[3] Недавно я впервые приобрел для дома лицензионную версию MS Excel. Во-первых, очень хотелось поюзать новинки от MS. Во-вторых, MS предлагает вполне бюджетный вариант – Microsoft Office Home and Student 2013 по цене от 2800 руб. (есть Excel, Word, PowerPoint, OneNote + 7ГБ места в облаке!). Так что изложение и иллюстрации основаны на Excel2013.
[4] Такая структура данных была сформирована путем задания в ячейках А1:А100 формулы =НОРМ.ОБР(СЛЧИС();40;10), где СЛЧИС() – вероятность от 0 до 1, 40 –среднее, 10 – стандартное отклонение
Когда вы представляете данные на диаграмме, могут быть случаи, когда существует уровень изменчивости с точкой данных. Например, вы не можете (со 100% уверенностью) предсказать температуру следующих 10 дней или курс акций компании на следующей неделе.
В данных всегда будет определенная изменчивость. Конечное значение может быть немного выше или ниже. Если вам нужно представить такие данные, вы можете использовать шкалы ошибок в диаграммах в Excel.
Что такое полосы ошибок?
Полосы ошибок — это столбцы на диаграмме Excel, которые отражают изменчивость точки данных.
Это даст вам представление о том, насколько точны данные (измерения). Он сообщает вам, насколько фактическое значение может отклоняться от заявленного значения (выше или ниже).
Например, на приведенной ниже диаграмме у меня есть оценки продаж за четыре квартала, и есть шкала ошибок для каждого квартала. Каждая полоса ошибок показывает, насколько меньше или больше могут быть продажи за каждый квартал.
Чем больше вариативность, тем менее точны точки данных на диаграмме.
Я надеюсь, что это дает вам обзор того, что такое панель ошибок и как использовать полосу ошибок в диаграммах Excel. Теперь позвольте мне показать вам, как добавить эти полосы ошибок в диаграммы Excel.
Как добавить полосы ошибок в диаграммы Excel
В Excel вы можете добавлять полосы ошибок в двухмерную линейную, столбчатую или диаграмму с областями. Вы также можете добавить их в точечную диаграмму XY или пузырьковую диаграмму.
Предположим, у вас есть набор данных и диаграмма (созданная с использованием этого набора данных), как показано ниже, и вы хотите добавить в этот набор данных планки погрешностей:
Ниже приведены шаги по добавлению гистограмм в Excel (2019/2016/2013):
Вышеупомянутые шаги добавят шкалу процентной ошибки ко всем четырем столбцам диаграммы.
По умолчанию значение шкалы процентной ошибки составляет 5%. Это означает, что он создаст полосу ошибок, которая будет максимум на 5% выше и ниже текущего значения.
Типы полос ошибок в диаграммах Excel
Как вы видели в приведенных выше шагах, в Excel есть разные типы полос погрешностей. Итак, давайте рассмотрим их один за другим (и еще об этом позже).
Это то, что вам может понадобиться, если вы работаете со статистическими данными.
Полоса ошибок в процентах
Это просто. Он покажет указанное процентное отклонение в каждой точке данных.
Например, в нашей диаграмме выше мы добавили полосы процентных ошибок, где процентное значение составляло 5%. Это будет означать, что если значение вашей точки данных равно 100, шкала ошибок будет от 95 до 105.
Панель ошибок стандартного отклонения
Это показывает, насколько близка шкала к среднему значению набора данных.
В этом случае планки погрешностей находятся в одном и том же положении (как показано ниже). И для каждого столбца вы можете увидеть, насколько отличается от общего среднего значения набора данных.
По умолчанию Excel отображает эти полосы ошибок со значением стандартного отклонения, равным 1, но вы можете изменить это, если хотите (перейдя в Дополнительные параметры, а затем изменив значение в открывшейся панели).
Панель ошибок с фиксированным значением
Это, как следует из названия, показывает полосы погрешностей, на которых зафиксирована погрешность.
Например, в примере квартальных продаж вы можете указать планки ошибок равными 100 единицам. Затем он создаст полосу ошибок, где значение может отклоняться от -100 до +100 единиц (как показано ниже).
Если вы хотите создать свои собственные настраиваемые планки ошибок, где вы указываете верхний и нижний предел для каждой точки данных, вы можете сделать это с помощью опции настраиваемых полос ошибок.
Вы можете сохранить один и тот же диапазон для всех планок погрешностей или также создать индивидуальные пользовательские планки погрешностей для каждой точки данных (пример рассматривается далее в этом руководстве).
Это может быть полезно, если у вас разный уровень изменчивости каждой точки данных. Например, я могу быть вполне уверен в цифрах продаж в первом квартале (т. е. Низкая изменчивость) и менее уверен в цифрах продаж в III и IV кварталах (т. Е. Высокая изменчивость). В таких случаях я могу использовать настраиваемые планки ошибок, чтобы показать настраиваемую изменчивость в каждой точке данных.
Теперь давайте подробнее рассмотрим, как добавлять настраиваемые полосы ошибок в диаграммы Excel.
Добавление настраиваемых полос ошибок в диаграммы Excel
Планки погрешностей, отличные от пользовательских планок погрешностей (например, фиксированные, процентные, стандартное отклонение и стандартная ошибка), применить довольно просто. Вам нужно просто выбрать вариант и указать значение (при необходимости).
Настраиваемые полосы ошибок требуют немного дополнительной работы.
С настраиваемыми полосами ошибок может быть два сценария:
- Все точки данных имеют одинаковую изменчивость
- Каждая точка данных имеет свою изменчивость
Давайте посмотрим, как это сделать в Excel.
Настраиваемые полосы ошибок — одинаковая изменчивость для всех точек данных
Предположим, у вас есть набор данных, показанный ниже, и диаграмма, связанная с этими данными.
Ниже приведены шаги по созданию настраиваемых планок погрешностей (где значение ошибки одинаково для всех точек данных):
При этом будут применяться одни и те же настраиваемые планки ошибок для каждого столбца гистограммы.
Настраиваемые полосы ошибок — различная изменчивость для всех точек данных
Если вы хотите иметь разные значения ошибок для каждой точки данных, вам нужно иметь эти значения в диапазоне в Excel, а затем вы можете ссылаться на этот диапазон.
Например, предположим, что я вручную вычислил положительные и отрицательные значения ошибок для каждой точки данных (как показано ниже), и я хочу, чтобы они были нанесены на график в виде столбцов ошибок.
Ниже приведены шаги для этого:
Вышеупомянутые шаги предоставят вам настраиваемые планки ошибок для каждой точки данных на основе выбранных значений.
Если вы измените какое-либо из значений позже, диаграмма обновится автоматически.
Форматирование полос ошибок
Есть несколько вещей, которые вы можете сделать, чтобы отформатировать и изменить шкалы ошибок. К ним относятся цвет, толщина полосы и ее форма.
Ниже перечислены элементы, которые можно отформатировать / изменить на панели ошибок:
Цвет / ширина полосы ошибок
Вы также можете изменить тип тире, если хотите, чтобы панель ошибок выглядела иначе, чем сплошная линия.
Один из примеров, когда это может быть полезно, — это когда вы хотите выделить полосы ошибок, а не точки данных. В этом случае вы можете сделать все остальное светлым, чтобы отображались полосы ошибок.
Направление / стиль полосы ошибок
Вы можете выбрать отображение полос ошибок, которые идут по обе стороны от точки данных (положительной и отрицательной), вы можете выбрать отображение только полосок ошибок с плюсом или минусом.
Еще вы можете изменить, хотите ли вы, чтобы конец стержня имел колпачок или нет. Ниже приведен пример, в котором на диаграмме слева есть колпачок, а на диаграмме справа — нет.
Добавление горизонтальных полос ошибок в диаграммы Excel
До сих пор мы видели вертикальные полосы погрешностей. которые являются наиболее распространенными в диаграммах Excel (и могут использоваться с столбчатыми диаграммами, линейными диаграммами, диаграммами с областями, диаграммами разброса)
Но вы также можете добавлять и использовать горизонтальные полосы погрешностей. Их можно использовать как с гистограммами, так и с точечными диаграммами.
Ниже приведен пример, в котором я нанес квартальные данные на гистограмму.
Метод добавления горизонтальных полос погрешностей такой же, как и метод добавления вертикальных полос погрешностей, который мы видели в разделах выше.
Вы также можете добавить горизонтальные (а также вертикальные полосы погрешностей) в точечные диаграммы или пузырьковые диаграммы. Ниже приведен пример, в котором я построил значения продаж и прибыли на диаграмме разброса и добавил как вертикальные, так и горизонтальные полосы погрешностей.
Вы также можете отформатировать эти планки погрешностей (горизонтальные или вертикальные) по отдельности. Например, вы можете захотеть показать полосу процентных ошибок для горизонтальных полос ошибок и настраиваемые полосы ошибок для вертикальных.
Добавление полос ошибок в серию в комбинированной диаграмме
Если вы работаете с комбинированными диаграммами, вы можете добавить планки ошибок к любой из серий.
Например, ниже приведен пример комбинированной диаграммы, где я построил значения продаж в виде столбцов, а прибыль — в виде линейной диаграммы. Полоса ошибок добавлена только к линейному графику.
Ниже приведены шаги по добавлению планок погрешностей только в определенную серию:
При желании вы также можете добавить планки погрешностей ко всем сериям диаграммы. Опять же, выполните те же действия, когда вам нужно выбрать серию, для которой вы хотите добавить полосу ошибок на первом этапе.
Примечание. Невозможно добавить шкалу ошибок только к одной конкретной точке данных. Когда вы добавляете его в ряд, он добавляется ко всем точкам данных на диаграмме для этого ряда.
Удаление полос ошибок
Удалить полосы ошибок довольно просто. Просто выберите полосу ошибок, которую вы хотите удалить, и нажмите клавишу удаления. Когда вы это сделаете, он удалит все полосы ошибок для этой серии.
Если у вас есть как горизонтальные, так и вертикальные полосы ошибок, вы можете удалить только одну из них (опять же, просто выбрав и нажав клавишу Delete).
Это все, что вам нужно знать о добавлении полос погрешностей в Excel .
Под описательной статистикой понимают систематизацию эмпирических данных по целому ряду основных статистических критериев. Причем на основе полученного результата из этих итоговых показателей можно сформировать общие выводы об изучаемом массиве данных.
- Медиана;
- Мода;
- Дисперсия;
- Среднее;
- Стандартное отклонение;
- Стандартная ошибка;
- Асимметричность и др.
Рассмотрим, как работает данный инструмент на примере Excel 2010, хотя данный алгоритм применим также в Excel 2007 и в более поздних версиях данной программы.
Размах вариации
Размах вариации – разница между максимальным и минимальным значением:
Ниже приведена графическая интерпретация размаха вариации.
Видно максимальное и минимальное значение, а также расстояние между ними, которое и соответствует размаху вариации.
С одной стороны, показатель размаха может быть вполне информативным и полезным. К примеру, максимальная и минимальная стоимость квартиры в городе N, максимальная и минимальная зарплата по профессии в регионе и проч. С другой стороны, размах может быть очень широким и не иметь практического смысла, т.к. зависит лишь от двух наблюдений. Таким образом, размах вариации очень неустойчивая величина.
Вычисление коэффициента вариации
Этот показатель представляет собой отношение стандартного отклонения к среднему арифметическому. Полученный результат выражается в процентах.
В Экселе не существует отдельно функции для вычисления этого показателя, но имеются формулы для расчета стандартного отклонения и среднего арифметического ряда чисел, а именно они используются для нахождения коэффициента вариации.
Шаг 1: расчет стандартного отклонения
Стандартное отклонение, или, как его называют по-другому, среднеквадратичное отклонение, представляет собой квадратный корень из дисперсии. Для расчета стандартного отклонения используется функция СТАНДОТКЛОН. Начиная с версии Excel 2010 она разделена, в зависимости от того, по генеральной совокупности происходит вычисление или по выборке, на два отдельных варианта: СТАНДОТКЛОН.Г и СТАНДОТКЛОН.В.
Синтаксис данных функций выглядит соответствующим образом:
= СТАНДОТКЛОН(Число1;Число2;…)
= СТАНДОТКЛОН.Г(Число1;Число2;…)
= СТАНДОТКЛОН.В(Число1;Число2;…)
Шаг 2: расчет среднего арифметического
Среднее арифметическое является отношением общей суммы всех значений числового ряда к их количеству. Для расчета этого показателя тоже существует отдельная функция – СРЗНАЧ. Вычислим её значение на конкретном примере.
Шаг 3: нахождение коэффициента вариации
Теперь у нас имеются все необходимые данные для того, чтобы непосредственно рассчитать сам коэффициент вариации.
Таким образом мы произвели вычисление коэффициента вариации, ссылаясь на ячейки, в которых уже были рассчитаны стандартное отклонение и среднее арифметическое. Но можно поступить и несколько по-иному, не рассчитывая отдельно данные значения.
-
Выделяем предварительно отформатированную под процентный формат ячейку, в которой будет выведен результат. Прописываем в ней формулу по типу:
Существует условное разграничение. Считается, что если показатель коэффициента вариации менее 33%, то совокупность чисел однородная. В обратном случае её принято характеризовать, как неоднородную.
Как видим, программа Эксель позволяет значительно упростить расчет такого сложного статистического вычисления, как поиск коэффициента вариации. К сожалению, в приложении пока не существует функции, которая высчитывала бы этот показатель в одно действие, но при помощи операторов СТАНДОТКЛОН и СРЗНАЧ эта задача очень упрощается. Таким образом, в Excel её может выполнить даже человек, который не имеет высокого уровня знаний связанных со статистическими закономерностями.
Разделы: Математика
- Совершенствование умений и навыков нахождения статистических характеристик случайной величины, работа с расчетами в Excel;
- применение информационно коммутативных технологий для анализа данных; работа с различными информационными носителями.
- Сегодня мы научимся рассчитывать статистические характеристики для больших по объему выборок, используя возможности современных компьютерных технологий.
- Для начала вспомним:
– что называется случайной величиной? (Случайной величиной называют переменную величину, которая в зависимости от исхода испытания принимает одно значение из множества возможных значений.)
– Какие виды случайных величин мы знаем? (Дискретные, непрерывные.)
– Приведите примеры непрерывных случайных величин (рост дерева), дискретных случайных величин (количество учеников в классе).
– Какие статистические характеристики случайных величин мы знаем (мода, медиана, среднее выборочное значение, размах ряда).
– Какие приемы используются для наглядного представления статистических характеристик случайной величины (полигон частот, круговые и столбчатые диаграммы, гистограммы).
- Рассмотрим, применение инструментов Excel для решения статистических задач на конкретном примере.
Пример. Проведена проверка в 100 компаниях. Даны значения количества работающих в компании (чел.):
- моду
- медиану
- размах ряда
- построить полигон частот
- построить столбчатую и круговую диаграммы
- раскрыть смысловую сторону каждой характеристики
1. Занести данные в EXCEL, каждое число в отдельную ячейку.
23 | 25 | 24 | 25 | 30 | 24 | 30 | 26 | 28 | 26 |
32 | 33 | 31 | 31 | 25 | 33 | 25 | 29 | 30 | 28 |
23 | 30 | 29 | 24 | 33 | 30 | 30 | 28 | 26 | 25 |
26 | 29 | 27 | 29 | 26 | 28 | 27 | 26 | 29 | 28 |
29 | 30 | 27 | 30 | 28 | 32 | 28 | 26 | 30 | 26 |
31 | 27 | 30 | 27 | 33 | 28 | 26 | 30 | 31 | 29 |
27 | 30 | 30 | 29 | 27 | 26 | 28 | 31 | 29 | 28 |
33 | 27 | 30 | 33 | 26 | 31 | 34 | 28 | 32 | 22 |
29 | 30 | 27 | 29 | 34 | 29 | 32 | 29 | 29 | 30 |
29 | 29 | 36 | 29 | 29 | 34 | 23 | 28 | 24 | 28 |
2. Для расчета числовых характеристик используем опцию Вставка – Функция. И в появившемся окне в строке категория выберем – статистические, в списке: МОДА
В поле Число 1 ставим курсор и мышкой выделяем нашу таблицу:
Нажимаем клавишу ОК. Получили Мо = 29 (чел) – Фирм у которых в штате 29 человек больше всего.
Используя тот же путь вычисляем медиану.
Вставка – Функция – Статистические – Медиана.
В поле Число 1 ставим курсор и мышкой выделяем нашу таблицу:
Нажимаем клавишу ОК. Получили Ме = 29 (чел) – среднее значение сотрудников в фирме.
Размах ряда чисел – разница между наименьшим и наибольшим возможным значением случайной величины. Для вычисления размаха ряда нужно найти наибольшее и наименьшее значения нашей выборки и вычислить их разность.
Вставка – Функция – Статистические – МАКС.
В поле Число 1 ставим курсор и мышкой выделяем нашу таблицу:
Нажимаем клавишу ОК. Получили наибольшее значение = 36.
Вставка – Функция – Статистические – МИН.
В поле Число 1 ставим курсор и мышкой выделяем нашу таблицу:
Нажимаем клавишу ОК. Получили наименьшее значение = 22.
36 – 22 = 14 (чел) – разница между фирмой с наибольшим штатом сотрудников и фирмой с наименьшим штатом сотрудников.
Для построения диаграммы и полигона частот необходимо задать закон распределения, т.е. составить таблицу значений случайной величины и соответствующих им частот. Мы ухе знаем, что наименьшее число сотрудников в фирме = 22, а наибольшее = 36. Составим таблицу, в которой значения xi случайной величины меняются от 22 до 36 включительно шагом 1.
xi | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 |
ni |
Чтобы сосчитать частоту каждого значения воспользуемся
Вставка – Функция – Статистические – СЧЕТЕСЛИ.
В окне Диапазон ставим курсор и выделяем нашу выборку, а в окне Критерий ставим число 22
Нажимаем клавишу ОК, получаем значение 1, т.е. число 22 в нашей выборке встречается 1 раз и его частота =1. Аналогичным образом заполняем всю таблицу.
xi | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 |
ni | 1 | 3 | 4 | 5 | 11 | 9 | 13 | 18 | 16 | 6 | 4 | 6 | 3 | 0 | 1 |
Для проверки вычисляем объем выборки, сумму частот (Вставка – Функция – Математические – СУММА). Должно получиться 100 (количество всех фирм).
Чтобы построить полигон частот выделяем таблицу – Вставка – Диаграмма – Стандартные – Точечная (точечная диаграмма на которой значения соединены отрезками)
Нажимаем клавишу Далее, в Мастере диаграмм указываем название диаграммы (Полигон частот), удаляем легенду, редактируем шкалу и характеристики диаграммы для наибольшей наглядности.
Для построения столбчатой и круговой диаграмм используем тот же путь (выбирая нужный нам тип диаграммы).
Диаграмма – Стандартные – Круговая.
Диаграмма – Стандартные – Гистограмма.
4. Сегодня на уроке мы научились применять компьютерные технологии для анализа и обработки статистической информации.
Простая формула для расчета объема выборки
Пример расчета объема выборки
Подставляем эти данные в формулу и считаем:
Получаем объем выборки n = 96 человек.
Задачи о генеральной доле
Пример №1 . С помощью случайного повторного отбора руководство фирмы провело выборочный опрос 900 своих служащих. Среди опрошенных оказалось 270 женщин. Постройте доверительный интервал , с вероятностью 0.95 накрывающий истинную долю женщин во всем коллективе фирмы.
Решение. По условию выборочная доля женщин составляет (относительная частота женщин среди всех опрошенных). Так как отбор является повторным, и объем выборки велик (n=900) предельная ошибка выборки определяется по формуле
(относительная частота женщин среди всех опрошенных). Так как отбор является повторным, и объем выборки велик (n=900) предельная ошибка выборки определяется по формуле
Значение uкр находим по таблице функции Лапласа из соотношения 2Ф(uкр)=γ, т.е. Функция Лапласа (приложение 1) принимает значение 0.475 при uкр=1.96. Следовательно, предельная ошибка Функция Лапласа (приложение 1) принимает значение 0.475 при uкр=1.96. Следовательно, предельная ошибка и искомый доверительный интервал
(p – ε, p + ε) = (0.3 – 0.18; 0.3 + 0.18) = (0.12; 0.48)
Итак, с вероятностью 0.95 можно гарантировать, что доля женщин во всем коллективе фирмы находится в интервале от 0.12 до 0.48.
Пример №3 . Проверив 2500 изделий в партии, обнаружили, что 400 изделий высшего сорта, а n–m – нет. Сколько надо проверить изделий, чтобы с уверенностью 95% определить долю высшего сорта с точностью до 0.01 ?
Решение ищем по формуле определения численности выборки для повторного отбора.
Ф(t) = γ/2 = 0.95/2 = 0.475 и этому значению по таблице Лапласа соответствует t=1.96
Выборочная доля w = 0.16; ошибка выборки ε = 0.01
Пример №4 . Партия изделий принимается, если вероятность того, что изделие окажется соответствующим стандарту, составляет не менее 0.97. Среди случайно отобранных 200 изделий проверяемой партии оказалось 193 соответствующих стандарту. Можно ли на уровне значимости α=0,02 принять партию?
Решение. Сформулируем основную и альтернативную гипотезы.
H0:p=p0=0,97 — неизвестная генеральная доля p равна заданному значению p0=0,97. Применительно к условию — вероятность того, что деталь из проверяемой партии окажется соответствующей стандарту, равна 0.97; т.е. партию изделий можно принять.
H1:p Пример №5 . Два завода изготавливают однотипные детали. Для оценки их качества сделаны выборки из продукции этих заводов и получены следующие результаты. Среди 200 отобранных изделий первого завода оказалось 20 бракованных, среди 300 изделий второго завода — 15 бракованных.
На уровне значимости 0.025 выяснить, имеется ли существенное различие в качестве изготавливаемых этими заводами деталей.
Решение. Это задача о сравнении генеральных долей двух совокупностей. Сформулируем основную и альтернативную гипотезы.
H0:p1=p2 — генеральные доли равны. Применительно к условию — вероятность появления бракованного изделия в продукции первого завода равна вероятности появления бракованного изделия в продукции второго завода (качество продукции одинаково).
H0:p1≠p2 — заводы изготавливают детали разного качества.
Для вычисления наблюдаемого значения статистики K (таблица) рассчитаем оценки по выборке.
Наблюдаемое значение равно
Так как альтернативная гипотеза двусторонняя, то критическое значение статистики K≈ N(0,1) находим по таблице функции Лапласа из равенства
Так как альтернативная гипотеза двусторонняя, то критическое значение статистики K≈ N(0,1) находим по таблице функции Лапласа из равенства
По условию α=0,025 отсюда Ф(Ккр)=0,4875 и Ккр=2,24. При двусторонней альтернативе область допустимых значений имеет вид (-2,24;2,24). Наблюдаемое значение Kнабл=2,15 попадает в этот интервал, т.е. на данном уровне значимости нет оснований отвергать основную гипотезу. Заводы изготавливают изделия одинакового качества.
По части судить о целом
Читайте также: