Как сделать огиву в excel
При изучении величины, принимающей случайные значения (результатов физических измерений в серии экспериментов, экономических показателей, параметров технологических процессов и т.п.), мы имеем дело с выборками. Выборочное наблюдение – это способ наблюдения, при котором обследуется не вся совокупность значений изучаемой величины, а лишь часть ее, отобранная по определенным правилам выборки и обеспечивающая получение данных, характеризующих всю совокупность в целом.
При выборочном наблюдении обследованию подвергается определенная, заранее обусловленная часть совокупности, а результаты обследования распространяются на всю совокупность.
Ту часть единиц, которая отобрана для наблюдения, принято называть выборочной совокупностью или выборкой, а всю совокупность единиц, из которых производится отбор, - генеральной совокупностью.
Существуют различные способы формирования выборки (случайный, механический, типический, серийный (гнездовой)), но в математической статистике изучается собственно-случайная выборка с повторным отбором или бесповторным отбором.
Собственно-случайная выборка формируется с помощью жеребьевки либо по таблице случайных чисел. Всем элементам генеральной совокупности присваиваются порядковые номера, затем производится выбор случайных номеров с помощью датчиков случайных чисел или из специальных таблиц, которые образуют порядковые номера для отбора.
При повторном отборе единица наблюдения после извлечения из генеральной совокупности регистрируется и вновь возвращается в генеральную совокупность, откуда опять может быть извлечена случайным образом.
При бесповоротном отборе элемент в выборку не возвращается.
Число единиц (элементов) статистической совокупности называется ее объемом. Объем генеральной совокупности обозначается N, а объем выборочной совокупности n.
Если объем генеральной совокупности велик, то разница между повторной или бесповторной выборками незначительна.
Качество результатов выборочного наблюдения зависит от того, насколько состав выборки представляет генеральную совокупность, иначе говоря, от того, насколько выборка репрезентативна (представительна).
Сущность выборочного метода заключается в том, что выводы, сделанные на основе изучения части совокупности (случайной выборки), распространяются на всю генеральную совокупность. Математическая статистика занимается обоснованием такого приема, применяя теорию вероятностей.
Вариационный ряд
Элементами выборки < , …, > являются числовые значения, называемые вариантами, которые могут быть дискретными, т.е. изолированными (например, целыми числами), или могут принимать значения из некоторого интервала (a,b). Другими словами, выборка может быть частью генеральной совокупности, которая соответствует дискретной или непрерывной случайной величине.
Вариационный ряд получается из выборки упорядочением по возрастанию (или убыванию) и подсчетом частоты каждого значения. Если выборка соответствует дискретной случайной величине, то вариационный ряд представляет собой таблицу, которая ставит в соответствие каждому значению его частоту . Такой ряд носит название дискретный вариационный ряд.
Например, на основе наблюдения за ростом растения получены n=50 значений числа почек на единицу длины ветки (пример 3.1, табл.3.2). Понятно, что здесь мы имеем пример дискретной случайной величины, так как число почек может быть только целым.
Если нам известно, что исследуемый показатель может принимать любые значения из некоторого интервала (a,b), то строим интервальный вариационный ряд с помощью группировки вариант.
Существуют различные способы группировки вариант, среди которых является метод равных интервалов.
Рассмотрим алгоритм группировки методом равных интервалов.
1. Сначала определяют число интервалов m. Для этого обычно применяют формулу Стреджесса:
m = 1 + 3,22 × lg n. (3.1)
Число m округляют до целого значения.
Приведем еще несколько формул расчета числа интервалов:
m = - 0,013n , (3.1a)
m = 1,72 (3.1b)
m = + 1. (3.1c)
В программе Excel есть процедура «Гистограмма», которая умеет строить вариационный ряд и вычисляет число интервалов по формуле (3.1с). Пример применения процедуры «Гистограмма» приведен ниже.
В табл. 3.1 вычислены рекомендуемые формулами (3.1), (3.1а), (3.1b) и (3.1с) числа интервалов. Значения приведены с округлением до целого.
Таблица 3.1
Объем выборки n | Рекомендуемое число интервалов | ||
формула 3.1 | формула 3.1а | формула 3.1b | формула 3.1 с |
3,723 | 2,555 | 3,29 | 3,646 |
4,965 | 3,902 | 4,423 | 5,123 |
5,612 | 4,845152 | 5,16 | 6,196 |
6,053 | 5,602 | 5,731 | 7,083 |
6,388 | 6,245 | 6,207 | 7,856 |
6,658 | 6,809 | 6,619 | 8,55 |
6,884 | 7,314 | 6,986 | 9,185 |
2. Далее вычисляют границы интервалов.
Приведём два способа определения границ.
В первом способе длину интервала вычисляют по формуле.
h=
xmin=min i>, xmax=i>, (3.2a) и определяют границы интервалов по формулам:
При таком выборе хmin попадает в середину первого интервала, а xmax – в середину последнего, и число интервалов m.
Во втором способе длина интервала и границы вычисляются по формулам:
h= (3.2б)
При этом хmin относится к первому, а xmax – к последнему интервалам.
h= 10
3. После определения границ интервалов вычисляют для каждого j-того интервала
Xср.j (3.4)
и частоту nj т.е. число таких элементов xi выборки, которые удовлетворяют условиям
Вычисляют также для каждого интервала относительную частоту (частость):
накопленные частоты и накопленные относительные частоты (накопленные частости):
nj накопл = wj накопл = = , j= 1,…,m. (3.7)
Вариационный ряд записывают в виде таблицы (табл.3.2)
Приведем два способа определения границ.
В первом способе длину интервала определяют по формуле.
h= , xmin= mini>, xmaxi>, (3.2a)
определяют границы интервалов по формулам:
При таком выборе xmin попадет в середину первого интервала, а xmax - в середину последнего, и число интервалов равно m.
Во втором способе длина интервала и границы вычисляются по формулам:
h= (3.3а)
При этом хmin относят к первому, а хmax - к последнему интервалам
Таблица 3.2
Номер интервала j | Интервал ( j-1, j] | Середина интервала Xср.j | Частота nj | Накопленная частота nj накопл | Частость wk | Накопленная частость wj накопл |
(2,12] | 0,14 | 0,14 | ||||
(12,22] | 0,24 | 0,38 | ||||
(22,32] | 0,33 | 0,71 | ||||
(32,42] | 0,43 | 1,14 | ||||
(42,52] | 0,53 | 1,67 | ||||
(52,62] | 0,63 | 2,3 |
Замечание. Вариационный ряд можно задать двумя столбцами: интервалами (или их серединами) и частотами. Остальные столбцы легко вычисляются.
При повторном отборе единица наблюде6ния после извлечения из генеральной совокупности регистрируется и вновь возвращается генеральная совокупность, откуда опять может быть извлечена случайным образом.
При бесповторном отборе элемент в выборку не возвращается.
Число единиц (Элементов) статистической совокупности называется ее объемом. Объем генеральн6ой совокупности обозначается N, а объем выборочной совокупности n.
Если объем генеральной совокупности велик, то разница между повторным или бесповторными выборками незначительна.
Качество результатов выборочного наблюдения зависит от того, насколько состав выборки представляет генеральную совокупность, иначе говоря, от того, насколько выборка репрезентативна (представительна).
Сущность выборочного метода заключается в том, что выводы, сделанные на основе изучения части совокупности (случайной выборки), распространяется на всю генеральную совокупность. Математическая статистика занимается обоснованием такого приема, применяя теорию вероятности.
Гистограмма, полигон, кумулята и огива
Для графического изображения вариационного ряда используются гистограмма, полигонов, кумулята и огива.
Для дискретного вариационного ряда полигон частот представляет собой многоугольник (рис. 3.1), ограниченный осью ОХ и ломанной, соединяющей точки ( ,0), ( , ), ( ),…,( , ), ( ,0)
Для интервального вариационного ряда с равными интервалами гистограмма частот состоит из прямоугольников, ширина которых равна длине интервала, а высота пропорциональна частоте (рис. 3.2). Для интервального ряда с неравными интервалами ширина прямоугольника равна длине соответствующего интервала, а высота пропорциональна плотности частоты, равной отношению частоты к длине интервала.
В общем случае гистограмма состоит из прямоугольников, ширина каждого из которых равна длине соответствующего интервала, а площадь прямоугольников пропорциональна частоте или относительной частоте. При этом сумма площадей всех прямоугольников равна сумме частот или единице.
Обычно гистограмму состоят по относительным частотам, так чтобы сумма площадей прямоугольников была равна единице. Тогда ломаная, соединяющая середины верхних сторон прямоугольников (полигон), является аналогом графика плотности вероятностей распределения.
При больших объемах выборки полигон относительных частот приближенно отображает график функции плотности вероятностей генерального распределения.
Полигон накопленных частот строится так же, как и полигон частот, при этом вместо частот используются накопленные частоты.
Для непрерывного признака на оси абсцисс откладываются значения середин интервалов, а на оси ординат – накопленные частоты или накопленные частости. Полученные точки соединяют гладкой кривой, которая называется кумулятивной кривой (или кумулятой). Кумулята, построенная по накопленным частотам, при больших объемах выборки является приближением к графику функции распределения вероятностей генеральной совокупности.
Огива в англоязычной литературе определяется как сглаженный график накопленных частот, т.е. это кумулята.
В российских учебниках по статистике огива определяется по-разному.
В одном случае огива — это ломаная, соединяющая точки, полученные при откладывании значений вариант на оси ординат, а накопленные частот — на оси абсцисс (Шмойлова Р. А., Минашкин В. Г., Садовникова Н. А., Шувалова Е. Б. Теория статистики: учебник,М.: Финансы и статистика, 2006).
В другом случае огива строится так же, как и кумулята, только вместо накопленных частот используются частоты, подсчитанные с условием «больше чем» (Теория статистики: учебник / под ред.: «проф. Г. Л. Громыко. — М.: ИНФРА-М, 2000).
Таблица 3.2
Номер интервала j | Интервал (хо-1,хj] | Середина интервала | Частота n | Накопленная частота Nj накопл. |
(2,12] | ||||
(12,22] | ||||
(22,32] | ||||
(32,42] | ||||
(42,52] | ||||
(52,62] |
Введем в программе Excel исходные данные из таблицы 3.2 и построим полигон (рис.3.3) и гистограмму (рис. 3.4).
Построим кумулятивную кривую. Введем варианты и накопленные частоты в Exel, выделим диапАзон A1:B2, выберем тип диаграммы «Точечная диаграмма со значениями, соединенными сглаживающими линиями». После преобразований получим диаграмму, изображенную на рис. 3.5.
Если мы просто поменяем местами столбцы A1 :A6 и B1: B6, то диаграмма преобразуется в огиву. После замены заголовка и форматирования осей получим диаграмму на рис. 3.6. Эта кривая соответствует определению огивы из первого из указанных выше учебников.
В одном случае огива – это ломаная, соединяющая точки, полученные при откладывании значений вариант на оси ординат, а накопленных частот – на оси абсцисс (Шмойлова Р.А., Минашкин В.Г., Садовникова Н.А., Шувалова Е.Б. Теория статистики: учебник. – М.: Финансы и статистика, 2006).
В другом случае огива строится так же, как и кумулята, только вместо накопленных частот используются частоты, подсчитанные с условием «больше чем» (Теория статистики: учебник / под ред. проф. Г.Л. Громыко. – М.: ИНФРА-М,2000).
Очень часто в Excel требуется закрепить (зафиксировать) определенную ячейку в формуле. По умолчанию, ячейки автоматически протягиваются и изменяются. Посмотрите на этот пример.
У нас есть данные по количеству проданной продукции и цена за 1 кг, необходимо автоматически посчитать выручку.
Чтобы это сделать мы прописываем в ячейке D2 формулу =B2*C2
Если мы далее протянем формулу вниз, то она автоматически поменяется на соответствующие ячейки. Например, в ячейке D3 будет формула =B3*C3 и так далее. В связи с этим нам не требуется прописывать постоянно одну и ту же формулу, достаточно просто ее протянуть вниз. Но бывают ситуации, когда нам требуется закрепить (зафиксировать) формулу в одной ячейке, чтобы при протягивании она не двигалась.
Взгляните на вот такой пример. Допустим, нам необходимо посчитать выручку не только в рублях, но и в долларах. Курс доллара указан в ячейке B7 и составляет 35 рублей за 1 доллар. Чтобы посчитать в долларах нам необходимо выручку в рублях (столбец D) поделить на курс доллара.
Если мы пропишем формулу как в предыдущем варианте. В ячейке E2 напишем =D2*B7 и протянем формулу вниз, то у нас ничего не получится. По аналогии с предыдущим примером в ячейке E3 формула поменяется на =E3*B8 — как видите первая часть формулы поменялась для нас как надо на E3, а вот ячейка на курс доллара тоже поменялась на B8, а в данной ячейке ничего не указано. Поэтому нам необходимо зафиксировать в формуле ссылку на ячейку с курсом доллара. Для этого необходимо указать значки доллара и формула в ячейке E3 будет выглядеть так =D2/$B$7, вот теперь, если мы протянем формулу, то ссылка на ячейку B7 не будет двигаться, а все что не зафиксировано будет меняться так, как нам необходимо.
Примечание: в рассматриваемом примере мы указал два значка доллара $B$7. Таким образом мы указали Excel, чтобы он зафиксировал и столбец B и строку 7, встречаются случаи, когда нам необходимо закрепить только столбец или только строку. В этом случае знак $ указывается только перед столбцом или строкой B$7 (зафиксирована строка 7) или $B7 (зафиксирован только столбец B)
Формулы, содержащие значки доллара в Excel называются абсолютными (они не меняются при протягивании), а формулы которые при протягивании меняются называются относительными.
Чтобы не прописывать знак доллара вручную, вы можете установить курсор на формулу в ячейке E2 (выделите текст B7) и нажмите затем клавишу F4 на клавиатуре, Excel автоматически закрепит формулу, приписав доллар перед столбцом и строкой, если вы еще раз нажмете на клавишу F4, то закрепится только столбец, еще раз — только строка, еще раз — все вернется к первоначальному виду.
Как говорилось ранее, в формулах Excel можно создать три варианта констант: горизонтальную, вертикальную и двумерную.
Как создать горизонтальную константу?
- В окне открытого листа выделите вертикальный ряд ячеек с числами. Например, ячейки А1С1 со значениями 1,2,3.
- В окошке строки формул введите знак (=) и откройте фигурную скобку.
- Введите числа, содержащиеся в выделенном ряде ячеек, разделяя их точкой с запятой. =
- Закройте фигурные скобки и нажмите сочетание клавиш Ctrl+Shift+Enter .Формула примет следующий вид: > .
Как создать вертикальную константу?
- В окне открытого листа выделите горизонтальный ряд ячеек с числами. Например, ячейки А2А4 со значениями 4,5,6.
- В окошке строки формул введите знак (=) и откройте фигурную скобку.
- Введите числа, содержащиеся в выделенном ряде ячеек, разделяя их двоеточиями. =
- Закройте фигурные скобки и нажмите сочетание клавиш Ctrl+Shift+Enter . Формула примет следующий вид: > .
Как создать двумерную константу?
- В окне открытого листа выделите прямоугольный диапазон ячеек с числами. Например, ячейки А1С3 со значениями 1,2,3,4,5,6,7,8,9.
- В окошке строки формул введите знак (=) и откройте фигурную скобку.
- Введите числа, содержащиеся в выделенном диапазоне ячеек, разделяя горизонтальные константы точками с запятыми, а вертикальные – двоеточиями. Между собой горизонтальные и вертикальные константы отделяются пробелом. =
- Закройте фигурные скобки и нажмите сочетание клавиш Ctrl+Shift+Enter. >
Excel позволяет присваивать имена не только ячейкам и диапазонам, но и константам. Константой могут выступать как текстовые, так и числовое значения. В этом уроке Вы узнаете, как назначить имя константе в Microsoft Excel.
Допустим, в работе Вы используете какие-то неизменяемые значения. Пусть это будут плотность бензина, керосина и прочих веществ. Вы можете ввести значения данных величин в специально отведенные ячейки, а затем в формулах давать ссылки на эти ячейки. Но это не всегда удобно.
В Excel существует еще один способ работать с такими величинами – присвоить им осмысленные имена. Согласитесь, что имена плБензина или плКеросина легче запомнить, чем значения 0,71 или 0,85. Особенно когда таких значений десятки, а то и сотни.
Имя константе, как и имя области, присваивается с помощью диалогового окна Создание имени. Разница лишь в том, что в поле Диапазон необходимо ввести величину константы.
Более подробно о присвоении имен с помощью диалогового окна Создание имени Вы можете узнать из урока Как присвоить имя ячейке или диапазону в Excel.
Нажимаем ОК, имя будет создано. Теперь, если ввести в ячейку следующую формулу =плБензина, она возвратит значение константы.
Имена констант не отображаются в поле Имя, поскольку они не имеют адреса и не принадлежат ни к одной ячейке. Зато эти константы Вы сможете увидеть в списке автозавершения формул, поскольку их можно использовать в формулах Excel.
Итак, в данном уроке Вы узнали, как присваивать имена константам в Excel. Если желаете получить еще больше информации об именах, читайте следующие статьи:
- Знакомство с именами ячеек и диапазонов в Excel
- Как присвоить имя ячейке или диапазону в Excel?
- 5 полезных правил и рекомендаций по созданию имен в Excel
- Диспетчер имен в Excel
Правила перепечаткиЕще больше уроков по Microsoft Excel
Оцените качество статьи. Нам важно ваше мнение:
Именованные константы в Excel
Допустим, у нас есть лист, на котором генерируется счет-фактура и рассчитывается налог на добавленную стоимость – НДС. Как правило, в таком случае значение ставки налога вставляется в ячейку, а потом в формулах используется ссылка на эту ячейку. Чтобы упростить процесс, этой ячейке можно дать имя, например, НДС. А можно и вовсе обойтись без ячейки, сохранив значение ставки налога в именованной константе.
Рис. 1. Определение имени, ссылающегося на константу
Выполните следующие действия (рис. 1):
- Пройдите по меню Формулы –> Определенные имена –> Присвоить имя, чтобы открыть диалоговое окно Создание имени.
- Введите имя (в данном случае НLC) в поле Имя.
- В качестве области для этого имени укажите вариант Книга. Если хотите, чтобы это имя действовало только на определенном листе, выберите в списке Область именно этот лист.
- Установите курсор в поле Диапазон и удалите все его содержимое, вставив взамен простую формулу, например, 18%.
- Нажмите Ok, чтобы закрыть окно.
Вы создали именованную формулу, в которой не используется никаких ссылок на ячейки. Попробуем ввести в любую ячейку следующую формулу: =НДС. Эта простая формула возвращает значение 0,18. Поскольку эта именованная формула всегда возвращает один и тот же итог, ее можно считать именованной константой. Эту константу можно использовать и в более сложной формуле, например, =А1*НДС.
Именованная константа может состоять и из текста. Например, в качестве константы можно задать имя компании. В диалоговом окне Создание имени можно ввести, например, следующую формулу, называющуюся MSFT: = " Microsoft Corporation " .
Далее можно использовать формулу ячейки: = " Annual Report: " &MSFT. Данная формула возвращает текст Annual Report: Microsoft Corporation (Годовой отчет: корпорация Microsoft).
Имена, не ссылающиеся на диапазоны, не отображаются в диалоговых окнах Имя или Переход (окно Переход открывается при нажатии клавиши F5). Это разумно, поскольку данные константы не находятся ни в одном достижимом месте интерфейса. Однако они отображаются в диалоговом окне Вставка имени (оно открывается при нажатии клавиши F3), а также в раскрывающемся списке, применяемом при создании формулы (рис. 2; при наборе формулы введите букву Н, и Excel выдаст подсказку). Это также разумно, поскольку именованные константы нужны именно для применения в формулах.
Рис. 2. Именованная константа доступна для использования в формулах
Как вы уже догадались, значение константы можно изменить, когда угодно, открыв диалоговое окно Диспетчер имен (команда Формулы –> Определенные имена –> Диспетчер имен). Нажмите в нем кнопку Изменить, чтобы вызвать окно Изменение имени. Затем введите новое значение в поле Диапазон. Когда вы закроете это окно, Excel будет использовать новое значение и пересчитает формулы, в которых применяется это имя.
По материалам книги Джон Уокенбах. Excel 2013. Трюки и советы. – СПб.: Питер, 2014. – С. 112, 113.
Это несложный, но интересный прием, позволяющий подставлять данные из небольших таблиц без использования ячеек вообще. Его суть в том, что можно «зашить» массив подстановочных значений прямо в формулу. Рассмотрим несколько способов это сделать.
Функция ВЫБОР
Если нужно подставить данные из одномерного массива по номеру, то можно использовать функцию ИНДЕКС или ее более простой и подходящий, в данном случае, аналог – функцию ВЫБОР (CHOOSE). Она выводит элемент массива по его порядковому номеру. Так, например, если нам нужно вывести название дня недели по его номеру, то можно использовать вот такую конструкцию
Это простой пример для начала, чтобы ухватить идею о том, что подстановочная таблица может быть вшита прямо в формулу. Теперь давайте рассмотрим пример посложнее, но покрасивее.
Массив констант в формуле
Предположим, что у нас есть список городов, куда с помощью функции ВПР (VLOOKUP) подставляются значения коэффициентов зарплаты из второго столбца желтой таблицы справа:
Хитрость в том, что можно заменить ссылку на диапазон с таблицей $E$3:$F$5 массивом констант прямо в формуле, и правая таблица будет уже не нужна. Чтобы не вводить данные вручную можно пойти на небольшую хитрость.
Выделите любую пустую ячейку. Введите с клавиатуры знак «равно» и выделите диапазон с таблицей – в строке формул должен отобразиться его адрес:
Выделите с помощью мыши ссылку E3:F5 в строке формул и нажмите клавишу F9 – ссылка превратится в массив констант:
Осталось скопировать получившийся массив и вставить его в нашу формулу с ВПР, а саму таблицу удалить за ненадобностью:
Массив констант с именем
Развивая идею предыдущего способа, можно попробовать еще один вариант – сделать именованный массив констант в оперативной памяти, который использовать затем в формуле. Для этого нажмите на вкладке Формулы (Formulas) кнопку Диспетчер Имен (NameManager). Затем нажмите кнопку Создать, придумайте и введите имя (пусть будет, например, Города) и в поле Диапазон (Reference) вставьте скопированный в предыдущем способе массив констант:
Нажмите ОК и закройте Диспетчер имен. Теперь добавленное имя можно смело использовать на любом листе книги в любой формуле – например, в нашей функции ВПР:
Компактно, красиво и, в некотором смысле, даже защищает от шаловливых ручек непрофессионалов 🙂
Графики накопленных частот (огивы) представляют собой кривые накопленных частот. На таком графике по оси ординат (Y) откладывают либо общее количество, либо процент всех наблюдений, в которых значение некоторой величины не превышает данного значения из интервала возможных результатов. По оси ординат (Y) откладывают накопленные частоты.
Поскольку частоты не могут принимать отрицательных значений, кривые накопленных частот являются монотонно неубывающими. Такой кривой описывают вероятность распределения параметра.
Полигон
Полигон распределения можно построить и для интервального вариационного ряда. Для этого по вертикальной оси откладывают те же частоты, что и при построении гистограммы, а по горизонтальной - середины интервалов.
Полигон чаще всего используют для изображения дискретных рядов. Полигоном частот называют ломаную, отрезки которой соединяют точки с координатами (xi,mi) , где xi - варианты выборки и mi - соответствующие им частоты. Если полигон строят по данным интервального ряда, то в качестве абсцисс точек берут середины соответствующих интервалов.
Для построения полигона в прямоугольной системе координат в произвольно выбранном масштабе на оси абсцисс откладывают значения аргумента (варианты), а на оси ординат – значения частот. Масштаб выбирают такой, чтобы была обеспечена необходимая наглядность и желательный размер рисунка. Далее строят точки с координатами (xi,mi) и последовательно соединяют их отрезками прямой.
Полигоном относительных частот (частостей) называют ломаную, отрезки которой соединяют точки с координатами (xi,wi), где xi - варианты выборки и wi - соответствующие им относительные частоты.
Преобразованной формой вариационного ряда является ряд накопленных частот (кумулятивный ряд). Кумулятивный ряд позволяет графически представить данные вариационного ряда в виде кумуляты и огивы . Накопленные частоты получаются в результате последовательного суммирования (кумуляции) всех значений частот, либо от минимального значения варианты к максимальному, либо, наоборот, от максимального к минимальному.
Кумулята
Кумулята (кумулятивная кривая) представляет собой кривую накопленных частот (частостей). Для ее построения на оси абсцисс откладывают значения аргумента, а на оси ординат – накопленные частоты или накопленные относительные частоты. Масштаб на каждой оси выбирают произвольно.
Далее строят точки, абсциссы которых равны вариантам (в случае дискретных рядов) или верхним границам интервалов (в случае интервальных рядов), а ординаты – соответствующим накопленным частотам. Эти точки соединяют отрезками прямой. Полученная ломаная и является кумулятой.
Теперь построим кумуляту — график накопленных относительных частот. Расположим его под гистограммой.
Кумулята — это экспериментальная оценка формы графика функции распределения. Теоретическая кривая будет красивой и гладкой — мы познакомились с ней в начале работы, обсуждая свой вариант задания. Экспериментальная оценка — ломаная линия, да ещё и с погрешностями. Эти случайные ошибки вызваны ограниченным, не бесконечным объёмом выборки. В любом случае, эти графики начинаются в нуле и постепенно растут до 100%.
Напомним, что значения накопленных частот должны быть привязаны к верхним границам интервалов — в соответствии со стандартами и здравым смыслом. Идея в том, что накопленная частота накапливается именно к концу интервала, а не к середине.
Построим график в виде ломаной линии:
Insert — Charts — Insert Scatter (X, Y) or Bubble Chart
Вставка — Диаграммы — Вставить точечную (X, Y) или пузырьковую диаграмму
Вставка графика Y (X)
Выбираем тип графика
Scatter — Scatter with Straight Lines
Точечная — Точечная с прямыми отрезками
Это просто ломаная линия без маркеров точек.
Выбираем данные для графика:
Select Data — Select Data Source — Legend Entries (Series) — Add
Выбрать данные — Выбор источника данных — Элементы легенды (ряды) — Добавить
Edit Series
Изменение ряда
выбираем следующие данные.
Столбец «иксов» — верхние границы:
Series X Values
Значения Х
Столбец «игреков» — накопленные частоты:
Series Y Values
Значения Y
Убираем заголовок диаграммы:
Chart Elements — Chart Title
Элементы диаграммы — Название диаграммы
Настраиваем цвет линии на графике.
Format Data Series — Series options — Fill & Line — Line
Формат ряда данных —Параметры ряда — Заливка и границы — Линия
Line — Solid line
Линия — Сплошная линия
Color — Black
Цвет — Чёрный
Width = 0.5 pt
Ширина — 0,5 пт
Если отрезков много, то ломаная линия выглядит как гладкая кривая.
Настроим числовые метки на вертикальной оси, чтобы выводились целые числа:
Format Axis — Axis Options — Number — Decimal places — 0
Формат оси — Параметры оси — Число — Число десятичных знаков — 0
Установим диапазоны значений по осям.
Вертикальная ось — метки в процентах, а границы диапазона — числа. Поэтому пределы изменения будут от 0 до 1:
Category — Percentage
Категория — Процентный
Axis Options — Bounds
Параметры оси — Границы
Minimum — 0
Минимум — 0
Maximum — 1
Максимум — 1
Горизонтальная ось — в соответствии с интервалами группировки — от 190 до 310.
Подгоняем размеры графика и размещаем его под гистограммой. Можно сделать это вручную.
Если захочется особой точности, поработаем через меню параметров графика (числа условные).
Format Chart Area — Chart Options — Size & Properties — Size
Формат области диаграммы — Параметры диаграммы — Размер и свойства — Размер
Height — 1.8 in
Высота — 7,62 см
Width — 5.3 in
Ширина — 12,7 см
В английской версии пакета размеры измеряются в дюймах. В русской версии — в сантиметрах. Можем установить точные значения размеров вручную.
Окончательно совмещаем маштаб гистограммы и кумуляты: начало первого интервала 190, конец последнего интервала 310. Положения этих двух меток на обоих графиках должны совпадать.
Проблемы с масштабом решаем так. Значение 190 находится в начале интервала, обозначенного 193. Значение 310 находится в конце интервала, следующего за 303.
Читайте также:
- Обложка выберите файл в формате jpg или png минимальное рекомендуемое разрешение 492 x 762 пикселя
- Как установить стиль по умолчанию в автокаде
- Построить график параметрически заданной функции excel
- Yandex launcher что это за программа и нужна ли она на телефоне
- Договор об отношениях между парнем и девушкой в ворде