Тест бокса кокса решетчатый поиск прямой компьютерный метод выбора наилучших значений параметров
Если в начале эконометрического моделирования перед исследователем стоит выбор между моделью регрессии, внутренне нелинейной и линейной моделью регрессии (или сводящейся к линейному виду), то предпочтение отдаётся линейным формам моделей.
Однако многие модели регрессии различной функциональной формы нельзя сравнивать с помощью стандартных критериев (например, сравнение по множественному коэффициенту детерминации, или суммам квадратов отклонений), которые позволили бы подобрать наиболее подходящую модель регрессии.
Например, если перед исследователем стоит вопрос о выборе линейной или логарифмической моделями регрессии, то использовать при этом критерий суммы квадратов отклонений нельзя, потому что общая сумма квадратов отклонений для логарифмической модели намного меньше, чем для линейной модели регрессии. Это вызвано тем, что значение логарифма результативной переменной logy намного меньше, чем соответствующее значение у, поэтому сравнение сумм квадратов отклонений моделей даёт неадекватные результаты.
Если сравнивать данные модели по критерию коэффициента множественной детерминации, то мы вновь получим неадекватные результаты. Коэффициент множественной детерминации для линейной модели регрессии характеризует объяснённую регрессией долю дисперсии результативной переменной у. Индекс детерминации для логарифмической модели регрессии характеризует объяснённую регрессией долю дисперсии переменной logy. Если значения данных критериев примерно равны, то сделать выбор между моделями регрессии с их помощью также не представляется возможным.
Одним из методов проверки предположения о возможной линейной зависимости между исследуемыми переменными является метод проверки гипотезы о линейной зависимости между переменными с помощью коэффициента детерминации r2 и индекса детерминации R2.
Другим методом выбора функциональной зависимости между переменными является тест Бокса-Кокса.
Предположим, что перед исследователем стоит задача выбора между линейной и логарифмической моделями регрессии. Рассмотрим применение теста Бокса-Кокса на данном примере.
Тест Бокса-Кокса основывается на утверждении о том, что (у-1) и logy являются частными случаями функции вида
П. Зарембеки разработал один из вариантов теста Бокса-Кокса специально для случая выбора между линейной и логарифмической моделями регрессии.
Суть данного теста заключается в том, что к результативной переменной у применяется процедура масштабирования. Подобное преобразование в дальнейшем позволит сравнивать величины сумм квадратов отклонений линейной и логарифмический моделей регрессий.
Тест Зарембеки реализуется в несколько шагов:
1) рассчитывается среднее геометрическое значений результативной переменной у по формуле:
2) все результативные переменные у масштабируются по формуле:
Коэффициенты эластичности
Коэффициенты эластичности наряду с индексами корреляции и детерминации для нелинейных форм связи применяются для характеристики зависимости между результативной переменной и факторными переменными. С помощью коэффициентов эластичности можно оценить степень зависимости между переменными х и у.
Коэффициент эластичности показывает, на сколько процентов изменится величина результативной переменной у, если величина факторной переменной изменится на 1 %.
В общем случае коэффициент эластичности рассчитывается по формуле:
– первая производная результативной переменной у по факторной переменной x.
Коэффициенты эластичности могут быть рассчитаны как средние и точечные коэффициенты.
Средний коэффициент эластичности характеризует, на сколько процентов изменится результативная переменная у относительно своего среднего уровня
если факторная переменная х изменится на 1 % относительного своего среднего уровня
Общая формула для расчёта коэффициента эластичности для среднего значения
факторной переменной х:
– значение функции у при среднем значении факторной переменной х.
Для каждой из разновидностей нелинейных функций средние коэффициенты эластичности рассчитываются по индивидуальным формулам.
Для линейной функции вида:
средний коэффициент эластичности определяется по формуле:
Для полиномиальной функции второго порядка (параболической функции) вида:
средний коэффициент эластичности определяется по формуле:
Для показательной функции вида:
средний коэффициент эластичности определяется по формуле:
Для степенной функции вида:
средний коэффициент эластичности определяется по формуле:
Это единственная нелинейная функция, для которой средний коэффициент эластичности
Точечные коэффициенты эластичности характеризуются тем, что эластичность функции зависит от заданного значения факторной переменной х1.
Точечный коэффициент эластичности характеризует, на сколько процентов изменится результативная переменная у относительно своего значения в точке х1, если факторная переменная изменится на 1 % относительно заданного уровня х1.
Общая формула для расчёта коэффициента эластичности для заданного значения х1факторной переменной х:
Для каждой из разновидностей нелинейных функций средние коэффициенты эластичности рассчитываются по индивидуальным формулам.
Для линейной функции вида:
точечный коэффициент эластичности определяется по формуле:
В знаменателе данного показателя стоит значение линейной функции в точке х1.
Для полиномиальной функции второго порядка (параболической функции) вида:
точечный коэффициент эластичности определяется по формуле:
В знаменателе данного показателя стоит значение параболической функции в точке х1.
Для показательной функции вида:
точечный коэффициент эластичности определяется по формуле:
Для степенной функции вида:
точечный коэффициент эластичности определяется по формуле:
Докажем данное утверждение.
Запишем точечный коэффициент эластичности для степенной функции вида
через первую производную результативной переменной по заданной факторной переменной x1:
Чаще всего коэффициенты эластичности применяются в анализе производственных функций. Однако их расчёт не всегда имеет смысл, потому что в некоторых случаях интерпретация факторных переменных в процентном отношении невозможна или бессмысленна.
Производственные функции
Производственной функцией называется экономико-математическая модель, с помощью которой можно охарактеризовать зависимость результатов производственной деятельности предприятия, отрасли или национальной экономики в целом от повлиявших на эти результаты факторов.
Факторами производственной функции могут являться следующие переменные:
1) объём выпущенной продукции (в стоимостном или натуральном выражении);
2) объём основного капитала или основных фондов;
3) объём трудовых ресурсов или трудовых затрат (измеряемое количеством рабочих или количеством человеко-дней);
4) затраты электроэнергии;
5) количество станков, потребляемое в производстве и др.
Однофакторные производственные функции (т. е. функции с одной факторной переменной) относятся к наиболее простым производственным функциям. В данном случае результативной переменной является объём производства у, который зависит от единственной факторной переменной х. В качестве факторной переменной может выступать любая из вышеназванных переменных.
Основными разновидностями однофакторных производственных функций являются:
1) линейная однофакторная производственная функция вида:
например, производственная функция зависимости объёма производимой продукции от величины затрат определённого ресурса. Линейная однофакторная производственная функция характеризуется двумя особенностями:
2) параболическая однофакторная производственная функция вида:
Данная функция характеризуется тем, что при росте затрат ресурса х, объём произведённой продукции у вначале возрастает до некоторой максимальной величины, а затем снижается до нуля;
3) степенная однофакторная производственная функция вида:
Данная функция характеризуется тем, что с ростом затрат ресурса х, объём производства у возрастает без ограничений;
4) показательная однофакторная производственная функция вида:
5) гиперболическая однофакторная производственная функция вида:
Данная функция практически не применяется при изучении зависимости объёма производства от затрат какого-либо ресурса, потому что нет необходимости в изучении ресурсов, увеличение которых приводит к уменьшению объёма производства.
Двухфакторные производственные функции (функции с двумя факторными переменными) характеризуют зависимость объёма производства от каких-либо двух факторов, чаще от факторов объёма основного капитала и трудовых ресурсов. Чаще всего используются такие двухфакторные производственные функции как функции Кобба-Дугласа и Солоу.
Для наглядного изображения двухфакторных производственных функций строят графики семейства кривых, основанных на различном сочетании двух факторов, но дающих в результате одно и то же значение объёма выпуска продукции. Кривые, построенные на основании равенства f(x1,x2)=const, называются изоквантами.
Изоквантойназывается сочетание минимально необходимых ресурсных затрат для заданного уровня объёма производства.
Многофакторные производственные функции используются для изучения зависимости объёма производства от n-го количества факторов производства.
Однако в случае множественного регрессионного анализа Создать расписание. При рассмотрении альтернативных моделей с таким же определением Процедура выбора зависимой переменной очень проста. Самое сердце Оценка регрессии на основе всех возможных функций В полной мере, я могу объяснить, вы можете представить выбор функции Общее изменение зависимой переменной.
Когда две или более функции подходят Если они почти одинаковы, вам нужно будет представить каждый результат. Пример в разделе 4.1 показывает, что на линейную функцию приходится 64% дис. Персидский у, а гиперболическая функция (4,3) -99,9%. В этом примере Выберите последний вариант. Однако, если разные модели используют время.
Для двойной 129 Лог-версия модели, когда журнал берется вдоль обеих осей. (См. Упражнение 4.1), соответствующие значения были 0,9915 и 0,02. в Во втором случае стандартное отклонение намного меньше, но это ничего не решает. значение сюрприз, потому что log y намного меньше соответствующего значения y Однако остатков будет гораздо меньше. Количество / 2 безразмерно, Два уравнения, которые относятся к разным понятиям.
Если вы просто хотите Смоделируйте поток, используя y, записав y в качестве зависимой переменной, Тестовая версия, разработанная Павлом Зарембкой (Zarembka, 1968). Этот тест включает в себя такое преобразование шкалы наблюдения. у, предложить возможность прямого сравнения RMS для линейных и логарифмических моделей. Процедура включает в себя: Порядок действий: 1.
Среднее геометрическое значение выборки y рассчитывается. (И Поскольку оно соответствует показателю среднего арифметического log l, Лог регрессии и регрессионных программ уже оценены Предоставляет распечатку среднего значения зависимой переменной, затем Просто рассчитайте показатель этой величины. )
- Среднеквадратичное значение двух регрессий Модель с небольшой суммой квадратов, потому что они эквивалентны Отклонение является оптимальным. 4. Чтобы увидеть, если одна из моделей предлагает Лучшее соответствие, количество (T / 2) log Z может быть рассчитано. Где T— Количество наблюдений, коэффициент стандартного отклонения пересчитанной регрессии siah, и его абсолютное значение (т.е. игнорировать знак минус, По возможности).
Эта статистика имеет распределение x2 за один шаг Новая свобода. Когда критическое значение y> превышено во время выбора Можно сделать вывод, что существует значительная разница на бессмысленном уровне В качестве оценки. 130 случай Тест проводится как данные о стоимости продуктов питания. Данные по стоимости жилья в США также включены.
Войти Рифмная регрессия В этих двух типах продуктов [Формула (4.18), Упражнение 4.1] Людмила Фирмаль
Средние значения log y составляют 4,8422 и 4,6662 для расходов на питание. Расходы на жилье. Коэффициент масштабирования равен r48422 и eA> b Соответственно. В таблице. 4.4 показывает линейное и двойное стандартное отклонение Логарифмическая регрессия с пересчетом Два типа данных о преимуществах. Линейная регрессия логарифм регрессия Таблица 4.4 Расходы на питание 0,011 9 0,011 9 Расходы на жилье • 0,0341 0,0221 Со стола.
4.4 Относительно возврата затрат на питание, Хорошее наково в обоих случаях. Для расходов на жилье, логарифм Регрессия обеспечивает более точное соответствие. Логарифм стандартного отклонения В случае двух регрессий здесь он равен 0,4337, поэтому после умножения 12,5 тестовая статистика составляет 5,42. 1 критический уровень у>
Наказание за свободу составляет 3,84, существенный уровень 5% и 6,64. На уровне 1 процента (см. Вкладку A.4) это соответствует Только в случае 5%, эффект двух регрессий очень отличается Уровень. Эти результаты могут показаться неожиданными С теоретической точки зрения логарифмическая модель Более совершенным.
Однако, поскольку период выборки очень короткий, кривизна Вероятно, нет времени появляться в функции Энгеля, поэтому линейное веселье Катионы могут обеспечить почти равное согласие с нелинейностью Ная функция *. движение 4,6. Пересмотреть линейную и логарифмическую регрессию Сначала провести повторную агрегацию по методу Заренбука, подтвердить продукт, Есть ли большая разница в качестве.
Описано в разделе 4.5. Дж. Бокс и Д. Кокс имеют y и log y Частный случай функции (y-1) / X, из которой получается функция y. Если X = 1 и функция log y (случай ограничения), X стремится к нулю. Нет оснований предполагать, что одно из этих значений X является оптимальным. Минимально, но попробуйте много значений, оп Определите, какой из них дает минимальное стандартное отклонение (после Метод преобразования Зарембка).
Эта процедура Решетчатый поиск. Для нее типичный эко не имеет особых возможностей. Неметрическая компьютерная программа, которая все еще работает Это не сложно. Если вы используете 10 значений A, вам необходимо: Вы можете установить 10 новых зависимых переменных в пакете регрессии, используя: После предварительной стадии узнайте функциональную форму X и различные значения Конвертация по методу Зарембы.
Затем найдите регрессию между Независимая переменная для каждого. В таблице. 4.5 Результаты Регрессионные оценки для различных расходов на питание и жилье Значение X Чтобы оценить регрессию, располагаемый доход индивида Он формируется таким же образом, за исключением преобразования методом Зарембки. такой Преобразование не является обязательным.
Вы можете оставить изменения по мере необходимости Новая (или переменная) справа от линейной формы или В этих случаях одновременная индивидуальная решетка ищет разные значения X. Таблица 4.5 Сумма квадратичного отклонения Я 1,00 0,75 0,50 0,25 0,00 -0,25 -0,50 -0,75 -1,00 питание 0,0119 0,0117 0,0117 0,0118 0,0119 0,0122 0,0127 0,0132 0,0139 корпус 0,0341 0,0304 0,0272 0,0244 0,0221 0,0202 0,0187 0,0178 0,0174 1
Это приложение включает в себя материалы повышенной сложности, Пропустить. 132 Результатом является оптимальное значение X для продуктов Pita Около 0,5. Это Линейная и логарифмическая регрессия. Для расходов на жилье На первый взгляд более точная регрессия Соответствие по сравнению с линейной и логарифмической регрессией. один Как вы можете видеть из следующего раздела.
Поскольку эта модель имеет много недостатков, детальное изучение оптики Минимальная математическая форма на этом этапе не гарантируется. Помимо получения балльной оценки для X, вы также можете получить: Однако эта процедура выходит за рамки этого документа. Да (Если вас интересует этот вопрос, Дж. Спитцер [Спитцер, 1982, с. 307-313]. )
Образовательный сайт для студентов и школьников
© Фирмаль Людмила Анатольевна — официальный сайт преподавателя математического факультета Дальневосточного государственного физико-технического института
Наиболее общим тестом, используемым для выбора функциональной формы модели, является тест Бокса — Кокса.
Для его описания нам необходимо ввести следующую трансформацию переменных:
Отметим, что если А, = 0, то мы имеем дело с неопределенностью вида
Однако соответствующий предел легко вычислить с помощью правила Ло- питаля:
Введенное преобразование позволяет заменить традиционную линейную форму регрессии на более общую:
Для этой модели оцениваются не только коэффициенты р0, р. р^, но и два дополнительных параметра А и 0. Оценка параметров проводится методом максимального правдоподобия [1] . Соответствующий численный алгоритм реализован, например, в статистическом пакете Stata.
Для параметров, в том числе А и 0, можно проверять гипотезы. Несомненно, наибольший интерес представляет проверка гипотез Я0: А = 0 = 1 (что соответствует линейной регрессионной модели) и Я0: А = 0 = О (что соответствует линейной в логарифмах модели).
Проверка этих гипотез проводится с помощью теста отношения правдоподобия, описанного в гл. 6. Обычно именно эта проверка гипотез в настоящее время и называется тестом Бокса — Кокса.
Существуют некоторые упрощения модели (8.4); наиболее распространены:
- 1) А = 0 (когда зависимая и независимые переменные преобразуются одинаково);
- 2) А = 1 (когда преобразуются только независимые переменные);
- 3) 0 = 1 (когда преобразуется только зависимая переменная).
В первом случае можно проверить гипотезы Я0: А = 0 = 1 (о линейной модели), Я0: А = 0 = 0 (о линейной в логарифмах модели). Во втором случае представляет интерес проверка гипотезы Н0: 0 = 1 (что соответствует линейной модели), которую можно осуществить тестом отношения правдоподобия (описан в параграфе 6.4). В третьем случае представляет интерес проверка гипотезы Я0: X = 0 (что соответствует полулогарифмической модели).
Наиболее общим тестом, используемым для выбора функциональной формы модели, является тест Бокса — Кокса.
Для его описания нам необходимо ввести следующую трансформацию переменных:
Отметим, что если А, = 0, то мы имеем дело с неопределенностью вида
Однако соответствующий предел легко вычислить с помощью правила Ло- питаля:
Введенное преобразование позволяет заменить традиционную линейную форму регрессии на более общую:
Для этой модели оцениваются не только коэффициенты р0, р. р^, но и два дополнительных параметра А и 0. Оценка параметров проводится методом максимального правдоподобия [1] . Соответствующий численный алгоритм реализован, например, в статистическом пакете Stata.
Для параметров, в том числе А и 0, можно проверять гипотезы. Несомненно, наибольший интерес представляет проверка гипотез Я0: А = 0 = 1 (что соответствует линейной регрессионной модели) и Я0: А = 0 = О (что соответствует линейной в логарифмах модели).
Проверка этих гипотез проводится с помощью теста отношения правдоподобия, описанного в гл. 6. Обычно именно эта проверка гипотез в настоящее время и называется тестом Бокса — Кокса.
Существуют некоторые упрощения модели (8.4); наиболее распространены:
- 1) А = 0 (когда зависимая и независимые переменные преобразуются одинаково);
- 2) А = 1 (когда преобразуются только независимые переменные);
- 3) 0 = 1 (когда преобразуется только зависимая переменная).
В первом случае можно проверить гипотезы Я0: А = 0 = 1 (о линейной модели), Я0: А = 0 = 0 (о линейной в логарифмах модели). Во втором случае представляет интерес проверка гипотезы Н0: 0 = 1 (что соответствует линейной модели), которую можно осуществить тестом отношения правдоподобия (описан в параграфе 6.4). В третьем случае представляет интерес проверка гипотезы Я0: X = 0 (что соответствует полулогарифмической модели).
Читайте также: