WWW.DISS.SELUK.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА
(Авторефераты, диссертации, методички, учебные программы, монографии)

 

Pages:     | 1 |   ...   | 2 | 3 || 5 | 6 |   ...   | 8 |

«Подготовлено при финансовом содействии Национального фонда подготовки финансовых и управленческих кадров в рамках его Программы поддержки академических инициатив в области социально-экономических наук ФИНАНСОВАЯ ...»

-- [ Страница 4 ] --

Закон распределения случайной величины и соответствующее ему аналитическое выражение, называемое функцией распределения F(X), являются исчерпывающими характеристиками случайной величины.

Рис. 5.1.1. Плотность f(x, µ, ) нормального распределения При описании случайной величины вместо закона распределения можно использовать его параметры µ и 2 — соответственно математическое ожидание случайной величины и ее дисперсию. Если известны параметры распределения, то плотность вероятности 5.1.1 полностью определена.

Однако на практике оценщик всегда пользуется данными выборки из генеральной совокупности данных. В этом случае некоторые основные свойства случайных величин могут быть описаны более просто по данным выборки с помощью оценок параметров их функций распределения, называемых также статистиками.

Важнейшими из этих оценок являются: среднее (среднее арифметическое) значение выборки (оценка математического ожидания) характеристика разброса наблюдаемых величин — дисперсия выборки (оценка дисперсии 2) и среднее квадратическое (стандартное) отклонение выборки Стандартное отклонение s — мера разброса случайной величины вокруг среднего значения, имеющая размерность, совпадающую с размерностью случайной величины, что полезно при определении погрешностей расчетных оценок.

Наряду с упомянутыми статистиками для описания совокупности данных используют и другие.

Медиана, или срединное значение, разделяет случайные величины на равные половины. Для ее вычисления все собранные данные нужно расположить в порядке возрастания или убывания. Затем, если n — нечетное число, то медиану определяют как значение, находящееся в середине упорядоченной последовательности. При четном n медиана — среднее арифметическое двух расположенных в середине значений упорядоченной последовательности.

Мода — есть наиболее часто встречающаяся в совокупности данных величина.

Если совокупность собранных данных представляет собой следующую упорядоченную последовательность девяти чисел:

то срединное значение 30 — это медиана, а наиболее часто встречающееся в упорядоченной последовательности значение 31 — это мода данных.

Медиана и мода используются значительно реже, чем среднее значение.

К характеристикам разброса данных относится также коэффициент вариации выборки:

Значение выражает среднее квадратическое отклонение s в процентах от среднего xср совокупности данных и поэтому может быть использовано для оценки их точности.

Рассмотренные выше характеристики случайных величин являются так называемыми точечными оценками соответствующих им характеристик генеральной совокупности.

Статистические оценки вычисляют исходя из конкретного закона распределения случайной величины. Обычно предполагается, что цена как случайная величина подчиняется закону нормального распределения. Это, как правило, обосновывается в случае оценки центральной предельной теоремой.

Однако процедура формирования оценщиком малой выборки рыночных цен из генеральной совокупности не может гарантировать ее однородности. Поэтому на начальной стадии обработки данных желательно проведение проверки гипотезы нормальности распределения выборочных данных о ценах идентичных объектов. Это позволит оценщику более обоснованно применять статистические оценки данных, соответствующие этому закону.

В математической статистике существует ряд методов проверки нормальности распределения. Наиболее известным из них является численный метод применения критерия 2, разработанный К. Пирсоном. Однако малые выборки, с которыми обычно имеет дело оценщик, не могут дать достаточного количества данных для применения таких критериев. Поэтому покажем здесь более грубые методы, позволяющие судить о нормальности распределения малой выборки.

Перед началом этой процедуры полезно проверить выборку на присутствие так называемых выделяющихся значений. Методы, применяемые для их выявления обычно довольно громоздки. В работе [11] показан простой и достаточно строгий способ решения задачи, основанный на оценке различий крайних значений выборки.

Пусть есть малая выборка (n = 4):

Ее просмотр позволяет предположить, что выделяющимся значением является значение y1 = 67. Рассчитаем отношение Полученную величину оценим с помощью таблицы 5.1.1, составленной для уровня достоверности 95% и n = 3 — 7:

В таблице 5.1.1 для n = 4 и уровня достоверности 95% указано пограничное значение найденного отношения, равное 0,765. Поскольку вычисленное значение 0,837 больше табличного, можно считать значение y1 = 67 выделяющимся и исключить его из всех последующих операций по статистической обработке приведенной выборки.

Точно так же можно проверить предположение о том, что выделяющимся является наибольшее значение. Величина отношения значительно меньше табличного 0,765, и, следовательно, нет оснований для исключения из выборки наибольшего значения y = 110.

Дополнительные графы таблицы 5.1.1 позволяют использовать этот способ в случаях, когда предполагаются выделяющимися сразу несколько значений.

Ниже, в параграфе 7.1, будет рассмотрен метод СмирноваГраббса для решения той же задачи. Выполнив операции по исключению выделяющихся значений, можно заняться проверкой гипотезы о нормальности распределения выборки.

Один из простейших способов проверки — использование коэффициента вариации = (s / xср)100%. Если его значение превышает 33%, то гипотеза о нормальности распределения выборки не подтверждается. Проверим выборку, только что рассмотренную выше. После ее очистки от выделяющихся значений имеем (n = 3):



xср = 105,67 и s = 3,786, что дает коэффициент вариации = 3,58%.

Следовательно, значения выборки не противоречат гипотезе о нормальном распределении. Ниже, в параграфе 7.1, будет рассмотрен критерий среднего абсолютного отклонения (САО) для проверки нормальности распределения выборки.

В математической статистике наряду с точечными оценками широко используются так называемые интервальные оценки — интервалы между статистиками, содержащие с определенной вероятностью истинное значение оцениваемого параметра. Для построения интервальной оценки параметра (например, средней цены Цср) необходимо найти две статистики L и U такие, при которых справедливо вероятностное утверждение:

Интервал называется 100(1 – )-процентным доверительным интервалом для Цср. Этому интервалу можно дать следующую интерпретацию: с вероятностью (1 – ) в указанном интервале будет находиться истинное значение цены. Статистики L и U называются нижней и верхней доверительными границами интервала соответственно, величина (1 – ) — доверительной вероятностью, а величина — уровнем значимости (вероятностью ошибки). Если = 0,1, то интервал называется 90-процентным доверительным интервалом для Цср.

Рассмотрим порядок определения доверительного интервала для среднего значения. Пусть истинная цена Ц (соответствует математическому ожиданию µ) объекта неизвестна. Имеется выборка n цен идентичных объектов, представляющая совокупность нормально распределенных случайных величин. По выборке найдены среднее значение Цср и среднее квадратическое отклонение s. Из математической статистики известно, что выборочная функция подчиняется t-распределению Стьюдента с (n – 1) степенями свободы. Функция плотности вероятности t-распределения протабулирована. При увеличении числа наблюдений n t-распределение переходит в нормальное распределение.

Для заданного уровня значимости и m = (n – 1) степеней свободы таблица t-распределения указывает критическое значение tkр.

При этом доверительный интервал для истинной цены Ц объекта принимает вид:

Фрагмент таблицы t-распределения для уровня значимости = 0,1 (при двухстороннем ограничении) и чисел степеней свободы от 1 до 5 имеет вид:

Рассмотрим далее использование методов математической статистики при решении некоторых важных задач, с которыми наиболее часто сталкивается оценщик.

Классификация данных. Кластерный анализ При проведении оценки и, особенно, массовой оценки оборудования на первом этапе весь массив оцениваемых объектов обычно разбивают на группы однородных по совокупности признаков машин, то есть решают задачу классификации. Машины, включаемые в одну группу, по возможности, должны находиться на небольшом расстоянии друг от друга в пространстве выбранных признаков. Для решения подобных задач может быть использовано несколько подходов.

Обычно используют эвристический подход к группированию объектов, опирающийся на разного рода классификации (ОКОФ, отраслевые классификаторы и т.п.). Основой подхода часто являются интуитивные соображения. При недостаточно знакомом оценщику оборудовании этот подход может оказаться затруднительным. При решении задачи в этом случае нередко встречаются ситуации, когда, с одной стороны, есть желание укрупнить группы оцениваемых объектов, а с другой, — нет уверенности в их классификационной однородности.

Другим способом решения задачи группирования объектов является статистический подход, позволяющий в ряде случаев в значительной степени формализовать процесс. Если объекты оценки имеют несколько признаков, задача может быть решена методами кластерного анализа, специально предназначенного для разбиения совокупности n объектов на однородные в некотором смысле группы (или классы), называемые кластерами. Так как метод является формальным, необходимо иметь некоторый критерий качества разбиения, который позволит сопоставлять альтернативные варианты группировок. В качестве критерия качества классификации объектов может быть использована возможность содержательной интерпретации найденных групп.

Как правило, исходная информация имеет вид прямоугольной таблицы, строками которой являются объекты оценки, а столбцами — их классификационные признаки, в роли которых обычно выступают наиболее важные показатели (факторы) объектов x. Пусть в общем случае имеется n объектов, обладающих k признаками. Тогда таблица приобретет вид матрицы X:

Если объекты х, образующие матрицу, имеют несколько признаков (k > 1), задача классификации может быть решена методами кластерного анализа.

Обычно стараются сформировать матрицу Х так, чтобы ее элементы соответствовали переменным одного типа, обычно количественным. Качественные и ранговые переменные заменяют числами натурального ряда. Например, разновидности фрезерных станков — вертикальные, горизонтальные и универсальные могут быть обозначены цифрами 1, 2 и 3 соответственно.

Кластерный анализ обычно начинается с определения расстояний (xi, xj) между каждой парой входящих в матрицу Х объектов. Объекты, у которых расстояние (xi, xj) окажется меньше некоторого заданного порогового значения, считаются однородными, принадлежащими одному кластеру.

Выбор метода определения расстояния (xi, xj) и задание его порогового значения являются важными моментами кластерного анализа.

В наиболее общем случае обычно используют обобщенное (взвешенное) расстояние Махаланобиса [19]:

где xi, xj — i-й и j-й векторы-строки матрицы X, — диагональная матрица весовых коэффициентов, — ковариационная матрица.

Другие формулы для определения расстояний являются частными случаями формулы для (xi, xj).

Например, если факторы (признаки) объектов взаимно независимы и предварительно нормированы, то может быть использовано обычное Евклидово расстояние:

Предварительное нормирование каждого из признаков производится в этом случае путем деления его центрированной величины на среднее квадратическое отклонение:

где xil — значение l-го признака у i-го объекта;

xl — среднее арифметическое значения l-го признака;

sl = xil xl — среднее квадратическое отклонение Рассмотрим применение кластерного анализа на простом примере.

Пусть требуется провести классификацию n = 9 фрезерных станков (строки матрицы X), каждый из которых характеризуется k = 4 признаками (столбцы X):

1) ширина стола, мм;

2) длина стола, мм;

3) мощность главного электродвигателя, кВт;

4) цена, тыс. руб (все станки с ручным управлением).

Проведем решение задачи с использованием интегрированной системы математического моделирования MATLAB 6 (пакет программ Statistics Toolbox).

Исходные данные первоначально вводятся в виде x = [250 1000 7.7 509; 320 1250 7.7 488; 320 1250 7.7 494; 11.5 624; 400 1600 14 618; 400 1600 11 640; 400 1600 15 675; 26 688; 320 1250 7.7 550], а затем преобразуются в матрицу Х:

250 1000 7,7 509 (В первой колонке — ширина стола, 320 1250 7,7 494 мощность электродвигателя, в четвертой — цена станка).

400 1600 14, 400 1600 11, 400 1600 15, 400 1600 26, 320 1250 7, Признаки (факторы) рассматриваемых объектов нельзя считать полностью независимыми. Например, размеры стола очень часто коррелируют друг с другом и мощностью электродвигателя. Кроме того, значимость признаков — различна. В этом случае в качестве меры близости объектов обычно используют обобщенные (взвешенные) расстояние Махаланобиса. Значения расстояний между объектами образует вектор-строка Y1.

Y1 = pdist(x,’Mahal’) Чтобы было удобнее анализировать результаты расчета, имеющие вид длинной вектор-строки Y1, можно представить их в виде квадратной матрицы Y:

Y = squareform(Y1) 0 3.4080 3.3513 3.7465 3.2807 3.4511 3.2743 3.9336 3. 3.4080 0 0.1642 3.2688 2.1245 2.8260 2.8455 3.2755 1. 3.3513 0.1642 0 3.1115 2.0831 2.7320 2.7314 3.2447 1. 3.7465 3.2688 3.1115 0 3.4672 3.1841 2.5174 3.5377 1. 3.2807 2.1245 2.0831 3.4672 0 1.2806 1.4268 2.8714 2. 3.4511 2.8260 2.7320 3.1841 1.2806 0 1.0174 3.7194 2. 3.2743 2.8455 2.7314 2.5174 1.4268 1.0174 0 2.9465 2. 3.9336 3.2755 3.2447 3.5377 2.8714 3.7194 2.9465 0 3. 3.2017 1.6963 1.5322 1.7059 2.3045 2.2770 2.0303 3.3546 Матрица Y1 — квадратная. Ее размер определяется количеством классифицируемых объектов (в данном случае их 9). Элементы матрицы соответствуют расстояниям между объектами, то есть определяют их близость. Например, четвертая строка матрицы соответствует четвертому объекту, а числа в строке — близость его к остальным объектам; 0 в четвертом столбце соответствует самому четвертому объекту.

Далее осуществляется последовательное объединение сначала самых близких объектов, а затем и все более и более отдаленных друг от друга. Процедуры классификации (кластерпроцедуры) используют для этого различные алгоритмы. По умолчанию применяется алгоритм «ближайшего соседа»: Z = linkage(Y).

Функция возвращает матрицу Z, имеющую (n — 1) строку и столбца и содержащую информацию об иерархическом дереве кластеров (первые два столбца — номера кластеров; третий — взятое из матрицы Y расстояние между ними):

2 3 0.1642 с образованием нового объекта с индексом 6 7 1.0174 с образованием нового объекта с индексом 5 11 1.2806 с образованием нового объекта с индексом 10 9 1.5322 с образованием нового объекта с индексом 13 4 1.7059 с образованием нового объекта с индексом 14 12 2.0303 с образованием нового объекта с индексом 15 8 2.8714 с образованием нового объекта с индексом 1 16 3. Результат кластеризации графически отображается в виде дендрограммы: dendrogram(Z).

Нижний уровень дендрограммы образован исходными объектами (с 1 по 9), которые затем объединяются попарно (в зависимости от расстояния между ними), образуя новые кластеры (с по 16), которые также могут объединяться попарно в зависимости от взаимного расстояния и т.д.

Если задать число кластеров равным 3 и 4 (это следует из дендрограммы, где близкие объекты расположились до уровня 2,0303), то можно посмотреть, как распределились по ним исходные девять объектов:

Рис. 5.1.2. Дендрограмма, полученная при кластерном анализе В левом столбце показана классификация с объединением объектов в три кластера (грубая кластеризация), в правом — в четыре кластера (более точная кластеризация). Все девять объектов расположены в столбцах по порядку, сверху вниз. Цифры показывают, в какой кластер попал объект. Например, из левого столбца видно, что в первый кластер попали объекты 2, 3, 4, 5, 6, 7, 9; во второй — объект 8; в третий — объект 1.

Получившаяся классификация объектов выявила, что наиболее важным признаком рассматриваемых объектов оказалась ширина стола станков — один из основных размеров. При разделении объектов на четыре кластера в 1-й попали все объекты с шириной стола 320 мм, во 2-й — объекты с шириной стола мм, за исключением восьмого, который оснащен двигателем, мощность которого (26 кВт) существенно выше, чем у остальных станков такого размера (11–15 кВт). Он оказался в отдельном 3м кластере. Наконец, в 4-й кластер попал тоже один первый объект, у которого ширина стола составляет 250 мм.

Качество кластеризации исходных объектов можно характеризовать коэффициентом р — аналогом коэффициента корреляции. Чем ближе значение р к 1, тем лучше качество разбиения исходных объектов на дерево кластеров.

p=cophenet(Z,Y1) p = 0, Коэффициент р = 0,8605 является достаточным для того, чтобы считать кластеризацию массива объектов хорошей.

Оценка погрешности среднего значения цены Основой многих важных операций по статистической обработке собранной информации является, как известно, вычисление показателей, характеризующих степень случайного варьирования данных. Часто таким показателем служит оценка среднего квадратического отклонения s. Она используется, в частности, при обработке тех совокупностей данных, для которых правомочно вычисление средних.

Используя, например, при сравнительном подходе средние значения, полученные усреднением рыночных цен идентичных объектов, оценщик должен помнить о том, что имеет дело со случайными величинами. Поэтому он должен быть уверен в том, что погрешность найденного таким образом среднего значения не превышает заданного предельного значения.

Опираясь на оценку s и специальные таблицы по значениям tkр, можно использовать для этой цели интервальные оценки.

Рассмотрим данную проблему на простом примере.

Пусть собранная информация о ценах идентичных объектов при применении сравнительного подхода представляет собой совокупность n = 4 случайных значений:

Их среднее значение также является случайной величиной:

По приведенным выше формулам 5.1.4 и 5.1.5 можно найти оценку среднего квадратического отклонения (лучше использовать для этого Excel):

Для уровня значимости = 0,1 и числа степеней свободы (n – 1) = 3 табличное значение tкр = 2,35 (см. табл. 5.1.1).

Доверительный интервал для Цср равен:

При этом погрешность определения истинной цены не превышает:

Приняв допустимую погрешность среднего не более 10%, получим возможность контролировать разброс цен идентичных объектов в собранной информации. Если погрешность окажется более 10%, можно добиться ее уменьшения, используя другие исходные данные, дающие меньшее значение стандартного отклонения s (см. формулы 5.1.15 и 5.1.16).

Применение корреляционного анализа в оценке машин Корреляционный анализ является одним из статистических методов анализа взаимозависимости двух или нескольких случайных величин. Обычно при сборе ценовой информации результаты содержат не только цену объекта, но и некоторые его параметры (признаки). При решении практических задач оценки часто необходимо выяснить существенно ли влияние этих признаков на цену объекта. В роли признаков могут выступать основные размеры и показатели потребительских свойств оцениваемого оборудования. В случае существенности влияния какого-либо признака на цену он признается ценообразующим фактором и участвует в построении регрессионной модели цены, в противном случае — отбрасывается как второстепенный.

Ниже излагаются методы оценки взаимозависимости между двумя случайными величинами (методы парной корреляции). Кроме того, рассматривается только линейная связь между величинами. На практике этого часто бывает достаточно для решения большинства задач с погрешностью, допустимой при оценке машин.

В основе изложенного ниже материала лежит допущение, что n пар данных (х1;Ц1),(х2;Ц2)... (хn;Цn) образуют выборку из генеральной совокупности, для которой случайный вектор (Х; Ц) удовлетворяет двумерному нормальному распределению. Рассмотрим две независимые выборки (рис. 5.1.3 а и 5.1.3 б).

Рис. 5.1.3. Графическое представление выборок Из рис. 5.1.3 а видно, что между значениями x и Ц не существует отчетливой функциональной зависимости, однако большим значениям признака х соответствуют большие значения цены Ц.

Вместе с тем из рис. 5.1.3 б видно, что практически отсутствует какая-либо связь между значениями цены Ц и признаком х1.

Подобно тому как это было показано выше, определим средние значения и выборочные стандартные отклонения двух случайных величин по выборке а):

Эти четыре параметра соответственно характеризуют признаки х и Ц, то есть их распределения. Для определения силы (тесноты) связи между признаками х и Ц используют эмпирическую ковариацию между ними, обозначаемую через sxЦ и определяемую следующим образом:

В данном случае sxЦ = 10900.

Ковариация sxЦ, как это видно из формулы 5.1.17, может быть положительной и отрицательной. Большие отрицательные значения соответствуют случаю, когда между случайными величинами существует сильная связь, но такая, что при увеличении х цена Ц уменьшается. Например, такой случай встречается, если проверяется теснота связи между ценой Ц кормоуборочного комбайна и количеством х отработанных им моточасов.

Нормируя sxЦ с помощью средних квадратических (стандартных) отклонений sx и sЦ, получим эмпирический коэффициент корреляции rxЦ между случайными величинами х и Ц.

Эмпирический коэффициент корреляции rxЦ ряда данных, состоящий из пар значений (xi; Цi), равен:

Коэффициент корреляции rxЦ есть мера силы (тесноты) и направления линейной связи между значениями х и Ц в ряду измерений объема n. По определению он может принимать любые значения от -1 до +1, так что для него справедливо неравенство:

Если rxЦ > 0, то говорят о положительной корреляции, при rxЦ < 0 имеет место отрицательная корреляция. Чем больше по абсолютной величине коэффициент корреляции, тем сильнее связь между случайными величинами. При нулевом коэффициенте rxЦ связи нет совсем, при rxЦ =1 между двумя величинами существует функциональная связь.

В рассматриваемом примере rxЦ = 0,9894.

При решении практических задач на основе выборок обычно возникает необходимость оценки существенности найденного коэффициента корреляции. Лишь после получения такой оценки можно говорить о возможности его применения ко всей генеральной совокупности, из которой взята выборка.

В случае, когда линейный коэффициент корреляции, полученный по данным относительно малой выборки, велик, — распределение его оценок сильно отличается от нормального распределения (появляется значительная асимметрия). Причем ситуация эта достаточно типичная.

В таких случаях выдвигается гипотеза о том, что значение коэффициента корреляции r в генеральной совокупности равно некоторой величине, близкой к найденному значению rxЦ, например, r = 0,9. Для проверки этой гипотезы применяют логарифмическое преобразование Фишера:

В рассматриваемом примере z = 2,62. Величина z имеет распределение, которое с возрастанием n асимптотически приближается к нормальному распределению со средним значением:

и стандартным отклонением В примере zср = 1,58 и z = 0,71. Гипотезу о предполагаемом коэффициенте корреляции r генеральной совокупности провеz z cp ряют, сравнивая величину Z = с табличным значением zкр для выбранного уровня значимости и числа степеней свободы (n – 2) (табл. 5.1.3).

Если Z < zкр, то гипотеза не отвергается, то есть считают, что коэффициент корреляции r генеральной совокупности может быть равен предполагаемому значению. В примере Z = 1,46 и zкр = 1,96 (для уровня значимости a = 0,05). Таким образом, Z < zкр, то есть гипотеза не отвергается и выборка считается взятой из нормально распределенной генеральной совокупности с коэффициентом корреляции r = 0,9.

Для проверки малых коэффициентов корреляции используют выборочную функцию:

которая удовлетворяет t-распределению с m = n – 2 степенями свободы. Для рассматриваемого примера Т = 81,6.

Задавшись уровнем значимости, например, = 0,05 и определив для данного примера m = 5 — 2 = 3, найдем по таблице 5.1. значение tкр = 3,18. Если | T | tкр, то найденный коэффициент корреляции существенно отличается от нуля, что мы наблюдаем в рассматриваемом примере. В противном случае коэффициент корреляции считается отличающимся от нуля лишь случайно, а связь между случайными величинами — несущественной. Для выборки (х1, Ц) (рис.5.1.3 б) коэффициент корреляции оказался равным rx1Ц = -0,165, что подтвердило отсутствие связи между значениями этих случайных величин.

При использовании интегрированной системы математического моделирования MATLAB 6 (пакет программ Statistics Toolbox) не составляет большого труда определить ковариационную матрицу SxЦ и матрицу коэффициентов корреляции RxЦ для любого двумерного массива данных Y. Каждая строка этого массива Y рассматривается как вариант объекта оценки, а каждый столбец как один из признаков машины. Используются встроенные функции cov(Y) и corrcoef(Y).

В результате работы первой функции получается матрица вида:

Для рассмотренного выше примера (рис.5.1.3 а) результат имеет следующий вид:

Использование компьютерных программ позволяет без проблем находить матрицы парных коэффициентов корреляции для случая, когда рассматриваются задачи с большим количеством переменных.

Ниже приведена матрица R парных коэффициентов корреляции, соответствующая примеру с фрезерными станками, рассмотренному выше в разделе о кластерном анализе. Это квадратная матрица, строки и столбцы которой соответствуют следующим переменным:

1) ширина стола B, 2) длина стола L, 3) мощность главного двигателя N, 4) цена станка Ц.

Матрица R показывает степень взаимозависимости параметров и цены объектов (тесноту корреляционной связи). В частности, последний столбец матрицы содержит коэффициенты корреляции цены со всеми тремя переменными, — их значения достаточно высоки (от 0,8009 до 0,8135), что свидетельствует о сильном влиянии каждого из них на цену. Следует помнить о том, что в дальнейшем, при построении регрессионной модели в ней следует учитывать по-возможности независимые параметры. В данной выборке корреляция между параметрами тоже высока, особенно между шириной и длиной стола, где значение коэффициента корреляции достигает 0,9981. Здесь велик эффект мультиколлинеарности — эффект взаимозависимости влияющих параметров, который может усложнить объяснение поведения полученной модели цены. Поэтому при построении модели для данной выборки можно не учитывать, например, длину стола.

В общем случае это требование можно сформулировать следующим образом: коэффициенты взаимной корреляции между введенными в модель параметрами должны быть меньше, чем коэффициенты корреляции между этими параметрами и ценой.

Регрессионный анализ в оценке После выявления статистически значимых связей между переменными (в частном случае, между параметрами и ценой) с помощью методов корреляционного анализа обычно переходят к математическому описанию этих связей методами регрессионного анализа.

Пусть в общем случае есть зависимая переменная, например, цена Ц, которая зависит от k независимых переменных X = (x1, x2,..., xk), которые не являются случайными величинами.

Связь между этими переменными в условиях, когда Ц является случайной величиной, описывает математическая модель, называемая уравнением регрессии. Регрессионная модель Ц = f(X) должна аппроксимировать совокупность собранных оценщиком данных о параметрах и цене объекта оценки. Обычно истинная функциональная связь переменных неизвестна, и оценщику приходится выбирать подходящую функцию для аппроксимации f(X). В частности, для аппроксимации широко используются полиномиальные модели.

Регрессионный анализ включает решение следующих задач:

1) определение существенных параметров и выбор диапазонов их изменения;

2) выбор вида регрессионной модели f(X);

3) определение оценок неизвестных параметров модели;

4) проверка адекватности модели.

Проблема выбора существенных параметров. Обычно параметрами модели являются основные размеры и показатели машины, определяющие ее потребительские свойства. Например, для технологических машин это — один-два основных размера, какой-либо показатель производительности, уровень автоматизации и класс точности.

Диапазоны изменения значений параметров модели не следует принимать слишком широкими, так как это может привести к необходимости построения нелинейной модели, которая требует значительно большего количества данных для построения. Часто лучше иметь несколько более простых моделей (линейных) для разных диапазонов, чем одну нелинейную.

Выбор вида регрессионной модели. Неизвестную функцию f(X) в окрестностях точки, соответствующей средним уровням каждого фактора, можно представить отрезком степенного ряда.

Если интервалы варьирования факторов невелики, то можно ограничиться линейным приближением в виде полиномиальной модели:

где bi — неизвестные параметры модели (коэффициенты регрессии), i = 1, 2... k;

xi — параметры регрессионной модели, образующие вектор X.

Полиномиальные модели весьма удобны для решения практических задач, так как описание объекта с помощью такой модели легко уточнить, повышая порядок полинома. Если есть основания предполагать существование нелинейной зависимости f(X), то в модель 5.1.20 можно добавить квадратичные члены (более высокий порядок применяется редко):

Могут использоваться и другие модели, например, неполные квадратичные, экспоненциальные и степенные, которые разными способами могут быть преобразованы в линейные модели относительно параметров bi.

Определение оценок неизвестных коэффициентов модели.

Определения оценок осуществляется с использованием метода наименьших квадратов (МНК). Метод базируется на минимизации суммы квадратов отклонений:

для собранных Цi и расчетных Цi, расч значений цен. Напомним, что для нахождения минимума функции необходимо приравнять к нулю ее частные производные по всем неизвестным коэффициентам b. Получится система так называемых нормальных уравнений, при решении которой могут быть найдены искомые коэффициенты. Чтобы такая возможность была реализована, число нормальных уравнений, равное числу N собранных значений цен, должно быть не меньше числа m неизвестных коэффициентов модели. Обычно принимают N = m + 2, где определяется число k параметров модели и вид модели:

— для линейных полиномиальных моделей без свободного — для линейных полиномиальных моделей со свободным — для полных квадратичных моделей m = (k + 2)(k + 1)/2 и т.п.

Отметим, что величина N, показанная выше, является нижней границей количества исходных данных, необходимых для метода наименьших квадратов. Поэтому применение нелинейных моделей, требующих для построения большего количества информации, должно иметь место только при оправданной необходимости.

Если представить собранную информацию в виде матрицы параметров Х и вектора цен Ц аналогов, то формула для определения вектора b оценок неизвестных коэффициентов модели, вытекающая из МНК, будет иметь следующий вид:

где надстрочные значки «Т» и «-1» обозначают соответственно транспонирование и обращение соответствующих матриц.

Вычисления обычно проводятся с помощью компьютера. Например, для этой цели можно использовать специальный пакет «Анализ данных», устанавливаемый в меню «Сервис» электронных таблиц MS Excel 7.0.

Покажем использование MS Excel для решения задачи построения регрессионной модели цены. В качестве исходных данных воспользуемся информацией о параметрах и ценах фрезерных станков. Учитывая сильную корреляцию между параметрами B и L, исключим второй из них из списка данных. Кроме того, не будем учитывать такие станки, информация по которым представлена недостаточно полно: это станок с шириной стола 250 мм и станок, у которого при ширине стола 320 мм мощность электродвигателя 11,5 кВт значительно превышает этот показатель у его аналогов. В результате получим данные по аналогам, приведенные в табл. 5.1.3.

Данные можно рассматривать как матрицу параметров станков Х размера (7х2) и вектор их цен Ц. Применив подпрограмму «Регрессия» из пакета «Анализ данных» к данным, собранным в табл. 5.1.4, определим значения коэффициентов регрессии b.

Таким образом, модель для расчета цены фрезерных станков, близких к аналогам по своим техническим характеристикам, имеет следующий вид:

Подставив в нее данные об объектах оценки, можно получить расчетные значения их цен Црасч.

Информация о параметрах Значения коэф. регрессии В, мм N, кВт Ц, тыс. руб Для вычисления вектора неизвестных коэффициентов b можно было также воспользоваться функцией regress из MATLAB:

b = regress(Ц, Х).

Проверка адекватности модели. Завершающей процедурой регрессионного анализа должна быть проверка значимости найденной модели, то есть существенность вклада в аппроксимацию хотя бы одного из факторов. С этой целью проводится дисперсионный анализ результатов (см. табл. 5.1.4). Общая сумма квадратов SSобщ разбивается на сумму квадратов SSрегр, обусловленную регрессией, и сумму квадратов ошибки SSош, которую регрессия не объясняет:

Затем вычисляются средние квадраты MS = SS/df, где в знаменателе стоят соответствующие числа степеней свободы dfрег = k и dfош = N – k.

Для проверки значимости используется статистика Модель считается значимой, если F > Fкрит(, dfрегр, dfош), где Fкрит — табличное значение F-критерия для выбранной доверительной вероятности (1 — ) и соответствующих чисел степеней свободы df.

Поскольку Fкрит (0,05;2;5) = 5,79 и 23,4259 > 5,79, то модель признается значимой и ее можно использовать для суждения о стоимости аналогичных станков в охваченном исходными данными диапазоне параметров.

Для оценки адекватности модели регрессии часто используют множественный коэффициент детерминации (квадрат множественного коэффициента корреляции):

Ясно, что 0 < R 1. Высокое значение R2 показывает, что найденная модель более чем на 90% объясняет изменение цены станка при изменении его параметров, учитываемых в модели.

Это очень неплохой результат.

Статистикой R2 нужно пользоваться с осторожностью, поскольку ее всегда можно увеличить, взяв достаточно большое число слагаемых в модели.

Расчет всей регрессионной статистики может быть осуществлен в рамках той же подпрограммы «Регрессия», которая использовалась для построения модели.

Статистический анализ рядов динамики Рядами динамики (временными рядами) обычно называют расположенные в хронологической последовательности значения тех или иных статистических показателей. Для оценщика временные ряды представляют несомненный интерес, так как могут содержать информацию об изменении цен или иных экономических показателей различных объектов во времени (ставок налогов, доходов, создаваемых объектами оценки, спроса на определенные группы товаров и т.п.).

Каждый временной ряд состоит из двух групп элементов:

1)моментов или периодов времени, к которым относятся изучаемые статистические данные;

2)значений статистических показателей, которые характеризуют изучаемый процесс или объект в определенный момент или за указанный период времени.

Одной из основных задач, возникающих при анализе рядов динамики, является установление закономерности изменения уровней изучаемого показателя во времени.

Уровни ряда динамики формируются под совокупным влиянием множества факторов и в том числе различного рода случайных обстоятельств. Изучая реальные ситуации, можно заметить, что различные временные ряды могут складываться из четырех составляющих:

— тренда, или систематической составляющей;

— колебаний относительно тренда с большей или меньшей регулярностью;

— эффекта сезонности;

— случайной составляющей.

Если говорить о математическом описании временного ряда, то он может быть представлен либо как одна из перечисленных составляющих, либо как сумма нескольких из них. Рассмотрим эти составляющие подробнее.

Под трендом обычно понимают некое устойчивое, систематическое изменение изучаемого показателя в течение длительного периода. В понятие тренда заложено то обстоятельство, что изменение на протяжении длительного периода представляется как бы сглаженным. Это означает, что составляющую, соответствующую тренду, обычно можно представить в виде полинома от времени t. Хотя полиномы являются наиболее удобными с математической точки зрения функциями, для его описания могут быть использованы и другие функции.

Наиболее легко обнаружить в составе временного ряда эффект сезонности. Обычно это регулярные колебания с периодом в один год или с периодом, равным какому-либо другому известному фиксированному временному интервалу. В ряде случаев такие колебания вообще могут отсутствовать в составе временного ряда.

Выделив тренд и сезонные изменения, получим ряд, представляющий более или менее регулярные колебания. Это так называемый остаточный ряд. Основная задача при анализе остаточного ряда — выяснить, подчинены ли колебания некоторому закону и, следовательно, предсказуемы, или любая их часть абсолютно случайна. Колебания первого типа называют систематическими, второго типа — случайными.

Наиболее распространенным случаем исследования временных рядов является выявление основной закономерности изменения уровней ряда, в некоторой мере свободной от случайных составляющих. Обычно основную закономерность отражает тренд, а методы его обнаружения называются в теории временных рядов методами выравнивания.

Методы выравнивания позволяют построить математическую модель тренда (основной тенденции) временного ряда. В таблице 5.1.5 приведены различные виды трендовых моделей, наиболее часто используемые для моделей трендов.

Название функции (модели тренда) Описание функции Линейная функция Полином 2-го порядка (парабола) Полином 3-го порядка (кубическая парабола) y = b + b t + b t 2 + b t Показательная функция Экспоненциальная функция Логарифмическая функция Гипербола Логистическая кривая Линейная модель является самым простым видом тренда. Она подходит для отображения примерно равных изменений (роста или падения) показателей процесса за равные периоды времени.

Практика показывает, что такой характер изменения рядов динамики встречается довольно часто. Причиной этого обычно является наличие большого числа факторов, влияющих на изучаемый процесс.

Полиномиальные модели 2-го и более высоких порядков (здесь их можно также называть параболическими) применяются для описания процессов, которые на некотором, обычно непродолжительном, временном интервале имеют примерно постоянное ускорение абсолютного прироста уровней. Так бывает, например, при ускоренном увеличении дохода в фазе циклического подъема. Параболические модели 2-го порядка более распространены по сравнению с моделями 3-го порядка, особенно при ограниченной длине временного ряда.

Показательная и экспоненциальная модели тренда характерны для процессов, не имеющих ограничений для роста уровня.

На практике так может быть лишь на ограниченном интервале времени.

Логарифмическая модель подходит для описания процесса, когда при постоянном абсолютном изменении значений изучаемого показателя во времени темп этих изменений замедляется, но не прекращается совсем.

Если, наоборот, наблюдается замедляющееся снижение уровней процесса, причем эти уровни стремятся к некоторому пределу, для описания тренда хорошо подходит гиперболическая модель.

Логистическая модель подходит для описания такого процесса, при котором изучаемый показатель проходит полный цикл развития, начиная с нулевого уровня, сначала медленно, затем примерно по линейному закону и, наконец, в завершающей стадии по гиперболе вплоть до завершения цикла.

Перечисленные примеры не исчерпывают всего разнообразия моделей, применяемых для описания трендов. Поэтому задача выбора подходящей модели не является простой и однозначной.

Основанием для выбора модели может быть содержательный анализ сущности развития изучаемого процесса. Можно опираться на результаты предыдущих исследований или анализ диаграммы, построенной по табличным данным, соответствующим собранной информации. В последнем случае трудности могут возникнуть из-за того, что истинная тенденция изменения показателей процесса может быть замаскирована наложенными на нее колебаниями уровней временного ряда.

Основным приемом, применяемым для распознавания типа тренда, является графическое изображение сглаженных уровней эмпирических данных, на котором случайные колебания и иные флуктуации в некоторой степени удается погасить. Для этого приходится использовать те или иные компьютерные программы.

Покажем решение задачи определения тренда, которое можно реализовать средствами Excel. Тренд в общем случае можно представить как зависимость которая соответствует парной регрессии. Excel позволяет не только строить график по результатам наблюдений за изменением уровней показателей в различные периоды времени, но для построенного графика находить уравнение парной регрессии. То есть решать задачу сглаживания (аппроксимации) эмпирических данных с одновременным построением графика тренда, построения его модели и оценкой качества подбора модели тренда по значению квадрата множественного коэффициента корреляции R2.

На рис. 5.1.4 рассмотрен пример решения этой задачи. В качестве исходных данных использована информация о влиянии хронологического возраста на рыночную цену станка. Слева на рисунке приведена таблица с данными. Видно, что средняя рыночная цена станков одной модели, работающих примерно в одинаковых условиях, зависит от хронологического возраста.

Поставим задачу — подобрать модель временного ряда, отражающего тенденцию изменения рыночной цены y в зависимости от хронологического возраста x станка.

С той целью, считая возраст станка аргументом х, а цену функцией у, построим с помощью Мастера диаграмм в Excel стандартный точечный график заданного временного ряда. По оси абсцисс этого графика отложен возраст станка, а по оси ординат — его рыночная цена. Под каждой точкой графика показано значение цены. Точечный график представляет собой временной ряд, значения показателей которого указаны через равные промежутки времени, равные одному году.

После того как графическое представление исходной информации имеется, можно приступить к выбору наиболее подходящей модели тренда, соответствующего исходным данным. Excel позволяет сделать это достаточно просто.

Для этого следует выделить точечный график и правой кнопкой мыши вызвать выпадающее меню для форматирования рядов данных. Затем выбрать позицию меню «Добавить линию тренда». В появившемся окне «Линии тренда» имеются две закладки. Закладка «Тип» позволяет выбрать один из шести вариантов моделей для аппроксимации исходных данных с использованием метода наименьших квадратов. Причем в случае полиномиальной модели возможно задание разной степени полинома.

На второй закладке «Параметры» следует отметить позиции «Показывать уравнение на диаграмме» и «Поместить на диаграмме величину достоверности аппроксимации R2».

На рис. 5.1.4 показаны результаты подбора линии тренда с использованием четырех моделей: линейной, экспоненциальной и двух полиномиальных (2-го и 3-го порядков).

ВЫБОР МОДЕЛИ ТРЕНДА

Исходные данные Возраст Цена Для каждой из четырех моделей построен график (точки соответствуют исходным данным) и получено математическое выражение, с помощью которого можно рассчитать рыночную цену у станка для заданного возраста х. Полученные модели тренда сгладили исходные данные, но обладают разной достоверностью. Для оценки адекватности полученных моделей трендов здесь используется квадрат множественного коэффициента корреляции (множественный коэффициент детерминации) R2. Чем ближе он к единице, тем выше адекватность модели тренда. Из рис. 5.1.4 следует, что наименьшей адекватностью обладает линейная модель тренда (R2 = 0,8704), а наибольшей — полиномиальная модель 3-го порядка (R2 = 0,9978).

1. Каким проверкам подвергают малые выборки при использовании информации в сравнительном подходе?

2. Алгоритм определения доверительного интервала для среднего значения.

3. Какие вы знаете способы группирования объектов?

4. Этапы проведения классификации объектов при кластерном анализе.

5. Для чего применяют корреляционный анализ в оценке машин?

6. В чем смысл регрессионного анализа? Этапы регрессионного анализа.

7. Как осуществляется процедура проверки адекватности модели?

8. Построение трендов при анализе временных рядов.

5.2. Компьютерные технологии и средства в оценке машин, оборудования и транспортных средств Экономико-математические модели в оценке машин и оборудования При изучении различных явлений и процессов во всех отраслях знаний в настоящее время практически невозможно обойтись без использования их в меру упрощенных формальных описаний, называемых математическими моделями. Если такие модели используют применительно к экономическим явлениям, их называют экономико-математическими или просто экономическими моделями. Закономерности в экономике выражаются в виде зависимостей различных экономических показателей. Такие зависимости и их математические модели могут быть получены только путем обработки реальных статистических данных, с учетом внутренних механизмов явлений и случайных факторов. Построение моделей в такой ситуации осложняется тем, что взаимосвязи показателей не являются строгими, функциональными зависимостями. Все сказанное относится и к оценочным моделям, в частности к моделям цен машин и оборудования.

В практической работе оценщик сталкивается с необходимостью поиска, накопления и анализа разнообразной информации о машинах и их ценах. В процессе этой работы он сталкивается не только с трудностями нахождения самой информации. Вопервых, часто, особенно при оценке мало знакомого оборудования, бывает очень трудно выявить все основные факторы, влияющие на цену. Во-вторых, цена подвержена влиянию множества случайных факторов, четкая информация о которых отсутствует.

В-третьих, оценщики обычно располагают ограниченным количеством информации, которая к тому же содержит различного рода ошибки.

В этих условиях построение моделей опирается на сложившуюся методологию, лежащую в основе теории обработки и анализа данных, которая называется математической статистикой. Сама модель в этом случае называется стохастической (вероятностной). Входные и выходные переменные такой модели, как правило, представляют собой случайные величины.

Необходимость использования стохастических моделей при оценке заставляет придерживаться определенного порядка их построения.

На первом этапе оценщик должен сформулировать для себя представление о будущей модели на умозрительном уровне. Для этого, еще на стадии идентификации объекта, он должен выделить важнейшие факторы, которые могут существенно влиять на цену объекта. Можно, конечно, включить в перечень собираемой информации как можно больше факторов, но это приведет к трудностям при сборе информации, так как в прайс-листах аналогов ему удастся найти лишь ограниченное количество параметров, характеризующих их потребительские свойства. Поэтому здесь очень важны интуиция оценщика и опыт работы с подобными объектами.

Обычно количество факторов, существенно влияющих на цену, например, технологического оборудования, не превышает трех-пяти.

Второй этап, как правило, связан со сбором и проверкой качества информации о ценах и параметрах аналогов. Учитывая, что эта информация обычно носит статистический характер, а по ней нужно будет находить значения неизвестных коэффициентов модели, необходимо иметь достаточное количество данных. Нелинейные модели требуют для построения большего количества данных, так как содержат большее число неизвестных коэффициентов.

Собранная информация является всего лишь малой выборкой из генеральной совокупности, а процедура ее формирования не может гарантировать ее однородности. Поэтому требуется отсев отклоняющихся значений, проверка нормальности распределения и др.

Третий этап обычно посвящен выбору вида модели. В большинстве случаев оценщику приходится строить регрессионные модели, которые аппроксимируют собранную ценовую информацию. В этом случае наиболее подходящим видом модели является так называемая многофакторная полиномиальная модель.

Модель может быть линейной или нелинейной — обычно не выше второго порядка, так как излишняя сложность модели затрудняет ее использование. Как правило, сначала пытаются обойтись линейной моделью. Из других видов моделей можно назвать экспоненциальную, степенную и др.

На четвертом этапе по собранной информации производится определение неизвестных параметров модели. Как правило, здесь используется метод наименьших квадратов. На этом этапе широко используют вычислительную технику и существующие пакеты прикладных программ, имеющие встроенные функции для статистического анализа (например, Excel). Завершается определение коэффициентов проверкой их статистической значимости и проверкой адекватности самой модели в целом.

Далее модель цены может использоваться по назначению, то есть для суждения о стоимости объектов оценки. Естественно, что при помощи модели удается значительно эффективнее решать задачи оценки стоимости объектов, в том числе машин и оборудования.

Такая формализация процедуры оценки позволяет не только достаточно четко понять закономерности формирования стоимости объекта, но и использовать построенную математическую модель для получения новой информации о стоимости других объектов путем проведения расчетов или экспериментов с ее помощью.

Замещение реальных процессов, происходящих с объектами оценки, математическими моделями и исследование свойств этих процессов на их моделях называется моделированием. Если результаты моделирования подтверждаются, то говорят, что модель адекватна. В этом случае она может служить основой для прогнозирования реальных процессов. Такого рода модели очень полезны, например, при прогнозировании доходов, создаваемых объектом оценки.

Анализ качества собранной информации Выше (в параграфе 5.1.) было показано, что малость выборки данных и случайность ее формирования не гарантируют ее необходимого качества, что заставляет оценщика перед началом работы с данными делать несколько проверок. Обычно это исключение экстремальных значений цен из собранной информации, простые проверки гипотезы нормальности распределения выборочных данных и оценка погрешности выборочного среднего значения цен идентичных объектов.

В работе [11] приведен критерий для одновременного обнаружения наибольших и наименьших экстремальных значений из выборки.

На рис. 5.2.1 показан рабочий лист Excel с реализацией данного критерия применительно к обработке ценовой информации. В левый столбец таблицы вводятся значения цен аналогов в возрастающем порядке, а в соседнем столбце делается отметка (1) рядом со значением, проверяемым на исключение из выборки. Определяются средние значения Цср для исходной выборки и Цk для оставшихся значений. Затем проводятся расчет абсолютных отклонений от средних и определение сумм квадратов по столбцам (СУММКВ1 и СУММКВ2).

Найденные суммы квадратов используются для расчета статистики Еk, которая сравнивается с критическим значением С.

Критическое значение выбирается по таблице, приведенной в нижней части формы, в зависимости от количества собранных цен n и количества k проверяемых на исключение значений.

Если Еk < C, то k проверяемых значений цен являются грубыми ошибками и подлежат исключению, о чем программой делается соответствующее сообщение (см. рис. 5.2.1).

Проверка нормальности распределения выборочных данных о ценах аналогов требуется для корректного применения в дальнейшем методов статистического анализа. Отсутствие такой проверки в условиях малого объема выборки ставит под сомнение надежность расчетов стоимости по регрессионным моделям.

ИСКЛЮЧЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ ЦЕН

После сортировки цены Цi нужно ввести в столбец Помеченные экстремальные значения следует исключить как грубые ошибки.

Не забудьте исключить из таблицы исходных данных грубые ошибки!

В работе [17] показано применение достаточно простых критериев проверки нормальности распределения исходных данных. Более или менее уверенный вывод об этом можно сделать при получении положительных результатов проверки сразу несколькими такими критериями.

Ниже приведена реализация двух таких проверок средствами Excel (рис. 5.2.2).

Первая из проверок производится с помощью коэффициента вариации v, выражающего среднее квадратическое отклонение s в процентах от среднего значения Цср цен, оставшихся после исключения экстремальных значений, оказавшихся грубыми ошибками.

ПРОВЕРКА НОРМАЛЬНОСТИ РАСПРЕДЕЛЕНИЯ ДАННЫХ

ПО МАЛЫМ ВЫБОРКАМ

1. Проверка по коэффициенту вариации Для данных, оставшихся после исключения экстремальных значений, Если гипотеза отвергается, то выборка должна быть изменена (например, дополнена однородными данными или из нее исключены экстремальные значения).

2. Критерий среднего абсолютного отклонения (САО) Для выборки, имеющей приблизительно нормальное распределение, должно выполняться неравенство: (САО/s – 0,7979) < (0,4/n * 0,5) s= Если гипотеза отвергается, то выборка должна быть изменена (например, дополнена однородными данными или из нее исключены экстремальные значения).

Если значение коэффициента вариации превышает 33%, то гипотеза о нормальности распределения выборочных данных отвергается. В рассмотренном примере значение коэффициента вариации v = 3,9% — мало. Поэтому первая проверка завершена положительно, что позволяет перейти ко второй проверке — по критерию среднего абсолютного отклонения (САО).

В нижней части рис. 5.2.2 показано, как определяется показатель САО. Для выборки, имеющей приблизительно нормальное распределение, должно выполняться условие В нашем примере это неравенство принимает вид 0,04 < 0,23, то есть условие 5.2.1 выполняется, и гипотеза о нормальности распределения выборочных данных принимается.

После очистки выборки и проверки нормальности распределения можно оценить погрешность определения среднего значения цены с использованием доверительных или интервальных оценок Цср.

Точечная оценка Цср не дает представления о точности. Интервальная же оценка позволяет по данным выборки указать интервал, в котором с заданной вероятностью находится истинное, но неизвестное значение цены.

Здесь будет рассмотрена та же задача в контексте с обсуждением формы обработки первичных данных при использовании сравнительного подхода. Расчетная форма создана на базе Excel (рис. 5.2.3) и позволяет оценить погрешность среднего выборочного значения цены.

найденные цены На рис. 5.2.3 в левом углу приведена таблица с данными по ценам Цi трех идентичных объектов, оставшимися после исключения грубых ошибок. Цены представляют собой случайные величины, поэтому выборочная средняя цена Цср тоже является случайной величиной. Для определения Цср использована функция Excel СРЗНАЧ.

На рисунке показан доверительный интервал D, построенный вокруг средней цены. Внутри доверительного интервала с заданной вероятностью (1 – ) находится истинное значение цены, неизвестное оценщику. Погрешность выборочного среднего значения оказывается не более половины этого интервала, а относительная ее величина определяется отношением Погрешность полностью определяется величиной доверительного интервала, который является функцией среднего квадратического отклонения (СКО) s цен идентичных объектов, образующих выборку, количества этих цен и табличного значения критерия tкр(Стьюдента), найденного для заданного уровня значимости = 0,05 и числа степеней свободы (n – 1) =3.

СКО s можно определить с помощью встроенной в Excel функции СТАНДОТКЛОН, а остальные значения для расчета найти по формулам, которые приведены на рисунке. Расчет П показывает, что среднее значение цены определено с погрешностью, не превышающей допустимых 10%.

В противном случае программа выводит сообщение о недопустимой погрешности, для уменьшения которой необходимо сокращать доверительный интервал D. Чтобы добиться этого, нужно уменьшить разброс найденных значений цен Цi и(или) увеличить количество собранной информации.

Форма, реализованная в Excel, позволяет оценщику оперативно отслеживать недопустимо большие погрешности в собранной информации. Еще удобнее непосредственное встраивание такого расчета в форму для определения стоимости объекта оценки при сравнительном подходе.

Оценочные регрессионные модели Цель построения оценочной модели — установление и анализ зависимостей между переменными, которые разделяют на зависимые (отклик, выход модели) и независимые (факторы). В оценке зависимыми переменными, как правило, являются цены объектов. В роли независимых переменных (факторов) Х обычно выступают основные параметры машины и показатели ее потребительских свойств. Эти переменные (факторы) для каждого вида оборудования оценщик в состоянии определить сам в процессе идентификации объекта оценки, а для аналогов — при сборе ценовой информации.

При идентификации уточняется количество факторов, отбирается сравнительно небольшая их часть (обычно не более 5), информация о которых имеется у оценщика. Эти факторы считаются детерминированными (то есть не случайными). Остальные факторы, обычно менее важные, информация о которых отсутствует или является недостаточно точной, относят к категории случайных.

Обычно предполагают, что случайные факторы влияют на цену, делая ее также случайной величиной. Для описания этого влияния в модель добавляют случайный параметр, объединяющий в себе влияние всех неучтенных факторов. Модель в этом случае можно представить как Проверки, которые предшествуют построению модели цены, свидетельствуют о том, что собранная информация по ценам подчиняется закону нормального распределения.

Таким образом, в общем случае есть одна зависимая переменная Ц, на которую влияют k независимых переменных, например, Х = (x1, x2... xk). Зависимость между этими переменными в случае, когда Ц является случайной величиной, характеризуется математической моделью, которая называется множественной регрессией. Регрессионная модель должна аппроксимировать совокупность собранных данных подходящей моделью, выбор которой в большинстве случаев делает сам оценщик.

Во многих случаях построение регрессионной модели начинается с оценки линейной зависимости переменных. Модели придают вид а оценки неизвестных коэффициентов b0, b1... bk находят, используя в качестве критерия близости сумму квадратов разностей собранных значений цен аналогов Цj и цен, рассчитанных по уравнению регрессии 5.2.4:

Если записать регрессионную модель в матричном виде, то критерий близости примет следующий вид:

где Ц — вектор собранных цен n аналогов;

Х — (n k) — матрица факторов (параметров объектов);

b — вектор неизвестных коэффициентов регрессионной модели.

Чтобы минимизировать критерий близости Q, необходимо, = 0 для всех i. Получается так называемая система чтобы нормальных уравнений, из решения которой можно найти оценки неизвестных коэффициентов регрессии:

Все вычисления обычно проводятся с помощью компьютера. На рис. 5.2.4 приведен пример такого расчета с помощью пакета Excel.

ПОСТРОЕНИЕ РЕГРЕССИОННОЙ ЛИНЕЙНОЙ МОДЕЛИ ЦЕНЫ

Для линейной регрессии число коэффициентов M = k + 1, где k — число факторов Задать число факторов k = ОПРЕДЕЛЕНИЕ ЦЕНЫ ОБЪЕКТА ОЦЕНКИ (расчет по найденной модели) При построении линейной регрессионной модели следует иметь в виду, что чем больше данных использовано, тем точнее может быть определена искомая зависимость между переменными.

Однако количество статистических данных не может обеспечить получение достоверной зависимости, если в действительности ее не существует. Вместе с тем можно назвать минимальное количество необходимых исходных данных, определяемое самим методом наименьших квадратов, с помощью которого определяются неизвестные коэффициенты регрессии. Обычно это количество принимается равным (k + 2), где k — количество факторов, учитываемых в модели. На рис. 5.2.4 рассмотрен случай, когда k = 3, поэтому использованы данные по (k + 2) = 5 аналогам.

Оценщик вносит данные о существенных, с его точки зрения, параметрах аналогов и их ценах в таблицу.

Перед началом расчетов коэффициентов регрессии полезно проверить существование и силу линейной связи между переменными и ценой аналогов. С этой целью определяются коэффициенты корреляции между факторами и ценой — это r1Ц, r2Ц и r3Ц, и между факторами — r12, r13 и r23. Желательно, чтобы первая группа коэффициентов имела как можно большие значения — это будет свидетельствовать о существенности влияния этих факторов на цену. Вторая группа коэффициентов, наоборот, должна иметь малые значения, что будет свидетельствовать о независимости факторов между собой. На рис. 5.2.4 это имеет место, однако для фактора х2 эта картина проявляется недостаточно четко, что естественно при минимальной выборке данных.

Для определения коэффициентов корреляции была использована статистическая функция КОРРЕЛ, встроенная в Excel.

Следует заметить, что при рассмотрении более двух переменных для получения безупречных статистических выводов о существовании связи между ними простых коэффициентов корреляции оказывается уже недостаточно. В этом случае желательно использовать множественные коэффициенты корреляции, которые являются мерой линейной связи между одной из переменных и совокупностью других. Поэтому подход, показанный на рис. 5.2.4, можно рассматривать лишь как приближенный.

После проверки связи между переменными можно приступить к определению неизвестных коэффициентов регрессионной модели. Для этого можно использовать встроенную статистическую функцию ЛИНЕЙН, реализующую вычисления на базе выражения 5.2.7.

Если в окно этой функции на рабочем листе ввести адреса массивов данных Ц и Х, то будет произведен расчет вектора неизвестных коэффициентов b регрессии и в соответствующих ячейках (рис. 5.2.4) появятся их значения.

Таким образом, уравнение регрессии для оцениваемых объектов определенного вида — готово. Теперь его можно поместить в ячейку «Цена объекта оценки» (имеется в виду расчетная цена) в нижней части рабочей формы и использовать для расчетов с заданными значениями переменных, соответствующих объектам оценки.

При использовании множественной линейной регрессии у оценщика может возникнуть необходимость проверить ее значимость. Для этого общая сумма квадратов SSобщ разбивается на сумму квадратов SSрегр, которую найденная регрессия объясняет, и сумму квадратов ошибки SSош:

Пакет Excel с помощью инструмента «Регрессия», входящего в надстройку «Пакет анализа», позволяет провести определение указанных сумм квадратов, соответствующих им дисперсий (средних квадратов) s2 и вычислить статистику F, которая используется для проверки значимости регрессии по критерию Фишера:

где df — соответствующие степени свободы для определения дисперсий.

Процедура проверки обычно сводится в таблицу «Дисперсионный анализ» (табл. 5.2.1).

Дисперсионный анализ Можно оценить достоверность построенной регрессионной модели с помощью F распределения Фишера. В последнем столбце табл. 5.2.1 приведена значимость F = — вероятность того, что регрессионная зависимость цены от указанных факторов отсутствует. Следовательно, (1 – ) = 0,98 — это вероятность того, что такая зависимость существует.

На форме (рис. 5.2.4) показана также величина которая называется квадратом множественного коэффициента корреляции и широко применяется для оценки адекватности регрессионных моделей. Ясно, что 0 R2 1. В данном случае этот коэффициент очень близок к своему максимальному значению, что также свидетельствует об адекватности построенной модели.

Регрессионный анализ также удобно применять при построении моделей коррекции цены аналога с помощью так называемых коэффициентов торможения цены:

Проблемой в этом случае является обоснованное определение показателей степени m1, m2, m3... Покажем, как производится решение этой проблемы методом регрессионного анализа (рис. 5.2.5).

ОПРЕДЕЛЕНИЕ ЗНАЧЕНИЙ ПОКАЗАТЕЛЕЙ СТЕПЕНИ m1, m2, m В ФОРМУЛЕ ДЛЯ КОРРЕКЦИИ ЦЕНЫ АНАЛОГА Ц = Цан*Ккор ОПРЕДЕЛЕНИЕ ЦЕНЫ ОБЪЕКТА ОЦЕНКИ (расчет по модели) для объекта оценки Ввод данных по параметрам и ценам аналогов осуществляется аналогично тому, как это было в предыдущем примере. Под столбцами параметров показаны коэффициенты корреляции, свидетельствующие о достаточно сильной их связи с ценой.

Среди аналогов выбран один (первый), по значениям параметров находящийся примерно в середине выборки. В дальнейших расчетах он будет фигурировать с индексом «ан».

В выражении 5.2.11 производится деление левой и правой частей на Цан и логарифмирование:

В соответствии с выражением 5.2.12 производится логарифмирование таблицы с исходными данными и преобразование ее в таблицу, расположенную под ней. Первая строка в ней отсутствует, так как после логарифмирования она является нулевой.

Так как выражение 5.2.12 является по существу регрессионной моделью с неизвестными коэффициентами регрессии m1, m2, m3, то к нему можно применить те же приемы, что и в предыдущем примере. Используя встроенную функцию ЛИНЕЙН с соответствующими массивами из второй таблицы, можно найти оценки неизвестных коэффициентов регрессии, одновременно являющимися показателями степени m1, m2, m3.

Окончательно построенная модель имеет вид:

В ней вместо параметров и цены аналога в общем виде стоят конкретные значения, соответствующие наиболее представительному аналогу из верхней таблицы, которому ранее был присвоен индекс «ан».

Высокое значение квадрата множественного коэффициента корреляции R2, выведенное на форму, показывает, что полученная модель адекватна.

Модель в виде 5.2.13 введена в правую ячейку самой нижней таблицы и позволяет определять расчетное значение цен объектов оценки по значениям вводимых в эту таблицу параметров.

Преимущество применения регрессионного анализа в данном случае связано с тем, что в коэффициентах торможения цены используются не средние значения показателей степени m, а более точные, соответствующие собранной информации о аналогах объекта.

При попытке построить регрессионную модель для широкого диапазона варьирования независимых переменных Х оценщик может столкнуться с неадекватностью линейной регрессии. Из такой ситуации есть два выхода.

Можно сузить интервалы изменения параметров объекта, чтобы линейная аппроксимация оказалась адекватной. В этом случае для широкого интервала может потребоваться несколько регрессионных моделей, каждая из которых будет работать в своем диапазоне.

Вторым выходом может быть построение одной, но нелинейной модели (обычно квадратичной):

В этом случае количество неизвестных коэффициентов увеличивается, что влечет за собой увеличение количества данных для построения такой модели. Так для построения квадратичной модели минимально необходимое количество аналогов должно быть равно При k = 2 требуется информация минимум о восьми аналогах, тогда как для построения линейной модели нужно было всего четыре аналога. Так как собирать информацию о аналогах не просто, это не приводит к большой популярности нелинейных моделей среди практических оценщиков, а используется при всякого рода исследованиях.

Построить квадратичную модель цены можно, используя все тот же Excel. Для этого достаточно произвести замену переменных. Например, вместо модели вида использовать модель Тогда, используя технологию построения линейных моделей, можно будет определить все коэффициенты нелинейной модели 5.2.17.

Прогнозные модели в оценке Ранее были рассмотрены методы построения математических моделей трендов, описывающих различные процессы, происходящие в заданном временном интервале. Временной интервал соответствовал прошлому и настоящему времени протекания процесса. Продление в будущее тенденций, обнаруженных при протекании процесса на заданном временном интервале, называется экстраполяцией или прогнозированием.

Для прогнозирования должны быть соблюдены, по крайней мере, два условия:

а) предположение о том, что основная тенденция протекания процесса в прошлом и настоящем не претерпит существенных изменений в будущем;

б) наличие математической модели тренда, адекватно отображающей протекание изучаемого процесса.

Вместе с тем формальный подход к прогнозированию может привести к существенным ошибкам в результатах прогноза. Поэтому, наряду с выполнением названных выше условий, очень важен содержательный экономический анализ изучаемого процесса, знание факторов, которые влияют на временной ряд. Если временной ряд имеет периоды подъемов и спадов уровня, расчет параметров тренда не следует вести применительно ко всему рассматриваемому интервалу времени. В этом случае его следует разбить на этапы так, чтобы в пределах каждого из них наблюдалась устойчивая тенденция изменения уровней процесса. Может оказаться, что прогноз будет точнее, если он опирается не на данные всего интервала времени, а лишь на тенденции, которые проявились на последнем этапе.

Для осуществления прогноза удобно пользоваться компьютерными программами. Ниже на простом примере будут рассмотрены возможности прогнозирования временных рядов, которые предоставляет Excel.

Известно, что публикация в открытой печати официальных статистических данных всегда несколько запаздывает по сравнению с текущим моментом. В этом случае, когда оценщику потребуется сегодняшний уровень того или иного экономического показателя, он может найти его по результатам прогноза, построенного на ретроспективных данных.

Пусть, например, известны ретроспективные данные о коэффициентах рентабельности продаж Кр, отражающих изменение по годам потребительского спроса на машины определенной товарной группы.

Кр 0,2 0,24 0,383 0,32 0,195 0,201 0,092 0,09 0,127 0, На рис. 5.2.6 показан соответствующий этим данным временной ряд.

Обнаружить какую-либо тенденцию изменения временного ряда оказалось затруднительным. Поэтому была предпринята попытка, использовать для прогноза лишь заключительный участок ряда, где на протяжении последних трех-четырех лет устойчиво проявляется тенденция роста коэффициента рентабельности. Данные по этому этапу ряда приведены в таблице.

Чтобы осуществить прогноз временного ряда на 5-й год, можно воспользоваться Мастером диаграмм, построить точечный график временного ряда по данным таблицы, а на этапе построения линии тренда осуществить прогнозирование.

Имеет большое значение выбор модели тренда, так как экстраполяция с использованием разных моделей может дать сильно различающиеся результаты. В данном случае дополнительным ориентиром при выборе модели тренда должно быть представление оценщика о максимально возможной величине прогнозируемой величины. В данном случае речь идет о коэффициенте рентабельности продаж продукции машиностроения, для которого наиболее высокие значения вряд ли превысят величину 0,35–0,40.

На основании изложенного для прогнозирования были выбраны три модели тренда: линейная, логарифмическая и экспоненциальная.

По рассмотренной выше методике были построены графики трендов, показанные на рис. 5.2.7.

Все три модели приведены на рисунке, там же даны значения коэффициента R2, характеризующего адекватность моделей.

Для прогнозирования необходимо, открыв диалоговое окно «Линии тренда», перейти на закладку «Параметры» и в маленьком окошке «Прогноз вперед на...» установить «1 период». Результаты прогнозирования с использованием всех трех моделей показаны на рисунке. Логарифмический тренд дал пессимистический прогноз коэффициента рентабельности Кр =0,222 (расчет проведен по модели тренда для х = 5). У него, кстати, самый низкий коэффициент R2 = 0,5837.

Линейный и экспоненциальный тренды дали Кр = 0,2725 и Кр = 0,2996 соответственно (расчет проведен по моделям трендов для х = 5). Учитывая, что коэффициент R2 у экспоненциальной модели выше (R2 = 0,8175), отдаем предпочтение этому прогнозу.

При прогнозировании на несколько периодов вперед, как правило, для повышения надежности результатов оперируют не точечной, а интервальной оценкой прогноза, определяя так называемые доверительные интервалы прогноза на основе среднего квадратического отклонения от тренда и табличного значения t-критерия при выбранном уровне значимости.

1. Каковы этапы построения стохастических моделей при оценке?

2. Как осуществляется исключение экстремальных значений цен из выборки?

3. Каков порядок проведения проверки нормальности распределения данных по малым выборкам?

4. Как производится оценка погрешности средней цены?

5. Как построить оценочную регрессионную модель?

6. Каковы возможности применения регрессионного анализа при построении моделей коррекции цены аналога с помощью коэффициентов торможения цены?

7. Приведите примеры прогнозных моделей, которые возможно использовать в оценочной деятельности.

5.3. Анализ точности результатов оценки Точность оценки — главное качество оценочной деятельности. Квалификация оценщика проявляется именно в достоверности и точности получаемых им результатов. Вопрос о точности возникает уже при заключении договора об оценке. Понятно, что повышение требований к оценке по точности сопряжено с дополнительными расходами на получение дополнительной информации, ее анализ и многовариантные расчеты несколькими методами. Поэтому детализированные, подробные оценки ценятся выше, чем обычные и тем более приближенные оценки.

При этом известно, что между точностью и срочностью выполнения работы имеется обратная связь.

В нормативных документах по оценке говорится о достоверности результатов оценки. Так, в статье 12 Федерального закона «Об оценочной деятельности в Российской Федерации» записано, что итоговая величина рыночной или иной стоимости объекта оценки, указанная в отчете, признается достоверной и рекомендуемой для целей совершения сделки с объектом оценки. О том, с какой мерой точности должна выполняться оценка в той или иной хозяйственной ситуации, не сказано ни в Законе, ни в Стандартах оценки.

Понятия достоверности и точности по содержанию довольно близки друг к другу. Однако, между ними существуют и некоторые смысловые различия. Достоверность — это правильность, истинность или неискаженность оцененной величины стоимости. По отношению к точности достоверность более широкое понятие. Достоверная оценка — это оценка объективная, непредвзятая и честная. Достоверность является обязательной предпосылкой точности. Лишено всякого смысла повышать или понижать точность расчета, если математическая модель построена на грубых допущениях. Точность предполагает соблюдение требования достоверности, но еще дополнительно характеризует объективно возможную степень приближения оцененной стоимости объекта к ее истинному значению. Когда говорят о точности оценки, то имеют в виду ту точность, которая может быть достигнута с помощью применяемого методического инструментария и с учетом надежности используемой информации, допуская, что принцип независимой оценки полностью выполнен, а оценщик обладает необходимым профессиональным уровнем.

Точность характеризуется степенью приближения оцененной стоимости объекта к ее истинному значению. Мерой точности служит ошибка (погрешность, отклонение), которая представляет собой разность между оцененной и истинной величинами стоимости. Поскольку стоимость есть прогнозируемая вероятная цена, то чем лучше совпадение оцененной стоимости с фактической ценой последующей продажи, тем выше точность оценки.

Истинное значение стоимости остается неизвестным вследствие отсутствия «идеальных» методов расчета. Поэтому на практике погрешность оценки определяют приближенно, когда истинное значение цены заменяется действительным или фактическим, полученным при помощи более точных методов расчета. Однако фактическую цену нельзя безоговорочно принять за истинное значение стоимости, так как реальные условия сделки могут существенно отклоняться от тех наиболее типичных условий, которые имел в виду оценщик, давая оценку.

При анализе точности оценки в качестве истинного значения стоимости берется не просто фактическое значение цены, а ее наиболее вероятное значение для заданных условий, «очищенное» от нехарактерных влияний некоторых факторов. Такой подход соответствует принятому представлению о рыночной стоимости как о наиболее вероятной цене, что записано в статье 3 Закона об оценочной деятельности, а также в Стандартах по оценке. Именно поэтому любая фактическая цена нуждается в анализе и проверке на репрезентативность, т. е. на представительность в качестве эталонной.

Теоретически ошибку можно определить, если применить другой, более точный метод расчета. Однако в случае оценки стоимости трудно принять какой-то один метод за эталонный. Любой метод, независимо от того, на какой подход он опирается (затратный, сравнительный или доходный), имеет свои плюсы и минусы. Поэтому чаще всего, когда это возможно, стоимость одного и того же объекта оценивают три раза, используя три подхода, а затем анализируют сходимость полученных величин.

Отклонение оцененной величины стоимости от истинной ее величины допустимо в таком размере, чтобы при этом не нарушался принципиальный вывод о целесообразности решения, принимаемого по результатам оценки (о покупке, страховании и т.д.), т.е. ошибка оценки должна находиться в допустимых пределах. Отсюда вытекает такое важное понятие, как допустимая ошибка (или допуск).

Ошибки могут быть случайными и систематическими. Случайные ошибки связаны с хаотичными, разнонаправленными колебаниями влияющих на стоимость и цены факторов (рыночных, производственных, социальных и др.). В зависимости от причины возникновения случайные ошибки в оценке стоимости можно подразделить на две группы: ошибки от неопределенности используемой для оценки информации и ошибки от несовершенства оценочной методики. Случайные ошибки первой группы проявляются в том, что исходные данные о ценах, тарифах, индексах и т.д. имеют приближенный характер и варьируются в некоторых интервалах. Ошибки второй группы вызваны в основном неадекватностью оценочной методики, принятыми в расчетах допущениями и упрощенными математическими формулами, не дающими точного описания реальных экономических явлений. К этой группе ошибок относятся и возможные ошибки вычислений.

Систематические ошибки — достаточно устойчивые отклонения оцениваемой величины от истинного значения, являющиеся результатом влияния или недоучета какого-либо стабильного фактора (ценового индекса, процентной ставки, показателя рентабельности, курсов валют).

Случайные и систематические ошибки содержат элемент субъективности. Они вносятся оценщиком либо непроизвольно (вследствие невысокой квалификации, невнимательности, поспешности в работе), либо преднамеренно в силу имеющейся заинтересованности, предвзятости или внешнего давления.

В литературе можно встретить весьма скудные и разноречивые сведения о точности экономических расчетов, погрешности которых, по мнению авторов, колеблются от 5 до 25%. Так, показатель себестоимости продукции определяют с погрешностью 3–5%, а исходные данные — 10–20%. Погрешности при укрупненных расчетах технико-экономических обоснований в ряде случаев достигают 30%.

Отчет об оценке должен содержать суждение о точности полученного результата. Оно может быть выражено тремя способами:

указанием ошибки или доверительного интервала; округлением рассчитанной величины; словесной характеристикой точности оценки. Указание ошибки или доверительного интервала свидетельствует о достаточно серьезном отношении оценщика к проблеме точности, особенно если эти сведения подкреплены точностным анализом. Округление рассчитанной величины стоимости — наиболее распространенный прием, применяемый опытными оценщиками для выражения степени точности полученного результата. Округление — это оставление в числе определенного количества верных значащих цифр. Согласно правилу округления погрешность округления не превосходит единицы десятичного разряда, определяемого последней оставленной значащей цифрой. Словесная характеристика точности — наименее удачное выражение суждения о точности, но ее наличие лучше, чем если в отчете вообще ничего не сказано о точности результата. Словесная характеристика дает чисто качественное представление о точности (оценка грубая, средней точности, высокой точности).

Основная задача точностного анализа заключается в том, чтобы на основе данных об ошибках в исходной информации путем исследования математических и логических моделей, входящих в расчетную методику, определить ошибку оцениваемой стоимости.

Общая схема точностного анализа представлена на рис. 5.3.1.

Разработка модели Рис. 5.3.1. Общая схема точностного анализа при оценке стоимости В то же время может решаться и обратная задача, когда задается предельная допустимая ошибка итогового показателя (в данном случае — оцениваемой стоимости) и исходя из нее находят допустимые ошибки факторов-аргументов.

Ошибки в оценке стоимости во многом предопределены неточностью исходной информации. Поэтому возникает задача выявить значения ошибок у показателей, на основе которых проводится оценка стоимости.

Для выявления ошибок у исходных данных в работах по теории ошибок рекомендуются следующие формальные методы:

анализ интервалов варьирования; анализ округленных чисел;

анализ таблиц; анализ малой выборки данных.

Анализ интервалов варьирования. Если в информационном источнике указан интервал варьирования показателя, то ошибка определяется довольно просто. Делают предположение о нормальном распределении показателя в границах интервала и примерном равенстве этого интервала шести или четырем сигмам. В качестве среднего значения берут середину интервала варьирования, а абсолютная погрешность принимается равной половине этого интервала.

Такой же подход правомерен и в том случае, когда границы интервала значений показателя определены экспертным путем.

Анализ округленных чисел. Данный метод дает неплохие результаты, если округление показателя увязано с ошибкой его оценки.

Абсолютная ошибка принимается равной ошибке округления, т.е. как единица десятичного разряда по последней оставленной значащей цифре. Относительная ошибка рассчитывается по формуле где А — первая значащая цифра приближенного числа;

n — количество верных значащих цифр.

Понятно, что если показатель имеет два верных десятичных знака, то его погрешность находится в пределах от 1 до 10%, а при трех верных десятичных знаках — от 0,1 до 1%. К сожалению, не всегда фактически взятые значащие знаки являются верными. Обычно указываемое количество значащих знаков больше, чем верных, поэтому данный метод, как правило, занижает ошибки. Тем не менее в сочетании с другими методами анализ округления позволяет получить определенную ориентацию в оценке точности исходных данных.

Анализ таблиц. Этот метод применяется тогда, когда исходные данные берутся из таблицы. В таблице значения параметров-аргументов функции разбиты на несколько интервалов и среднему значению параметра в каждом интервале соответствует величина зависимого показателя. Таким образом, при анализе таблицы выявляется погрешность от дискретного представления непрерывной функции, а тем самым косвенно определяется точность отраженного в таблице показателя.

Если функциональная зависимость показателя от параметрааргумента линейная, то числовые ряды в таблице представляют собой арифметические прогрессии. Разность между любыми двумя соседними значениями в числовом ряду постоянна и равна разности прогрессии. Абсолютная погрешность показателя определяется как половина разности прогрессии r числового ряда данного показателя, т.е. = r / 2.

Если функциональная зависимость, отображаемая таблицей, является степенной, то числовые ряды представляют собой геометрические прогрессии. Отношение любого последующего члена ряда к предыдущему постоянно и равно знаменателю прогрессии. Относительная погрешность определяется по формуле:

Анализ малой выборки данных. Этот метод применяется в случае, когда собрано небольшое количество значений (до 4 — 5) какого-либо показателя из одного или разных источников.

Метод анализа малой выборки данных составляет основу так называемого экспериментального подхода к определению степени точности, предполагающего статистическую обработку нескольких независимых оценок (замеров) анализируемого показателя.

В статистической теории ошибок одно полученное значение показателя называется точечной оценкой. Малая выборка — это набор точечных оценок, которые удалось собрать оценщику. По малой выборке объема n можно рассчитать среднее квадратическое отклонение точечной оценки:

где xi — текущее i-е значение показателя в выборке;

– — среднее значение показателя;

n — количество значений показателя в выборке.

В конечном счете нас интересует, насколько может отклоняться среднее арифметическое значение показателя – от его исx тинного значения. Мерой данного расхождения служит среднее квадратическое отклонение для среднего арифметического значения:

Абсолютная ошибка в определении показателя по среднему значению равна половине доверительного интервала, который накрывает рассчитанное значение показателя с заданной вероятностью. Эта ошибка определяется по формуле:

где tpn — коэффициент (критерий) Стьюдента при заданной доверительной вероятности Р и объеме малой выборки n.

В экономических задачах обычно ограничиваются доверительной вероятностью Р = 0,95. Если бы выборка была не менее 30 значений, то коэффициент Стьюдента можно взять равным двум (ошибка «два сигма»). Однако при оценке выборки данных весьма малы и поэтому коэффициент Стьюдента должен назначаться с учетом не только доверительной вероятности Р, но и объема выборки n. Эта зависимость показана в табл. 5.3.1.

Коэффициент Стьюдента при малых выборках Объем выборки Доверительная вероятность Р Из табл. 5.3.1 видно, как важно получить каждое дополнительное значение показателя, чтобы снизить ошибку.

На практике удобнее применять не абсолютные, а относительные ошибки. Относительная ошибка равна отношению абсолютной ошибки к среднему значению показателя:

Метод анализа малой выборки покажем на примере, когда оценка стоимости производится сравнением с идентичным объектом. Оцениваемая стоимость, как известно, представляет собой наиболее вероятную цену идентичного объекта. Так как цены на один и тот же идентичный объект (т.е. на одну и ту же модель машины) варьируют у разных продавцов, то обнаруживается ошибка для рассчитываемого среднего значения цены.

В табл. 5.3.2 приведены цены на распространенные модели деревообрабатывающих станков, назначенные пятью известными московскими дилерскими компаниями в середине июля года. Как видно, цены варьируются. Причины колебаний разные. Есть и экономические, хозяйственные факторы, есть и технические факторы (например, даже у одной и той же модели станка могут быть различия в комплектации, изготовителе, некоторых параметрах и т.д.).

Для каждой модели станка были рассчитаны средняя цена, абсолютная и относительная ошибки при доверительной вероятности Р = 0,95. Объемы выборки для разных моделей колебались от 2 до 5 шт. Из табл. 5.3.2 видно, что относительная ошибка колеблется от 3 до 22%. Абсолютная ошибка составляет в среднем около 10 тыс. рублей.

Разброс цен на деревообрабатывающие станки и ошибки оценки Модель Цены дилерских компаний, руб. Средняя Абсол. Относ.

Круглопильные и многопильные Строгальные 4-хсторонние Рамы лесопильные Рейсмусовые СР6-10 131400 122000 121700 133500 110000 123720 11712 9, Токарные Фрезерные Шлифовальные Комбинированные Сверлильно-пазовальные Фуговальные Торцовочные Заточные Обобщая полученные разбросы значений цен на деревообрабатывающие станки, можно прийти к выводу, что в среднем рассеяние значений цен вокруг среднего значения составляет около 10%.

Отсюда следует, что, делая оценку прямым сравнением по достаточно надежной ценовой информации, едва ли можно добиться точности с ошибкой менее 8–10%. Если же сравнение ведется не с идентичными моделями, а с аналогами и при этом нужно вносить еще дополнительно корректировки на различие в параметрах и других признаках, то ошибка оценки еще прирастет. Кроме того, надо иметь в виду, что проанализированный разброс цен относится к случаю, когда дилерские компании работают на рынке одного региона (в нашем примере — это центральный европейский регион России). Естественно, если оценщик возьмет цены компаний из разных регионов, то это покажет еще больший разброс, а, следовательно, увеличит ошибку оценки.

Чтобы узнать точность по результатам нескольких оценок, нужно соблюдать принцип независимости этих оценок. Независимы друг от друга должны быть как сведения о ценах аналогов, так и показатели вносимых корректировок. Положим, нам известна цена одного аналога и требуется внести одну корректировку. Имеются три варианта корректировок, что позволяет в итоге получить три скорректированные цены. Однако эти скорректированные цены не будут независимыми, так как они определены на основе одной исходной цены. В данном случае придется остановиться на каком-то одном варианте корректировки, который наилучшим образом соответствует характеру выбранного аналога.

Анализируя точность оценки, нельзя забывать о правилах последовательности внесения корректировок. Сначала вносят связанные (коэффициентные) корректировки, т.е. те, размер которых зависит помимо прочего и от величины исходной цены аналога.

Затем вносят независимые (поправочные) корректировки. Среди того и другого вида корректировок в первую очередь вносят наиболее значительные, а затем небольшие. Вспомним, кстати, что на весы тоже сначала кладут тяжелые гири, а потом все легче и легче.

Экспериментальный подход к анализу ошибок покажем на примере применения метода прямого сравнения с аналогом. Необходимо определить полную стоимость замещения (восстановительную стоимость) и показатели точности оценки вертикально-сверлильного станка по состоянию на конец августа 2000 года. Основные параметры станка: наибольший диаметр сверления 30 мм, вылет шпинделя 280 мм.

Собранные данные о параметрах и ценах аналогичных станков показаны в табл. 5.3.3.

Порядок внесения корректировок показан в табл.5.3.4.

Первая корректировка. Корректирующий ценовой индекс рассчитан исходя из продолжительности периода от момента действия цены аналога до момента даты оценки и среднемесячного темпа роста цен. В течение последних шести месяцев у аналогов 1, 3 и среднемесячный темп роста цен составил 4%, у аналога 2–6%.

Вторая корректировка. Параметрический коэффициент на отличие в диаметре сверления рассчитан на основе степенной функции с показателем степени («коэффициентом торможения»), равным 0,3.

Третья корректировка. Абсолютная поправка на различие по параметру «вылет шпинделя» рассчитана умножением разности в значении данного параметра на «цену» единицы параметра.

Последовательность внесения корректировок по шагам показана в табл. 5.3.5.

Оценка полной стоимости замещения вертикально-сверлильного Дата действия цены 31.08.00 31.12.99 31.05.00 30.11.99 31.12. Период до момента оценки, Корректирующий ценовой Абсолютная ошибка, руб. Относительная ошибка, % 18, 2 Наибольший диаметр Параметрический коэффициент по диаметру Разность по параметру:

Абсолютная ошибка, руб. Относительная ошибка, % 10, Критерием того, что вносимые корректировки оправданы и они повышают точность оценки, служит повышение сходимости скорректированных цен аналогов между собой по сравнению с исходными ценами. Если же корректировки взяты с большими ошибками, то будет наблюдаться разнобой скорректированных цен аналогов. Чтобы проверить данное условие, необходимо оценить ошибки до и после внесения корректировок.

В табл. 5.3.5 после первого шага, когда цены аналогов были приведены к одному моменту времени — дате оценки, их сопоставили между собой, рассчитали среднюю цену, а также ее абсолютную и относительную ошибки. Как видно, если не делать корректировок, ошибка оказывается довольно большой — около 19%. Затем внесли корректировки на различие параметров и это повысило согласие скорректированных цен между собой, ошибка снизилась примерно до 10,4%.

Чтобы быть уверенным в надежности получаемых результатов, необходимо расчет стоимости сопровождать оценками ошибок описанным выше способом.

Определить ошибку измерений по результатам нескольких замеров не всегда возможно. Вообще экономические показатели редко поддаются определению сразу несколькими принципиально разными методиками.

Тем не менее установление точности всего одного расчета стоимости вполне возможно. Стоимость объекта вычисляется с помощью определенной математической модели и тем самым является функцией нескольких переменных. Таким образом, задача сводится к нахождению ошибки функции исходя из ошибок переменных. Такой подход к определению точности называется аналитическим, так как в его основе лежит точностный анализ математической модели и исходных данных. Аналитический подход достаточно универсален: ведь точностному анализу можно подвергнуть любую математическую модель оценки, включая оценку и по доходам, и по затратам.



Pages:     | 1 |   ...   | 2 | 3 || 5 | 6 |   ...   | 8 |


Похожие работы:

«МЕТОДИЧЕСКОЕ ПОСОБИЕ Адаптивное компьютерное тестирование разработано Центром образовательных коммуникаций и тестирования профессионального образования г.Москва 2 СОДЕРЖАНИЕ 1 Компьютерное адаптивное тестирование 1.1 Обоснование необходимости перехода к компьютерному адаптивному тестированию 1.2 Разделение процесса тестирования на 2 этапа 2 Порядок разработки тестов 3 Особенности АСТ 3.1 Требования к структуре Банка тестовых заданий (БТЗ) 3.1.1 Пример 1 3.1.2 Пример 2 3.2 Формы Заданий,...»

«М.В. САФРОНЧУК МИКРОЭКОНОМИКА Рекомендовано Министерством общего и профессионального образования Российской Федерации в качестве учебного пособия для студентов высших учебных заведений, обучающихся по экономическим специальностям Второе издание, стереотипное УДК 330.101.542(075.8) ББК 65.012.3я73 C21 Рецензенты: А.Ю. Егоров, заслуженный деятель науки РФ, д-р экон. наук, проф., Ю.Ф. Воробьёв, д-р экон. наук, проф. Сафрончук М.В. Микроэкономика : учебное пособие / М.В. Сафрончук. — 2-е С21 изд.,...»

«ПЕНЗЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ПЕДАГОГИЧЕСКИЙ ИНСТИТУТ ИМ. В. Г. БЕЛИНСКОГО Историко-филологический факультет Направление Иностранные языки Гуманитарный учебно-методический и научно-издательский центр Пензенского государственного университета Авдеевские чтения Материалы I Всероссийской научно-практической конференции преподавателей, учителей, аспирантов, студентов и школьников, посвящнной 350-летию со дня основания г. Пензы 25 апреля 2013 года Пенза, 2013 1 Печатается по решению...»

«Уважаемые выпускники! В перечисленных ниже изданиях содержатся методические рекомендации, которые помогут должным образом подготовить, оформить и успешно защитить выпускную квалификационную работу. Рыжков, И. Б. Основы научных исследований и изобретательства [Электронный ресурс] : [учебное пособие для студентов вузов, обучающихся по направлению подготовки (специальностям) 280400 — Природообустройство, 280300 — Водные ресурсы и водопользование] / И. Б. Рыжков.— СанктПетербург [и др.] : Лань,...»

«Министерство образования Республики Беларусь УО ПОЛОЦКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ Кафедра уголовного права и криминалистики МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ К ПРАКТИЧЕСКОЙ ПОДГОТОВКЕ СТУДЕНТОВ заочной формы обучения по дисциплине ПРОКУРОРСКИЙ НАДЗОР для специальности 24-01-02 Правоведение г. Новополоцк, 2013 Рассмотрены и рекомендованы к утверждению на заседании кафедры уголовного права и криминалистики, протокол № 3 от 05 марта 2013 г. Заведующий кафедрой И.В. Вегера Составитель: ассистент кафедры...»

«Генина Э.А. МЕТОДЫ БИОФОТОНИКИ: ФОТОТЕРАПИЯ Учебное пособие САРАТОВ НОВЫЙ ВЕТЕР 2012 УДК [577.345:615.831](075.8) ББК 28.707.1я73 Г34 Г34 Генина Э.А. Методы биофотоники: Фототерапия. – Саратов: Новый ветер, 2012. – 119 с.: ил. ISBN 978-5-98116-149-0 Настоящее учебное пособие предназначено для расширения и углубления знаний студентов по вопросам действия света на биологические системы; изучения фундаментальных основ фотобиологических процессов и механизма фотодинамических реакций в биологических...»

«Министерство образования Республики Беларусь Учреждение образования Белорусский государственный педагогический университет имени Максима Танка Общественное объединение Белорусская ассоциация помощи детям-инвалидам и молодым инвалидам ОБУЧЕНИЕ И ВОСПИТАНИЕ ДЕТЕЙ В УСЛОВИЯХ ЦЕНТРА КОРРЕКЦИОННО-РАЗВИВАЮЩЕГО ОБУЧЕНИЯ И РЕАБИЛИТАЦИИ Учебно-методическое пособие 2-е издание Минск УО БГПУ им. М.Танка 2008 Книга издана в рамках международного проекта Создание национальных информационных центров при...»

«Федеральное агентство по образованию Государственное образовательное учреждение высшего профессионального образования Казанский государственный технологический университет ПРАВИЛА ОФОРМЛЕНИЯ ВЫПУСКНЫХ КВАЛИФИКАЦИОННЫХ РАБОТ Методическое пособие 2007 Федеральное агентство по образованию Государственное образовательное учреждение высшего профессионального образования Казанский государственный технологический университет ПРАВИЛА ОФОРМЛЕНИЯ ВЫПУСКНЫХ КВАЛИФИКАЦИОННЫХ РАБОТ Методическое пособие...»

«Федеральное агентство по образованию РОССИЙСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ НЕФТИ И ГАЗА им. И.М. ГУБКИНА Кафедра экономической теории ЭКОНОМИКА НЕДВИЖИМОСТИ Учебное пособие Под редакцией доц. Максимовой Е.В. Москва – 2005 ББК 65.9(28)0 Экономика недвижимости. Учебное пособие /Максимова Е.В., Шуркалин А.К. Борейко А.А. и др. Под ред. доц. Максимовой Е.В. – М.: РГУ нефти и газа, 2005, с. 272. ISBN 5-7246-0336-5 Авторский коллектив: Введение, I-III главы – доц.Максимова Е.В. IV, V –...»

«МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ имени М.В. Ломоносова ФАКУЛЬТЕТ ВЫЧИСЛИТЕЛЬНОЙ МАТЕМАТИКИ И КИБЕРНЕТИКИ VIII Международная научно-практическая конференция Современные информационные технологии и ИТ-образование СБОРНИК НАУЧНЫХ ТРУДОВ Под редакцией проф. В.А. Сухомлина Москва 2013 УДК [004:377/378](063) ББК 74.5(0)я431+74.6(0)я431+32.81(0)я431 С 56 Издание осуществлено при финансовой поддержке Российского фонда фундаментальных исследований (проект № 13-07-06076 _г) Печатается по решению...»

«ПЕТРОЗАВОДСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ Кафедра русской литературы УЧЕБНО-МЕТОДИЧЕСКИЙ КОМПЛЕКС ПО УЧЕБНОЕ ПРАТИКЕ Фольклорная практика Петрозаводский государственный университет Кафедра русской литературы УТВЕРЖДАЮ Декан филологического факультета А.Е.Кунильский _ _20 г. РАБОЧАЯ ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ по учебной практике Фольклорная практика для специальности Филология ГОС ВПО направления (специальности) 031001 (021700) Филология, 10.03.2000г. Курс Семестр Лекции 2 (час.) Экзамен в...»

«О.Л. Гнатюк ОСНОВЫ ТЕОРИИ КОММУНИКАЦИИ Допущено УМО по направлениям педагогического образования в качестве учебного пособия для студентов высших учебных заведений, обучающихся по направлению 050400 Социально экономическое образование МОСКВА 2010 УДК 316.77(075.8) ББК 60.56я73 Г56 Рецензенты: И.П. Яковлев, проф. кафедры теории коммуникации Санкт Петербургского госу дарственного университета, д р филос. наук, А.В. Соколов, засл. деятель науки РФ, засл. работник культуры России, проф. ка федры...»

«2013 Апрель Библиографический указатель новых поступлений по отраслям знаний Библиографический указатель новых поступлений по отраслям знаний Бюллетень Новые поступления ежемесячно информирует о новых документах, поступивших в АОНБ им. Н. А. Добролюбова. Бюллетень составлен на основе записей электронного каталога. Материал расположен в систематическом порядке по отраслям знаний, внутри разделов–в алфавите авторов и заглавий. Записи включают краткое библиографическое описание. В конце описания...»

«НОУ ВПО Институт экономики и управления (г. Пятигорск) НОУ ВПО ИнЭУ Кафедра Теории, истории государства и права УТВЕРЖДАЮ Председатель УМС Щеглов Н.Г. Протокол № 2 от 19 октября 2011 г. Методические указания по выполнению курсовых работ по дисциплине Конституционное (государственное) право РФ для студентов специальности: 030501 Юриспруденция очной и заочной форм обучения г. Пятигорск, 2011 Составитель: Гаглоева Л.А. ст. преподаватель Рецензент: Рапопорт Е.А., к.ю.н., доцент кафедры...»

«Федеральное агентство по образованию (Рособразование) Архангельский государственный технический университет Институт экономики, финансов и бизнеса УПРАВЛЕНЧЕСКИЙ АНАЛИЗ В ОТРАСЛЯХ Методические указания по выполнению контрольной работы Архангельск 2008 Рассмотрены и рекомендованы к изданию методической комиссией Института экономики, финансов и бизнеса Архангельского государственного технического университета 26 марта 2008 г. Составитель Т. М. Бровина, доцент, канд. экон. наук, зав. кафедрой...»

«Министерство культуры Российской Федерации Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования Самарская государственная академия культуры и искусств Научная библиотека НОВЫЕ ПОСТУПЛЕНИЯ за 2012 г. Самара 2012 1. ФИЛОСОФИЯ. ПСИХОЛОГИЯ. ЭСТЕТИКА. ЭТИКА Азарнова, А. Г. Метод ролевой игры в тренинге [Текст] : создание, проведение и разбор ролевой игры / А. Г. Азарнова. - СПб. : Речь, 2011. - 352 с. : ил. - (Бизнес-тренинг) Метод ролевой игры в...»

«1. Цели и задачи дисциплины, ее место в учебном процессе Цель дисциплины – дать знания по вопросам технологии комплексного использования древесного сырья в лесопромышленном производстве. В результате изучения дисциплины студент должен иметь представление: о взаимосвязи дисциплины с другими общепрофессиональными и специальными дисциплинами; о роли дисциплины в профессиональной деятельности; о месте статистических методов в системе обеспечения качества. об основных существующих и перспективных...»

«МИНИСТЕРСТВО ТРАНСПОРТА РОССИЙСКОЙ ФЕДЕРАЦИИ ФЕДЕРАЛЬНОЕ АГЕНТСТВО МОРСКОГО И РЕЧНОГО ТРАНСПОРТА Омский институт водного транспорта (филиал) федерального бюджетного образовательного учреждения высшего профессионального образования Новосибирская государственная академия водного транспорта ГОДОВОЙ ОТЧЕТ учебный год 2010 - 2011 (начало уч. года) (конец уч. года) Директор Т.И. Зайко (Подпись) (Ф.И.О.) ОМСК - 2011 (город) (год) Содержание 1 Организационно-правовое обеспечение образовательной...»

«Программа вступительного экзамена в магистратуру по направлению 131000 Нефтегазовое дело разработана на основании Федеральных государственных образовательных стандартов высшего профессионального образования бакалавриата в соответствии с рабочими программами дисциплин: Эксплуатация газонефтепроводов, Эксплуатация нефтебаз и АЗС, Эксплуатация насосных и компрессорных станций, Надежность и диагностика объектов транспорта нефти и газа, Сооружение и эксплуатация газонефтепроводов и газонефтехранилищ...»

«Конструкции из дерева и пластмасс: вопросы и ответы : учебное пособие, 2010, 331 страниц, Владимир Доюнович Ли, 5930574073, 9785930574074, Изд-во ТГАСУ, 2010. Пособие предназначено для студентов строительных специальностей всех форм обучения Опубликовано: 27th September 2011 Конструкции из дерева и пластмасс: вопросы и ответы : учебное пособие СКАЧАТЬ http://bit.ly/1cs1exA Конструкции из дерева и пластмасс: курс лекций для студентов строительных специальностей. – Часть 2,,,,.. Ч. I....»






 
2014 www.av.disus.ru - «Бесплатная электронная библиотека - Авторефераты, Диссертации, Монографии, Программы»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.