WWW.DISUS.RU

БЕСПЛАТНАЯ НАУЧНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА - Авторефераты, диссертации, методички

 


Pages:     | 1 |   ...   | 2 | 3 || 5 | 6 |   ...   | 11 |

«ВВЕДЕНИЕ В ВОЕННУЮ ГЕОГРАФИЮ Москва - 1924 2 Предисловие Систематический рост объема военной географии, как самостоятельной военной дисциплины, особенно ускоренный событиями и перспективами мировой войны 1914-1918 гг., ...»

-- [ Страница 4 ] --

Таким образом, статистическая таблица представляет собою правильно расчлененный свод чисел, расположенных по принципу однородности тех или других наблюдаемых явлений; в них добытый наблюдением сырой материал (первоначально заключавшийся в списках, листках, карточках, ведомостях) превращается в наглядное отражение установленных наблюдением типичных фактов и явлений со всеми характерными или изучаемыми признаками.

Одним из существенных требований, которым должна удовлетворять статистическая таблица, это возможная обозримость материала; эта обозримость должна сохраняться и при тех, часто очень разнообразных направлениях, по которым может направиться интерес будущих читателей таблицы. Это требование первостепенной важности. В хорошо спроектированной таблице должна «в последовательном порядке столбцов, граф и самих таблиц постепенно развертываться перед глазами исследователя цифровая картина тех свойств и качеств, какие составляют предмет наблюдения, и тех отношений, в каких отдельные части целого стоят друг к другу и к сопутствующим условиям» (Янсон).

Ниже приводится образчик таблицы; в ней показаны потери населения (сравнительно с нормальным ходом движения населения), происшедшие в результате мировой войны 1914-1918 гг. к средине 1919 г. Данные имеются по 10 государствам, принимавшим участие в войне. Не приведены данные по Турции, Греции, Соединенным Штатам, Японии, Азиатской России и колониальным владениям великих держав.

Государства Венгрия Британ.

Россия В методологии статистики таблицы рассматриваются под разными углами. Старое деление на монографические и синоптические ныне потеряло свой интерес, так как первый тип является ныне мало употребительным. Более существенное значение имеет классификация типов таблиц не по внешнему их виду, а по степени их сложности и вообще по их внутреннему содержанию, определяемому как свойством и самим числом тех признаков, которые приводятся во взаимную связь, так и самим характером этой связи.

«статистическому предложению», где «статистическое подлежащее»

разбитая на группы, по определенному принципу, масса случаев или индивидов получает характеристику в «статистическом сказуемом», т.е. в совокупности приведенных в определенную систему признаков.

Что именно помещать в вертикальных и что в горизонтальных графах зависит, с одно стороны, от характера материала, с другой от выдвигаемых на первый план научных и практических задач. Однако, как на более частое правило можно указать, что боковые заголовки, которым соответствуют горизонтальные строки таблицы, содержат «статистическое подлежащее», верхние заголовки, отвечающие вертикальным столбцам «статистическое сказуемое». Первые отвечают на вопрос, кто или что характеризуется помещенными в данной строке цифрами, вторые на вопрос: какими признаками характеризуется каждая из тех групп, обозначения которых даны в боковом заголовке.

Существенный характер или тип данной таблицы определяется, прежде различиями в характере и построении таблиц, которые исходят от боковых заголовков. В этом отношении таблицы принято разбивать на три основные характеризует эти три типа: «Простые таблицы это те, в которых материал подсчитан по единицам территории или по единицам времени. Групповые таблицы тоже приурочиваются к единицам территории (или времени), но сверх того даются итоги по отдельным групповым признакам… Дальнейшее Цитированное выше «О статистике», стр. 20.

развитие групповой таблицы представляет таблица комбинационная, где каждая группа распадается на новые подгруппы». Эти определения требуют только пояснений. Существенным признаком простых таблиц является тот, что в них материал подсчитан по единицам (пространства или времени) или по разнообразным другим основаниям, вытекающим из данной самой природой явления «натуральной группировки» случаев или индивидов, и притом каждой единице или единицам будет отвечать один или несколько признаков. Приведенная выше таблица об убыли населения за мировую войну, хотя с внешней стороны и большая, являет собой тип простой таблицы.

В ней при определенной единице времени (длительность мировой войны) каждому государству (единица пространства) отвечает ряд признаков: общая масса населения, потери от уменьшения рождаемости, потери на полях сражения и т.д. Конечно, эта таблица могла быть проще: можно было бы ограничиться всеми строками «государства» и только одним столбцом, например, III; можно было бы взять строки 2-3 «государств» и столбцы II и III и т.п. Вся таблица могла бы, например, свестись к совершенно простой:

ТАБЛИЦА V

Все это говорит, что перечневые таблицы могут быть более сложными и менее сложными, в зависимости от того, одной единице (времени или пространства) или нескольким отвечает один признак или несколько признаков.

Если же, например, по условиям исследования необходимо знать не общее лишь число павших на полях, но еще по определенным категориям (группам), например, павшие от ружейного огня, от артиллерийского, задушенные газами, контуженные и т.п., то столбец III, в свою очередь, распадается на ряд входящих в него столбцов (разобьется на ряд групп) и получит такой внешний вид:

ТАБЛИЦА VI

по подпризнакам или группам, отсюда и название таблицы групповой.

Подобным же образом могли быть разбиты в той же таблице и другие столбцы. Такое детализирование значительно усложнило бы таблицу, но давало бы возможность исследовать явление более углубленно и затронуть более разнообразные категории признаков или групп. Но если мы при детализировании изучаемого явления пойдем еще дальше и каждую группу потерь разобьем по признаку принадлежности к тому или другому роду войск или строевых специальностей, например, пехота, кавалерия, артиллерия, саперы, пулеметы, санитарная часть, обозные и т.д., то таблица по своим верхним заголовкам представится уже следующей, гораздо более сложной картиной:

пехота подразбиты каждая на подгруппы по признакам рода войск. Такая таблица, комбинационной. Но эта таблица, в свою очередь, могла бы быть развита еще дальше разбивкой каждой подгруппы на новые подгруппы по признаку, например, командного состояния, т.е. в каждом роде войск потери от ружейного огня разбить на категории офицеров и солдат и т.д. Легко видеть, что между групповой таблицей и комбинационной существенной разницы нет; вторая является лишь более сложной, почему можно держаться простой классификации таблиц на простые (перечневые) и комбинированные *.

Приведенные таблицы показывают, насколько растет количество цифр при переходе от простых таблиц к комбинированным и от этих, простого вида, к ним же, но более сложного вида. Сделаем подсчет, взяв лишь один признак потери на полях сражений. При простой таблице отнесенной к десяти государствам, мы имели 10 цифр, не считая общей суммы. При разбитии этого признака на группы по отдельным типам боевой смерти мы из каждой цифры получили 5, а с первой исходной получилось всего 6; или при анализе 10 государств получается 60 цифр. При дальнейшей разбивке по роду войск каждая подгруппа потерь, от той или другой причины, разобьется на новых подразделений, т.е. получится 42 новых цифры, а с отнесением к государствам получатся в общей сумме 420 цифр. Таким образом, мы видим, как с усложнением типа таблиц растет число цифр, яркий показатель растущего многообразия статистической картины.

А.А. Кауфман приводит такой пример, пусть, например, имеется в виду изобразить расчленение данного населения на две группы по полу, три по семейному состоянию и сто по возрасту; при простой разработке будет в таком случае 2 + 3 + 100 = 105 граф таблицы; при комбинированной число Конечно, мы, считаясь при изложении статистического метода с упрощенными задачами курса, приводим наиболее упрощенную классификацию таблиц. Имеются более сложные У.Боули (Elements of statistics, стр.74) мы находим три типа таблиц, совершенно иначе сконструированные.

граф будет равняться не сумме, а произведению числа отдельных признаков 2 3 100 = 600. Если ввести в табличную группировку еще и занятия, например, взять для лиц каждого пола (2) и каждой из 40 возрастных групп профессиональных категорий и 4 группы по положению отдельных лиц в предприятии, то при простой сводке получится всего 2 + 40 + 50 + 4 = табличных столбцов, при комбинированной 2 40 50 4 = столбцов.

комбинированной таблицами приведем два образчика таблиц, где показаны распределения по полу, возрасту (взяты рабочий и полурабочий) и по четырем видам занятий.

При простой разработке таблица получит такие верхние заголовки

ТАБЛИЦА VIII

При комбинированной она получит такие заголовки:

ТАБЛИЦА IX

Всего душ При составлении таблиц должны быть соблюдены следующие принципиальные правила:

А) Разделение материала на группы должно быть строго согласовано с характером и свойствами материала, причем обычные научные рубрики, принятые в той или другой отрасли знания, могут оказаться неприложимыми к данному цифровому материалу, и таковой может, поэтому, потребовать своей особой группировки.

Б) Разложение вопроса на рубрики в таблице должно отвечать требованиям логической классификации: разгруппировка данной социальной массы по рубрикам должна быть выполнена, в каждом случае по одному общему признаку и притом так, чтобы рубрики друг друга исключали, а взятые в совокупности исчерпывали все содержание данного явления *.

Выполнение этого требования дает, между прочим, возможность поверять правильность табличных подсчетов: естественно, что суммы цифр, показывающих распределение населения по возрастам, вероисповеданию, национальности и проч. должны равняться общей цифре всего населения;

профессиональных и др. групп, должна равняться итоговой цифре того же населения, подсчитанной по территориальным делениям и т.д.

В) Таблицы, дающие картину социального явления, должны быть согласованы с таблицами, в которых воплотились результаты более ранних подразделения, определенно держаться раз установленных понятий и т.д., иначе сравнение новых таблиц со старыми, в силу неоднородности, будет невозможным.

Г) Рубрики таблиц должны быть составлены только по таким признакам Это требование не универсально. Оно не может, например, распространяться на признаки, которые встречаются лишь в ограниченной части случаев массового явления. Сумма рубрик, показывающих число слепых, глухонемых и т.п., конечно, не исчерпывает всего населения.

явления, которые могут быть использованы при последующей обработке статистического материала, но при этом должны быть исчерпаны все такие признаки, так как в природе статистической обработки раз упущенное не может быть пополнено впоследствии.

Это требование вызывает необходимость не только иметь практическое знакомство со статистическими работами, но быть знакомым с состоянием научных знаний и с текущими научными запросами. Например, надо иметь представление о соотношении между преступностью и временами года, между рождаемостью и степенью обеспеченности и т.д. Иначе можно ввести данные, которые в процессе обработки окажутся пустым балластом, увлечься, как говорят статистики, коллекционированием цифр или упустить такие, которые обещают большие научные плоды.

Последнее требование подводит нас к вопросу об объеме и содержании таблиц. Объем или, как говорят иначе, пределы разработки статистического материала, составляют тот лукавый вопрос, на который методология, не может дать определенного ответа. С одной стороны, не попавший в обработку материал гибнет на всегда, а длинный ряд вопросов один другого интереснее встает пред глазами исследователя, причем наука и практика настойчиво выдвигают свои темы, но с другой стороны, работа рискует усложниться до невыполнимости и вообще нет физической возможности произвести подсчеты и опубликовать их результаты во всех мыслимых направлениях и комбинациях цифр.

Таблица с одной стороны должна возможно исчерпывающе соединить в себе такое количество признаков, которое в достаточных подробностях обрисовало бы изучаемое явление не только по его составу, но и с точки зрения взаимного отношения его элементов. Но при этом, однако, нельзя упускать из виду и того обстоятельства, что таблицы должны сохранить известную степень наглядности, должны давать возможность легко ориентироваться среди цифровых данных, позволять скоро находить в них, что надо.

В плоскости этих общих, чисто принципиальных соображений только и может быть решен вопрос об объеме таблиц. Жизнь и практические требования обычно вносят в вопрос свои пожелания, отбрасывая его решение далеко за рамки разумно и научно желаемого.

Что касается до содержания таблиц, то, как выбор массового явления подлежащего изучению, так и выделение в нем тех или иных признаков, как мы видели, намечаются уже программой исследования, и таблица получит задачу лишь воплотить уже в себе ту или иную группу вопросов возможно целесообразно, наглядно и поучительно.

Полученные в результате сводки первичных статистических записей абсолютные величины, да еще сведенные в таблицы, уже значительно помогают нам разобраться в массовых социальных или естественных явлениях. Прежде всего, они отвечают на вопрос об общей массе (население данной страны, общее число десятин пахотной земли, общая численность вооруженных сил), что само по себе представляет уже практическую ценность. Точно также, когда речь идет о хронологических изменениях явлений, совершающихся в одной стране или вообще в какой-либо одной среде, при условии неизменности или малой изменяемости этой среды, мы можем с большим успехом пользоваться абсолютными цифрами.

И все же, пользуясь одними лишь абсолютными (сырыми) величинами, мы можем ответить далеко не на многие вопросы, не в силах всесторонне углубить наше внимание в толщу массовых явлений: мы не можем составить себе ясной картины о движении, о действительной градации изменений, о возрастании или убывании явлений, а еще менее мы можем использовать абсолютные цифры для сравнений и сопоставлений (существо статистического анализа), особенно применяя таковые для различных, независимых одна от другой, социальных масс. Словом, мы, как и на каждом шагу жизни, нуждаемся при изучении масс в одной какой-то общей мере, чтобы найти удобные для сравнения пропорциональные величины.

Строго говоря, абсолютными величинами уже устанавливается отношение между числами; например, подсчитав, что среди населения губернии в 2.500.344 душ имеется 1.249.858 мужчин и 1.260.495 женщин, что территория равняется 137.240 кв. верст, что в среде населения в течение года произошло 97.152 рождений и 74.247 смертей, мы получили определенные соотношения, но они не наглядны, они требуют для своего понимания напряжения мысли, а, значит, потери времени. Это вызывает необходимость какого-то упрощенного процесса, выкладок, чтобы превратить абсолютные величины в какие-то иные, вызывающие в нас быстрое и легкое представление о взаимоотношениях. Вот почему абсолютные числа для последующего статистического анализа предварительно преобразовываются в производные величины или, называемые иначе, статистические коэффициенты: такими производными будут либо средние величины, либо относительные величины.

Мы часто сами того не замечая, прибегаем в жизни или к той, или другой из величин при необходимости ответить на встречающийся нам вопрос. Зная, например, что один человек зарабатывает 12 миллиардов рублей, а другой 22, мы легко отвечаем на вопрос, кто зарабатывает больше, кто меньше, но уже мы затруднимся сказать, кто из них лучше обеспечивает свою семью. Мы должны знать число членов семьи. Узнав, что первый имеет только жену, т.е. живет вдвоем, а второй имеет на своем попечении 10 душ, мы, прикинув, что на душу первой семьи приходится 6 миллиардов, а на душу второй только 2, приходим к выводу, противоположному с первым. Вторая семья, получая абсолютно больше по сравнению с первой, денежно обеспечена втрое слабее. Здесь мы для уяснения дела прибегли к отысканию относительной величины (делили получаемую сумму на число душ семьи).

Другой пример. Вы получили месячное содержание. Хватит вам его для прожитья на месяц и сколько вы можете истратить на посторонние нужды?

Как вы решаете вопрос? Вы намечаете какую-то среднюю трату в день, множите на 30 и узнаете месячную потребность. Излишек относите на посторонние нужды. Среднюю вы могли получить разными путями, или разделив за вычетом случайных трат жалование прошлого месяца на 30 дней, или взяв число дневных расходов прошлого месяца и разделив сумму их на взятое число. В этом случае вы пользуетесь другим типом производных величин, т.е. средней.

Поясним еще примерами. В одном уезде подсчитано 67.543 женщин и 59.324 мужчин, а в другом 45.432 женщин и 38.225 мужчин. В каком уезде большее преобладание женщин. Добытые абсолютные цифры не дают вам на это легкого и скорого ответа. Вам надо прибегнуть к производной величине.

Вычислив, что на 100 женщин в первом уезде приходится 88 мужчин, а во втором на 100 женщин 86 мужчин, вы легко решаете вопрос. В данном случае вы воспользовались относительными величинами, но другого вида, чем в первом примере.

Наконец, еще такой пример. Одно государство для таможенной охраны располагает 40/тыс. человек стражи, а другое 12/тыс. Какое из них более обеспечило надзор границы людским персоналом. Данные абсолютные числа, хотя и сильно расходящиеся между собою не дадут вам ответа, но если вы узнаете длину пограничной линии того и другого государства, разделите число верст на число стражи и узнаете, что в первом случае на версту приходится, например, 1/3 человека, а во втором 1/2, вы уже можете ответить, что людским надзором более обеспечена граница второго государства В этом случае вы прибегли к определению опять же относительной величины, того же вида, как и в первом примере.

Из этих примеров видно, что абсолютные величины пригодны бывают лишь иногда и довольно редко. Эти числа, как говорят, не имеют веса, их масса относительно неопределенна, их, повторим, нельзя ни сравнивать, ни сопоставлять. Этим и вызывается необходимость приведения их к производным величинам.

Из производных величин средние явятся общей мерой признаков, имеющих в отдельных случаях разнообразную численную величину (средний рост, средний годовой заработок); относительными величинами будут цифры, выражающие: 1) численное отношение частей явления к целому (число мужчин, лиц определенного возраста, слепых и т.д. к общему числу населения) или между собою (отношение числа мужчин к числу женщин, числа мужских рождений к женским и т.д.) и 2) численное отношение явления к среде, в которой оно совершается или из которой происходит (густота населения, смертность, брачность, рождаемость) или двух или нескольких, допускающих сравнения, явлений (отношение рождений к числу смертей в том же году, числа разводов к числу случаев овдовения и т.д.).

Перейдем к рассмотрению относительных чисел. Вдумываясь в их содержание, мы найдем, что оно неоднородно, что смысл относительных чисел может быть различен. Расчленение известной массы на ее составные части, например, населения по полу, возрасту, профессии и т.п. имеет совсем другой смысл, нежели такие величины, как густота населения, преступность и т.п. Ясно, что общее понятие «относительной величины» содержит в себе различные виды или типы производных величин, и возникает вопрос об их классификации, отвечающей их внутреннему существу.

В русской методологической литературе со времен Янсона было принято разбивать относительные числа на две категории: отношения экстенсивности и отношения интенсивности. К первым относились такие, которые показывают, насколько, вообще, одно из сравниваемых явлений или признаков больше или меньше другого или других; под вторыми разумелись отвечающие на вопрос, как часто случается известное явление в известной среде. Эта классификация постепенно оставляется на науке: особенно первая ее часть, включавшая в себе существенно различные вещи, подавала повод к недоразумениям.

Лексис в классификацию вводит элемент вероятности явления и разбивает относительные числа на две основных категории: отношения вероятности и отношения координации. Первая категория подразделяется им на генетические и аналитические отношения. Эта более совершенная классификация имеет некоторые недочеты в своей части об отношениях координации.

А.А. Кауфман предложил следующую классификацию относительных чисел:

А. Отношения интенсивности или частоты, т.е. такие относительные числа, которые показывают, как часто известное явление исходит из определенной среды или как часто оно происходит в данной среде… густота населения, преступность.

Б. Отношения распределения (или аналитические), т.е. такие относительные числа, которые показывают расчленение данной массы на части, отличающиеся от остальных тем или другим особым признаком, или отношение друг к другу нескольких таких частей... отношение числа мужчин к числу женщин.

В. Отношения наглядности, т.е. такие, которые показывают численное отношение непосредственно не связанных между собою, по своей сущности, величин... отношение числа рождений к числу смертей в том же году.

Для численного изображения отношений того или иного типа прибегают к простейшим арифметическим действиям. Рассмотрим их, начиная с аналитических (отношений распределения), как наиболее простых.

Повторим, что к этой категории относятся расчленение населения по полу, возрасту, грамотности, роду занятий; расчленение общей вооруженной массы по роду войск, по годам призыва на службу, по специальным категориям и т.д.; расчленение общей массы преступников по роду и характеру совершенных преступлений, по мотивам (по повторности совершенных преступлений) и т.д. Для численного изображения отношения этого типа, обычно прибегают к вычислению процентов, причем за 100 принимается сумма всех составных частей, иначе сказать, вся та масса, расчленение которой подлежит изучению. Мы принимаем за 100 общую цифру вооруженных сил и вычисляем по простому и «тройному правилу», сколько на каждую сотню приходится лиц пехоты, артиллерии, кавалерии, воздушного флота и т.д.; принимаем за 100 общее число преступлений и вычисляем, сколько на сотню приходится преступлений каждой отдельной категории и т.д. Конечно, этими примерами намечен только путь создания относительных чисел; примеры могут быть другие, а также в приведенной массе могут быть взяты совершенно другие признаки.

Могут быть такие случаи, что, разбивши массу на группы, мы за примем одну из этих групп, почему-либо представляющую интерес и по отношению к этому признаку вычислим в процентах другие.

Иногда, когда какой-либо признак (или признаки) проявляется слишком редко, то общая сумма принимается не за 100, а за 1000 и даже за 10.000 и затем высчитывается, сколько на 1000 (10.000) приходится чисел того или иного признака.

Приведем для примера таблицу *, показывающую относительные числа слепых и глухих в различных государствах к общей массе населения.

Наряду с указанным приемом относительные числа данного типа могут быть вычисляемы и другим способом, который особенно применим в том случае, когда изучаемая масса по данному признаку расчленяется всего на две крупных части; самый обычный пример этого рода участие в том или другом социальном явлении лиц мужеского и женского пола. Если мы желаем изобразить распределение по полу населения страны (города) или рождений, или преступности, или самоубийств, мы можем принять за сто число случаев одной из двух крупных категорий и вычислить, сколько на эту сотню приходится случаев другой категории сколько приходится женских рождений на сотню мужеских, слепых женщин на сотню слепцов и т.д. В городе, например, 7028 мужчин и 6503 женщин; принимая 13.531 за 100, мы определим число мужчин равным 52 и женщин равным 48. С другой стороны, мы можем число мужчин взять за 100 и по отношению к нему определить число женщин; в этом случае оно будет 95. Прилагаемая таблица Она взята нами у Янсона, который составил ее по «последним переписям», и значительно сокращена.

Ю.Э.Янсон. «Сравнительная статистика России и западно-европейских стран», СПб, том I, 1878, 372 и Том II, 1880, 662, Том I, стр. 70.

иллюстрирует ту же мысль.

В случае изменения явления во времени также можно применить прием процентов, но несколько иначе. Положим, в известном населенном пункте в определенном году насчитывалось 1500 чел., в следующем году 1550, в следующем 1650 и т.д. Приняв 1500 за 100, мы получим такой ряд относительных чисел: 100, 103, 110; они наглядно покажут ход возрастания населения и очень удобны для сравнения.

Конечно, способ приведения к процентам, внешне изменяя числа, не изменяет ни их соотношений, ни их сущности; он нагляден, прост и вызывает в уме легкое восприятие количественных соотношений.

Другую группу относительных чисел составляют те, которые, как сказано выше, показывают интенсивность, частоту изучаемых явлений, т.е.

отвечают на вопрос, как часто проистекает известное явление из известной среды, как часто случается известное явление в известной среде? На этот вопрос часто приходится искать ответа, так как аналитические отношения иногда не в силах дать понятия об отношениях этой категории. Пусть мы знаем, что из каждой тысячи преступников 25 приходятся на возрастную группу 16-20 лет, 100 на группу 21-25 лет и т.д. Можно ли непосредственно вывести отсюда заключение, что вторая возрастная группа обнаруживает в раза большую преступность, чем первая? Конечно, нет, раз мы не знаем, как велика численность каждой из этих возрастных групп. Чтобы получить ответ, нужно измерить относительную частность или интенсивность явления. Это один пример отношений интенсивности. Другие примеры той же разновидности рождаемость, смертность, брачность, преступность и т.п.;

рождения, смертные случаи, браки происходят в среде населения страны, города, провинции; из среды населения же выходят преступники. К той же категории отношений интенсивности относятся густота населения, среднее потребление хлеба, отношение длины железнодорожной линии к тому пространству и тому населению, которое ими обслуживается, отношение общей массы потребляемого чугуна, нефти, вина, сахара к общей численности потребляющего их населения и т.д.

Принципиальное отличие всякого рода отношений интенсивности от отношений распределения всегда будет проявляться в том, что отношения интенсивности всегда выводятся из сопоставления фактов, по существу разнородных с тою средой, в которой или из которой они происходят:

населения с территорией; преступлений, смертных случаев, рождений с населением; пробега вагонов или паровозов с длиною железнодорожной сети. Напротив, отношения распределения всегда выводятся из сопоставления целого с его частями или частей, различающихся по определенным разновидностям известного признака.

Не лишнее еще раз пояснять, что для всесторонней характеристики явления очень часто приходится прибегать к вычислению отношений обоих типов: изучая население и узнав его массу, мы тотчас же заинтересуемся узнать густоту населения, но затем и расчленение его по тем или иным признакам; изучая армию и определив отношение числа людей под оружием к общей массе населения, мы будем изучать и ее состав по интересным признакам; изучая преступность, мы не ограничимся вычислением общего ее коэффициента, но постараемся вычислить и распределение преступников по полу, возрасту, профессии и т.д.

Способы выражения отношения интенсивности двояки. Можно принимать за основание вычисления среду, в которой совершается явление, т.е. решать задачу, как велико число случаев изучаемого явления, которое дает принятая за единицу среда, и можно принимать за основание единичный случай явления, т.е. вычислять, как велика среда, дающая один случай.

Густоту населения можно выразить или числом душ, приходящихся на единицу территории, либо площадью территории, какая приходится на душу населения; густоту занятия боевого фронта войсками можно выразить или числом верст фронта, приходящихся на одну дивизию или той долей дивизии, которая приходится на одну версту фронта; преступность может быть выражена либо числом случаев преступлений, приходящихся на каждые десять или сотню тысяч населения, или числом душ населения, приходящихся на один случай преступления.

Практически применяется чаще первый способ, который нагляднее, в котором повышение интенсивности сопровождается увеличением относительной цифры (а не наоборот, как во втором случае) и к которому, наконец, более привыкли.

Для того, чтобы относительные величины давали правильное представление о характере явления, чрезвычайно важно правильно выбрать ту среду, с которой будет сопоставляться изучаемое явление; неверный выбор или неправильное сужение этой среды могут привести к неправильным заключениям. Эта задача не всегда бывает легкой. Среда может быть трудно определимой. Например, при изучении смертности в городе, когда ее желательно провести по месяцам, вы можете не иметь не только численности населения, отнесенной к месяцу, но и годовой... проходится пользоваться какой-либо устаревшей переписью. Бывают случаи, что общая среда может быть определена, но трудно определить, какая часть ее должна быть взята для данного случая. При определении преступности не имеет смысла и неправильно сопоставлять число преступников со всем населением, а необходимо сопоставлять лишь с дееспособной частью населения; также при определении рождаемости придется сопоставлять случаи рождения не с общим числом населения, а с числом женщин, от которых по возрасту могут ожидаться дети (рождающая возрастная группа) и т.д.

Вообще же этот вопрос не всегда достаточно ясен, а часто зависит от точки зрения исследователя или от практических целей. Например, плотность населения или обеспеченность землей, обычно, определяются не по отношению ко всей территории, а за выбросом из нее совершенно необитаемых пространств (большие водные площади, болота, пески и т.д.), в первом случае или за выбросом непригодных для обработки во втором. И это решение правильно. Но если будет поставлен вопрос об использовании населением территории или будут подняты темы об организации школьной сети, медицинской помощи, о сооружении железных дорог и т.п., то во всех этих вопросах относительные числа необходимо определять к общему пространству.

Вопрос об основании также выдвигается и при определении отношений распределения, но несколько в ином виде. Здесь также приходится решать вопрос, какую массу надлежит, в данном случае, изучать в ее расчленении, по какому основанию вычислять относительные числа. Например, при вычислении коэффициента грамотности придется из общей массы населения выбросить возрастные группы до 6-7 лет; при определении коэффициента обучения в начальных школах придется ограничиться группами населения от 8 до 14-ти летнего возраста; при определении коэффициента призыва под оружие в мирное время придется из массы населения выбросить женщин, стариков и детей и т.д.

В данном случае приведены наиболее простые примеры, достаточные для пояснения основной мысли. Бывают случаи гораздо более сложные.

Например, при определении относительных чисел распространенности разных типов крестьянских аренд или распространенности разных видов промыслов сельского населения (Кауфман) и т.д. Иногда возникают темы, допускающие разные решения, почти равнозначащие по идее, но более подчеркивающие (удачливее) ту или другую сторону исследования.

Третья категория относительных величин отношение наглядности не представляет большого интереса сравнительно с первыми двумя. Это те отношения, как сказано выше, которые показывают численное отношение непосредственно не связанных между собою, по существу, величин и вычисляются единственно ради повышения наглядности и облегчения сравнений.

Мы уже упоминали, что к этой категории относятся такие цифры, как отношение рождений к числу смертей, браков к числу разводов, ввоза к вывозу… все для одной территории и одного момента времени. Одна из сравниваемых величин принимается за 100, и по ней вычисляется другая.

Сюда, конечно, будут входить и цифры, показывающие изменение какоголибо явления во времени или показывающие различия, наблюдаемые по отношению к данному явлению в пространстве: изменения погодных цифр смертности, преступности, ввоза или вывоза и т.д.; и с другой стороны:

различия в цифрах добычи каменного угля, производства хлеба и т.п. в разных странах или частях страны. Приведем такой пример: * даны погодные цифры вывоза двух стран: страны А 1.500, 1.400, 1.450, 1.300, 1.250, 1.300, 1.100, 1.200, 1.000 милл.; страны Б 520, 540, 600, 540, 700, 650, 700, 670, 750 милл.

Даже без производства преобразований мы можем сказать, что страна А вывозит значительно больше, чем страна Б, но что вывоз первой имеет тенденцию понижаться, а вывоз второй растет. Но чтобы достигнуть большей наглядности и усмотреть темп роста или понижения, преобразуем абсолютные цифры в относительные, принимая вывоз первого года в каждой Взят у Кауфмана.

стране за 100. Получим такие два ряда относительных величин:

Для страны А 100, 93, 97, 87, 83, 87, 73, 80, 67.

Для страны Б 100, 104, 115, 104, 135, 125, 135, 129, 144.

Теперь мы сразу видим, что вывоз страны А сократился ровно на треть, а вывоз страны Б возрос почти на половину, т.е. получим отчетливое представление о темпе изменений в том и другом из вывозов.

Из сказанного мы видим, что вычисление отношения наглядности имеет ограниченную область достижений: оно лишь несколько увеличивает наглядность, позволяет быстрее и с меньшим напряжением уловить направление, в каком изменяются цифры данного ряда или уяснить существенное сходство (различие) в изменении нескольких сопоставляемых рядов. И в то время, как вычисление, например, «отношений распределения»

демонстрирования цифр, приемом художественного порядка.

В математике под средней величиною (еще со времен Пифагора) гармоническую. Из них к исследованию массовых явлений (общественных Средние получаются из трех видов пропорций:

гармоническая а : в = а – в : в с, где а, в и с три данных величины. Согласно свойствам пропорций, получим:

в геометрической в2 = ас, в гармонической геометрическая средняя арифметическая. Она выводится говоря в общей форме путем деления суммы, в которой выражается данный признак, на число случаев (индивидов, экземпляров, штук). Если имеем две величины 2 и 6, то средняя (слово «арифметическая» обычно отбрасывается) будет Средняя величина обладает двумя свойствами:

А. Сумма уклонений от нее (разница между средней и каким-либо отдельным числом ряда) отдельных величин, из которых она составлена, в положительную сторону равна сумме уклонений в отрицательную, т.е.

сумма (алгебраическая) всех уклонений равна 0. Так, во втором примере средняя 6 более 3 и 5 на 3 и 4 и уклонения в этом случае будут -3 и -1, но она меньше 7 и 9; уклонения будут +1 и +3, откуда видим, что суммы уклонений -4 и +4 равны, а их алгебраическая сумма (-4) + (+4) = 0.

Б. Сумма квадратов уклонений от средней имеет наименьшее значение, т.е.

эта сумма будет меньше, чем сумма квадратов уклонений от всякой другой величины, как бы близка к средней она ни была.

Возьмем тот же пример. Отклонения от средней будут –1, -3, +1, +3, их сумма квадратов будет (-1)2 + (-3)2 + (+1)2 + (+3)2 или 1 + 9 + 1 + 9, т.е. равна 20. Если возьмем вместо средней 6 какую-либо другую, близкую к ней, например, 7; соответственные уклонения будут -4, -2, -1, +2; сумма квадратов будет равна 25. Возьмем вместо 6 цифру 5; уклонения будут –2 + 1 + 2 + 4;

сумма квадратов 25. Если бы взяли вместо 6 3, сумма квадратов была бы уже 65, при 9 была бы также 65, т.е. значительно больше. Значит, при средней 6 мы имеем сумму квадратов отклонений равной 20, при других величинах и 65.

Значение средней в статистике огромно. Она настолько тесно связана с особенностями статистики, как метода изучения социальных и им подобных масс, что статистику можно просто назвать наукой о средних величинах. * Затем, средняя доставляет наглядность, удобство обозрения, пестрой и капризной, в единичных случаях, массы статистического материала, а затем и суммарного сравнения с другими однородными, тоже сколько угодно пестрыми в отдельных случаях, массами. Еще большее значение средняя статистической работы сводятся к изолированию влияния постоянных причин от действия причин случайных, из которых первые дают явлению известную однородность, устойчивость, планомерную повторяемость, вторые же производят в явлениях отклонения и изменения. Чтобы измерить эти нормальному уровню, отыскать единицу меры, принадлежащую тому же порядку вещей, им однородную. Средняя и есть этот нормальный уровень;

она будет той единицей меры, с которой мы удобно можем сравнивать существующие в действительности отклонения изучаемого явления. Говоря иначе, средняя величина является первичным, рудиментарным преддверием закона.

При вычислении средних точно также, как и при вычислении относительных величин, мы встречаемся прежде всего с вопросом: по какому основанию вычислять среднюю? по расчету на всю массу случаев, хотя бы характеризуемых отсутствием иногда данного признака, или только на число тех случаев, где данный признак имеется в наличности? Конечно, такие вопросы возникают не всегда. Когда вы имеете, например, несколько промеров цепью (при топографических работах), несколько измерений объема груди у данного числа новобранцев, когда вычисляем средний рост или возраст данной группы лиц, нам ничего не остается, как полученную сумму измерений разделить на все число индивидов (промеров в первом случае). Но для вычисления, например, средней посевной площади крестьян, двора или «Science of averages», по выражению англичан.

среднего числа собранного хлеба, можно в качестве делителя взять все число дворов, если исследователя интересует продовольственная обеспеченность населения, или взять в качестве делителя лишь общее число дворов, имеющих запашку, если исследователь интересуется средним типом земледельческого хозяйства.

Словом, выбор основания подсказывается обстановкой исследования, а, главное, конечными его целями.

Как мы говорили, самый элементарный и наиболее употребительный прием вычисления средних это вывод арифметических средних из ряда выраженных в цифрах наблюдений, т.е. простое деление суммы чисел, в которых выражается признак, на число случаев. Этот прием отыскания средней применяется к тому ряду чисел, из которых каждое относится к одному случаю, индивиду или экземпляру. Отсюда, как основное условие, вытекает: средние должны быть выводимы, как правило, только из рядов абсолютных чисел, но не из средних или относительных величин, каждая из которых ведь относится не к одному случаю, а к известной группе случаев;

может быть, даже очень крупной. Исключением из этого правила может быть лишь тот случай, когда в нашем распоряжении будут только средние или относительные величины, и нет тех абсолютных чисел, из которых они были выведены... Такое решение допустимо, но его нельзя возводить в правило.

Указанный выше элементарный прием ведет к определению так называемой простой средней, в отличие от другого вида средней, какая называется сложной или взвешенной средней *. Такая средняя возникает тогда, когда каждое или некоторые из чисел, из которых надлежит вывести среднюю, суть не запись единичного случая или экземпляра, а показание, Некоторые писатели неправильно ее называют средней геометрической. Название взвешенной она, преимущественно, носит у англичан и итальянцев.

относящееся к целой группе случаев или экземпляров.

Нужно заметить, что под весом отдельной величины в статистике понимается как степень точности наблюдения, которым добыта эта величина, так и количество одинаковых точных наблюдений, из которых она взята.

Очевидно, при выводе сложной средней надо как-то принять в расчет вес каждой из величин, для которых выводится средняя.

Поясним вопрос примером. Пред нами ряд таких цен за хлеб: 50, 60, 55, 75, 60 коп. за пуд; нам нужно вывести среднюю. Если бы каждое показание относилось к единице пуда или к равному количеству пудов (партии в 10 пуд., 100 пуд.), то пред нами был бы вопрос простой арифметической средней. Но если показания относятся не к единице, а к партии (группе) товара и эти партии различны, то прежний прием средней будет не применим. Положим, партии, проданные по указанным ценам, имели такие размеры: 100, 50, 150, 5.000, 200 пудов или, например, такие: 1.000, 1.500, 1.200, 200, 3.000 пудов. В первом случае цена 75 коп., как относящаяся к партии в 5.000 пуд., будет преобладающей (диктующей размеры будущей средней), так как все остальные цены более низкие, взятые вместе, относятся к 500 пудам; во втором по 75 коп. продано всего 200 пудов, а 6.700 пуд. проданы по более низким ценам, т.е. преобладающими будут более низкие цены; иначе говоря, в первом случае случайными будут более низкие цены, а во втором случайной будет 75 коп. Чтобы составить правильное понятие о цене, мы должны вычислить среднюю цену не партии, а пуда, единицы товара; для этого надо, как бы восстановить полное число единиц цен, сгруппированных в той или иной партии, сложить все полученные единицы и разделить на число единиц товаров. Т.е. в первом случае процесс математически выразится так:

50+50+50+..., повторенные до ста раз, +60+60+60+..., до пятидесяти раз, +55+55+55+ …, до ста пятидесяти раз, +75+75+75+..., до пяти тысяч раз, +60+60+60+ …, до двухсот раз; полученную сумму разделить на число пудов и мы получим нужную среднюю. Но 50, повторенное суммой сто раз, есть 50100; 60, повторенное суммой пятьдесят раз, есть 6050 и т.д.; отсюда, наша сложная формула получит вид:

(50100+6050+55150+755.000+60200) : 5.500 = 71,5 коп.

Во втором случае отыскание средней выразится так:

(501.000+601.500+551.200+75200+603.000) : 6.900 = = 401.000 : 6.900 = 58 коп.

Если бы мы взяли исходные цены 50,60,55,75,60, сложили их и разделили на 5, т.е. приняли бы путь отыскания простой арифметической средней, то получили бы среднюю, равную 60 коп., т.е. против первого случая убавили бы настоящую среднюю на 1,5 коп.; против второго увеличили бы среднюю на 2 коп. Технически мы отыскиваем среднюю как простую, так и сложную одинаковым путем суммирования всех единичных данных, но в случае отыскания сложной мы предварительно разворачиваем (дифференцируем) группы на все содержащиеся в них отдельные единицы.

Сведем сказанное к выводу. Если каждая из цифр ряда или некоторые, по существу, изображают не единичный случай, а некоторую совокупность единиц, которые только в целях упрощения или по недостаточности наших сведений рассматриваются все вместе как один случай, то среднюю надо выводить не для групп, к которым относятся показания, а для всей совокупности единиц. Для этого необходимо: каждое показание помножить на число единиц, к которому оно относится (на «вес» показания), произведения сложить и сумму разделить на общее число единиц, к какому относятся все имеющиеся показания. Этим путем и получится взвешенная (сложная) средняя, на величину которой каждое из отдельных слагаемых влияет в мере, соответствующей его действительному значению.

Хотя теоретически вывод не вызывает никаких сомнений, но практически не всегда возможно вычислить взвешенную среднюю, так как смотрители или деревенские старосты делают записи цен часто без упоминания о количестве проданного; учреждения, занятые вопросами об урожайности, имеют в своем распоряжении лишь показания об урожае с десятины (или в виде «сам столько-то»), но не имеют сведений о площадях (или пудах) посева и т.д. Но бывают случаи, когда взвешенной средней не вычисляют, хотя и имеются «веса» отдельных показаний. Причина этого лежит в том обстоятельстве, что, пренебрегая «весами», мы далеко не всегда делаем сколько-нибудь существенную ошибку, а иногда и вовсе не делаем ошибки; что ошибки и неточности в выводах, получающиеся, если взять вместо взвешенной средней простую, часто имеют лишь ограниченное или даже совсем ничтожное влияние на результат.

Р.М. Орженцкий пошел дальше в анализе; он выяснил, что в известных материала»), вычисление простой средней будет даже более уместно, нежели вычисление взвешенной.

Необходимо, говоря о средних, упомянуть, что в статистике со времен Кетле различают двоякого рода средние величины: настоящую или типическую ** среднюю и нетипическую (арифметическую) среднюю ***. Майр по этому поводу говорит: «средняя может быть рассматриваема как выраженный в сжатой форме тип социального массового явления, или просто Как в статистической практике, так и в статистической теории вопрос о методах установления весов является до сих пор мало разработанным. Сравнительное равнодушие Боули к вопросу о системе весов подвергается резкой критике проф. Борткевича в его рецензиях на старое и новое издание «Элементов статистики», причем в последней рецензии он приветствует некоторый поворот позиции Боули в этом вопросе.

Moyenne reelle - у Кетле, moyenne objective -у Бертильона, mean – у английских статистиков.

*** Moyenne arithmetique, moyenne subjective, average.

как счетная абстракция без типичного характера. Мы имеем типическую среднюю, если она по природе вещей выражает возможную действительность данного явления; мы имеем простую абстракцию, если нет основания представить себе действительное строение данного явления, которое отвечало бы полученной средней». Например, средняя, выведенная из нескольких измерений одного и того же дома, есть настоящая (типическая) средняя, а средняя, выведенная из измерений всех домов, находящихся на одной и той же улице, является арифметической (нетипической) средней. Первая, как естественная, как «действительность данного явления», подлежит анализу и допускает применение законов (например, закона ошибок, о котором будет говорено ниже), вторая же есть чисто арифметический вывод из величин, не связанных между собою ни порядком, ни законом последовательности. Или такие примеры: средний возраст студентов на первом семестре величина типическая, средний возраст людей, проходящих в случайно взятый момент по Невскому или по Тверской будет величиной чисто арифметической.

Понятие типической средней перенесено Кетле в область статистики из области физических и астрономических измерений. Последние всегда приходится производить по несколько раз: истинная величина измеряемого явления обычно принимается равной арифметической средней из этих многократных измерений, отклонения же от нее располагаются в определенном порядке, в соответствии с законом случайных погрешностей.

Кетле, сам астроном, подметил сначала по отношению к человеческому росту, а затем и среди других массовых явлений из области антропологии и демографии, что данные массового наблюдения, в некоторых случаях «точно также располагаются вокруг средней, как если бы это были отклонения, получившиеся при многократных измерениях одного и того же человеческого типа». Это привело его к мыс ли рассматривать самую среднюю, в такого рода случаях, как выражение некоторой истинной величины, типа данного явления, а величины отдельных случаев явления, как «случайные» отклонения от этой совокупности управляющих явлением постоянных причин.

Это-то обстоятельство, по словам Янсона, послужило для Кетле основанием для разделения средних на типические и арифметические. По отношению к человеку типические средние слагались у Кетле в законченную фигуру «среднего человека». Янсон этой теории придавал уже чисто исторический интерес; с одной стороны потому, что для общественных явлений, непрерывно изменяющихся в определенном направлении, типичная средняя во всяком случае будет фикцией, а с другой стороны трудно сказать, какие средние будут по Кетле, чисто арифметическими. Янсон опорочивал и пример Кетле о средней высоте домов на улице, как пример арифметической средней *.

Однако, учение Кетле о типических средних совпадает со взглядами господствующей в настоящее время статистико-теоретической школы. Ее глава Лексис, удерживает даже самый термин Кетле «типические» величины.

«Типические величины», говорит он, «это такие, которых отдельные измерения группируются вокруг средней, в соответствии с законом случайных ошибок, эта средняя величина с возможной точностью изображает тот тип, к которому стремится каждый отдельный случай, но который, в силу случайных отклонений почти никогда не воспроизводится с совершенною точностью **.

Во всяком случае, на среднюю нельзя смотреть, как на такую характеристику массового явления. Имея поэтому среднюю, надо, прежде всего, выяснить, в какой мере она, в самом деле, отвечает действительно Янсон. Теория статистики. 5-е изд., стр. 552-554.

Положения развиты в его трудах: Lexis. Abhandlungen zur Bevolkirungs und Moralstatistik 1903 г. Его же:

Zur Theorie der Massenerscheinungen in der Menschlichen Gesellohaft. 1877.

преобладающему виду или типу данного явления, а затем дать последнему и некоторую дополнительную численную характеристику. Первое достигается путем изучения отклонений отдельных случаев от средней. Средняя тем более типична, чем менее отклонения от нее отдельных случаев; и наоборот, чем больше отклонения, тем ее типичность менее; тем больше в первом случае и тем меньше во втором значение средней для характеристики массового явления. «Достоинство средней величины», говорит Эттингер, «должно быть подвергнуто оценке, которая достигается намерением отклонений от средней величины как вверх, так и вниз». Можно выяснить тот же вопрос, подходя с другой стороны: любая средняя величина может быть выводом (математически) из близких к ней и друг к другу слагающих, и наоборот из ряда цифр, далеко отклоняющихся и от нее, и друг от друга; в первом случае средняя дает вполне реальное представление о характере изучаемого явления, во втором она, сама по себе, не даст о нем никакого реального представления.

Недействительность средней в этом случае подтверждается тем соображением, что она резко может измениться от присоединения к ряду слагающих ее цифр одиноких крайних членов или от отпадения таких крайних величин; например, средний размер обложения небольшого города может сразу сильно возрасти от появления в нем двух-трех миллионеров или резко понизиться, если эти миллионеры покинут город или разорятся.

Последнее обстоятельство выдвигало вопрос, нельзя ли просто устранять влияние подобного рода чисто случайных, влияющих на среднюю, моментов, а именно для вывода средней из данного ряда цифр исключать все те отдельные слагающие, которые слишком далеко отклоняются от господствующего типа и, следовательно, слишком очевидно представляют собой случайные исключения. Практически применяется такой прием:

выводят среднюю из всех цифр ряда; половинная и полуторная средняя принимается за верхний и нижний пределы нормальных отклонений; все те отдельные цифры, которые меньше низшего или больше высшего из этих пределов, отбрасываются, а из остальных выводят новую среднюю, более близкую к нормальному виду явления.

Пусть дан ряд цифр: 350, 717, 423, 382, 252, 208, 187, 246, 196, 151, 208, 296. Средняя из всего этого ряда цифр 307; допустимые пределы отклонений 153 (половина средней) и 461 (полуторная средняя); значит, и 151 должны быть отброшены, как имеющие случайный характер; остальные 10 цифр дадут новую среднюю 275 (Янсон).

Теоретически вопрос оказывается далеко не простым, так как возникает чисто принципиальное недоумение, на каком основании отбрасывать вообще какие бы то ни было отклоняющиеся от общего уровня цифры, раз средняя, по самой своей идее, должна выяснить именно то общее, что в отдельных случаях может быть совершенно заслонено действием причин случайного характера.

Из изложенного, во всяком случае, вытекает с достаточной ясностью, что одна и та же средняя может быть выводом из численных рядов самого разнообразного характера, откуда прямой вывод, что средняя величина, сама по себе, не дает достаточно определенной характеристики послужившему для ее вывода числовому ряду, а вместе с тем и тому явлению, которое в нем нашло себе выражение. Это давало повод к старому и постоянному стремлению отыскать такие производные величины, которые бы лучше отражали изображаемые ими явления, нежели арифметическая средняя, или хотя бы могли ее пояснить и дополнить. Таких величин предлагалось много, особенно статистиками-математиками. Среди них наиболее интересны и заслуживают внимания две: мода (англ. mode) или наиболее частая величина и медиана или, по выражению Р.М.Орженцкого, «серединная точка».

МОДА. Мода это та величина, которая имеется в наибольшем количестве показаний или наблюдений, то число, которое в действительности встречается чаще всего, которое представляет собою наиболее распространенный тип данного явления. Если, например, распределить дворы на группы по размерам посевной площади, с десятинными интервалами для групп (до 1 десятины, 1-2, 2-3 и т.д.) и если при этом на каждую из последовательных групп придется следующее число дворов: 500, 250, 300, 400, 800, 1.200, 1.000, 700, 300, 120, 50, 25, 10, то модой будет размер в 4- дес., которому соответствует наибольшее число индивидуальных случаев (1.200).

Практически модой пользуются на каждом шагу: шляпный торговец, запасая наибольшее количество шляп определенного размера или фасона, крестьянин указывает на ту же моду, говоря об обычном у них урожае и т.д.

В то время как арифметическая средняя не соответствует, может быть, никакой реальной величине (чисто арифметическая или при наличности одного-двух чересчур крайних случаев), мода никогда не бывает фикцией, она-то число, которое в действительности встречается чаще всего и около которого остальные случаи группируются с большей или меньшей степенью существенный интерес. Пока она неизменна, можно говорить практически о неизменности комплекса причин, управляющих рассматриваемым явлением, если она изменилась это не могло быть, как при арифметической средней, результатом изменения немногих крайних случаев, это могло случиться от значительного изменения в природе или динамики явления.

Если поэтому мода и не представляет собою «типической» средней в известном смысле, то с точки зрения практического статистика, она изображает собою, несомненно, наиболее «типический», наиболее обычный, а следовательно, практически и наиболее важный вид изучаемого явления, ввиду чего моду нередко называют «нормальной» * («обычной») или «типической» величиной. (Техника вычисления моды является довольно сложной).

Так зовет ее, например, проф. Н.А.Каблуков. См. стр. 177 цитированного выше сочинения.

МЕДИАНА. Медиана или серединная точка это такая из наблюденных величин, которая делит все число наблюденных величин приблизительно на две равные части, так что число величин выше ее и ниже ее одинаково или почти одинаково. Она представляет собой, так сказать, середину серединную (но не среднюю) величину. Если, например, даны цены чего-либо: 1р., 1р.10к., 1р.15к., 1р.25к., 1р.30к., то медианой будет цена 1р.15коп. Она, как видим, безразлична к случаям крайних уклонений. Получение медианы требует, нередко, применения довольно сложных вычислительных или графических приемов, рассмотрение которых, как и таковых же для получения моды, не отвечает масштабу и целям нашего изложения *.

В принципиальной оценке медианы между теоретиками нет согласия, но общий тон их заключений идет скорее не в пользу медианы. Lexis признает «серединную величину» весьма пригодной для общей, грубой характеристики численного ряда. Vule высказывается о медиане гораздо более сдержанно; он признает, правда, что «медиана может быть несколько легче вычислена, чем средняя; что она является иногда полезным практическим приемом, а в некоторых категориях случаев является более устойчивой, чем средняя», но в то же время он находит применение медианы нецелесообразным в случаях прерывистого распределения частот, отмечая, что значение ее не всегда невозможность математического ее использования. Решительнее и резче говорит о медиане А.А. Кауфман; он не видит «в медиане ни тех обобщающих свойств, какие присущи арифметической средней, из того конкретного смысла, какой присущ, несомненно, моде», а потому считает «применение медиана, в общем, мало полезным». Существенным дополнением к «серединной величине» являются «квартили» четвертные деления, которые получаются путем деления пополам каждой из двух половин ряда. Между Их можно найти в учебниках математической статистики, например, проф. Орженцкого или в английском руководстве Вуля. Undy Vule. Some introduction to the theory of statistics, 2ed. 1912 г.

двумя «квартилями» располагается, очевидно, половина всех случаев, следовательно, «квартили» представляют собой те пределы, внутри которых заключается вероятное значение данного явления остальная половина случаев, лежащая выше верхней и ниже нижней квартили, будет охватывать собою совокупность менее вероятных или совсем мало вероятных значений, более резко уклоняющихся от нормального вида явления. Четвертные, а также, так называемые, десятичные деления, «децили» можно использовать еще и другим способом: они показывают тот предел, выше которого не поднимается или ниже которого не падает величина изучаемого явления в такой-то части случаев.

В артиллерии, в теории, а затем и практике стрельбы, применяются аналогичные линии, но различные по подробностям. Медианой здесь является линия, проходящая чрез среднюю точку попадания перпендикулярно направлению выстрела (точнее медианой будет сама средняя точка).

Площадь рассеивания разбивается на восемь * полос, параллельных указанной «медиане», с шириною, равной среднему квадратичному отклонению; эта ширина предусматривает попадание в полосу определенного процента выстрелов.

Особую категорию взвешенных средних представляют собою, так называемые, числа-показатели (index numbers) и в частности «общие числапоказатели» или «индексы» (general index numbers). Это такие числа, которые выражают собою как бы равнодействующую из ряда цифр, каждая из которых характеризует одну из разновидностей определенной категории явлений. Ими пользуются по преимуществу для суждения об изменении ценности денег.

Для выяснения приема создания показательных чисел остановимся на конкретном примере товарных цен, как он изложен у Боули. Мы выбираем товары, цены которых мы точно знаем, и выписываем эти цены за несколько лет. Взяв цену каждого данного товара в известном году или в среднем за ряд Так в русской артиллерии; в немецкой деление проведено иначе.

лет за основание, мы выражаем все погодные цифры в процентах к этому основанию *, т.е. цена определенного года (или средняя за ряд лет) принимается за 100, а затем погодные цены остальных лет, в функции от этих 100, выразятся, скажем, рядом цифр 105, 98, 104 и т.д. Таким путем мы получим для каждого года ряд относительных величин, выражающих цены ряда товаров, и затем, чтобы получить число-показатель за этот год, выводим среднее из этих чисел. Но для вывода этой средней нельзя придавать второстепенного значения, как индиго, дорогие вина, корица т.п. не может играть такой же роли, как цена товаров массового употребления, вроде хлеба, мяса, каменного угля, железа, хлопка и т.п. Поэтому, при выводе числапоказателя цен надо, как правило, цену каждого товара принимать в расчет в потреблении, иначе сказать, для получения числа-показателя надо выводить не простую, а взвешенную среднюю из цен отдельных товаров. Если, скажем, хлеб играет в народном потреблении вдвое большую роль, чем каменный уголь, вдесятеро большую, чем сахар, и в сто раз большую, чем перец, то это различие должно быть учтено при выводе средней. Поясним указанное примером. Допустим, что мы имеем цену хлеба, каменного угля и железа.

Основная цена каждого из них, как объяснено выше, будет 100. Для следующего года, положим, она оказалась: для хлеба 105, для угля 102, для железа 104. Если значение хлеба приравнивается к 10, каменного угля к 4, железа к 5, то для числа-показателя мы выводим не простую среднюю, т.е.

Для следующего года относительные числа тех же товаров могут быть, допустим: 108, 103 и 103, и тогда средняя для этого года получится Один из интересных случаев применения «отношений наглядности».

тем же порядком средние высчитываются и для последующих лет.

Для вычисления этой взвешенной средней, как видим, определяется значение (вес) средней цены каждого отдельного товара по его значению в народном потреблении. При этом предполагается, что взяты цены важнейших товаров и притом довольно большего числа их (22, например), которые и могут считаться, так сказать, представителями всех товаров. Изменение той средней, которая получается при этом и говорит об изменении цены всех товаров, указывает, следовательно, не на условия, только влияющие на изменение цены отдельного товара, лежащие в обстоятельствах его производства или доставки.

Эта средняя представляет равнодействующую для средних отдельных товаров и говорит уже о том, в каком отношении изменилась цена денег. Но по числам-показателям судят также об изменении, например, в высоте заработной платы или тех или других экономических явлений; числопоказатель и тут устанавливает равнодействующую, например, для заработной платы в отдельных отраслях труда и показывает, таким образом, как изменилась заработная плата вообще, без различия по отдельным производствам.

Самым трудным вопросом при определении чисел-показателей является установление системы весов или, проще, отыскание весов. Ставить его в зависимость от народного употребления дело условное и произвольное. Но и в этом случае как определить расход (потребление) товаров, по ценам ли или по количеству потребленного товара? Последнее, как будто, правильнее;

но как приравнять значение вещественного веса пудов, фунтов и т.д. одного товара, например, хлеба к пудам и т.д. другого, например, шелку, конфет.

Чтобы дать хотя бы беглое представление о том, как определяются веса, приведем таблицу *. Она результат работ специального комитета, Споспешествования Наукам.

Картофель, молоко Свинец, цинк Лен и льняСредняя ввозная цена Пальмовое Она взята из труда М.Смит. Основы статистической методологии. Выпуск I Петербург-Москва, 1923, 196, стр. 126.

Как видно из изложенного, идея чисел-показателей, как она, по крайней мере, разработана в статистике по настоящие дни, является еще довольно не совершенной, гадательной, вызывающей сомнение. Проф. Н.А.Каблуков * рекомендует к числам-показателям относиться очень осторожно и придавать им очень и очень условное ** значение. Мотивировка его по этому поводу заслуживает полного внимания.

Рассмотрение арифметической средней и ее вариантов должно привести нас к тому заключению, что для общей статистики она сохраняет свое преобладающее значение. Все дело только в том, чтобы в каждом данном случае правильно оценить ее смысл и значение и сопоставить ее с другими данными, могущими служить для характеристики исследуемого явления.

Всесторонняя характеристика явления о чем последует ниже лучше всего получается при помощи комбинации арифметической средней с выражаемым обычно в процентах распределением отдельных случаев явления по величине данного признака прием, который, как легко видеть, принципиально мало отличается от приема нахождения «наиболее частой величины».

Как мы видели, всякая средняя, чтобы составить понятие об ее характере и способности служить отражением реальной действительности, должна быть «оценена». Для этого существуют несколько способов. Самый элементарный и наиболее часто применяемый это способ измерения отклонений. Он сводится к тому, что рядом со средней величиной принимают в соображение также, например, и наиболее уклоняющиеся от нее величины и чем более maxima или minima отклоняются от средней, тем эта последняя менее типична и тем изучаемое явление менее устойчиво.

Но прием измерения отклонений подсказывается не одной лишь «Статистика», стр. 179-181.

Курсив его.

потребностью оценки средней. Требования науки и практической жизни часто заставляют вывод средней дополнять указанием границ, между которыми изменяются числа ряда и затем указанием числа индивидуальных случаев, приходящихся на известные отделы, на которые распределяется все расстояние между границами. Например, показание о среднем возрасте населения, слишком общее по существу, обычно дополняется указанием максимального возраста, достигаемого некоторыми лицами, или данными об абсолютном или относительном числе лиц, которые падают на группы между 0 и 5 годами, 5 и 10 годами и т.д.

Указанный способ изучения отклонений средней от максимума и минимума дает лишь слабое понятие о степени типичности средней и вообще мало интересен в статистике. С одной стороны, конкретная величина максимума и минимума является, нередко, более или менее случайной; с другой характер распределения цифр внутри означенных данным разнообразным и, значит, одинаковые пределы колебаний отнюдь не означают одинакового распределения.

Гораздо более отчетливую характеристику средней и, вообще, гораздо более плодотворным является вычисление среднего отклонения от средней.

Определяется отклонение каждого члена данного ряда, т.е. разность между средней и каждою из составляющих, затем все полученные разности, независимо от знака, сосчитываются, и сумма их делится на число членов ряда; получается абсолютная величина среднего отклонения, после чего вычисляется, какой процент от средней составляет эта величина. Чем этот процент меньше, тем, значит, явление устойчивее, и тем в большей степени средняя может быть принята за настоящее отображение действительности.

Пусть, например, дано два ряда цифр, имеющий каждый среднюю 10:

Сумма отклонений отдельных членов первого ряда будет:

среднее отклонение (абсолютное) 4,4, а в процентах к средней 44%.

Для второго ряда сумма отклонений будет:

среднее отклонение 1,6; в процентах к средней 16%. Отсюда видно, что второй ряд изображает гораздо более устойчивое явление, нежели первый, и что средняя величина во втором случае в гораздо большей степени способна служить для общей характеристики явлений.

Сгруппируем на одном примере несколько приемов измерения отклонений вообще.

Допустим, нам известно за три года число рождений в двух местностях А и Б.

Определяя сначала среднее годовое число рождений, найдем его для обеих местностей одинаковым и равным 200. Для измерения степени отклонения отдельных величин от среднего можно использовать несколько приемов:

I. Можно отметить, что в местности А максимум числа рождений 215, минимум 190; разница между ними 25. В местности Б максимум 300, минимум 120, разница 180, т.е. в семь раз больше, чем в местности А.

II. Можно вычислить или в абсолютных, или в процентных числах размеры отклонения максимума или минимума от средней. Так, в местности А, максимум (215) отклоняется от средней (200) на 15 или на 7%, минимум (190) отклоняется на 10 или на 5%. В местности Б максимум (300) отклоняется от средней (200) на 100 или на 50%, минимум (120) на 80 или на 40%.

III. Можно, наконец, вычислить среднее отклонение отдельных чисел от выведенной из них средней величины. Мы имеем:

Независимо от знака в первом случае отклонения будут 5, 15, 10, а сумма их 30, а среднее отклонение = 10; во втором 80, 100, 20, их сумма 200, среднее отклонение = 66,7. Если эти средние отклонения 10 и 66,7 приведем в процентное отношение к средней (200), то найдем, что относительные средние отклонения будут в первом случае составлять 5% от средней, во втором 33%. Значит, в первом случае средняя (200) гораздо надежнее отражает действительное явление.

В рамках элементарного статистического анализа может быть до некоторой степени применен и более сложный прием оценки средней, а вместе с этим и определения постоянства статистических рядов. Это так называемый способ среднего квадратичного отклонения, выражаемый формулой:

где S число наблюдений, d отклонение каждого из них, а среднее квадратичное отклонение, сумма квадратов отклонений. Формуле этой предписывается то принципиальное преимущество перед простым средним отклонением, что она стоит в непосредственной связи с основным, упомянутым уже, математическим свойством средней величины, которое гласит: сумма квадратов отклонений каждого из членов ряда от средней меньше суммы квадратов отклонений от какой бы то ни было другой величины, а также и с тем принятым в математике допущением, что результата.

Внимательный анализ достоинств этого приема, однако, приводит к заключению, что его достоинства или условны (Слуцкий), или равноправны с таковыми же среднего отклонения первой степени (Czuber), почему применение способа среди квадратичных отклонений, требующего добавочных и больших вычислений, в рамках элементарного статистического анализа не находит для себя почти никакого оправдания.

Заканчивая изложение свойств средней, необходимо оговорить, что статистик не может ограничиться одной лишь оценкой типичности средней величины. Сверх этого ему надо выяснить и изобразить действительный характер или склад изучаемого явления, который может быть весьма различен и который одна средняя не может отразить своим наличием. Поэтому статистику параллельно с вычислением арифметической средней, всегда остающейся важнейшим орудием статистики, приходится прибегать и к другим приемам обработки материала, которые выяснили бы ему характер тех элементов, из которых слагается группа, характеризуемая средней величиной.

Как видели, для этой цели иногда комбинируют вычисление арифметической средней с определением наиболее частой (модой) и серединной (медиана) величин. Но наиболее целесообразным приходится признать изучение средних величин параллельно с процентными отношениями, показывающими расчленение данной массы по величине того признака, общее выражение которого дано средней величиной, прием, материал для применения которого дают таблицы с параллельно проведенным итоговым и групповым подсчетом. Такое параллельное изучение дает, можно сказать, всестороннее представление об явлении: средняя показывает общий уровень, норму явления и при незначительности отклонений она будет соответствовать типу данного явления, а процентное распределение выясняет степень однообразия или, наоборот, разнообразия данной массы, ее расчленение на характерные группы или типы.

В результате группировки и счетной обработки материала мы получим ряды чисел, выражающих различные отношения явлений во времени и пространстве, показывающих, например, цифры смертности на 1000, количество преступлений на 1000, % смертности по возрастам, годам и т.д.

Ряды эти (статистические) могут состоять из абсолютных чисел, а также и из средних или относительных. Так, статистические ряды, показывающие рост постоянной армии одного государства и величины их в разных государствах, рост государственного бюджета, рост вывоза всех или некоторых предметов, будут состоять из абсолютных величин. Ряды, состоящие из цифр средней доходности, приходящейся на душу в ряде государств, средней лошадности или среднего размера надела по губерниям и т.п., будут иметь в своем составе средние величины. Наконец, рядами относительных величин будут служить ряды о плотности населения или преступности в разных странах, о длине железнодорожной лини, приходящейся на единицу площади или единицу числа людей в государствах и т.п.

Ряды всех трех типов могут при этом, найти себе применение при обработке одного и того же статистического материала. Возьмем вопрос о вооруженных силах в государствах Европы или в какой-либо одной стране;

одни стороны его вы будете изучать, сопоставляя абсолютные цифры в целом или по группам, например, по родам войск; другие стороны степень военного обременения вы будете выяснять получением ряда относительных чисел % взятых на военную службу от всего населения или от определенной части его, стоимость в год одного солдата и т.д.

Существо статистических рядов Янсон определяет как такой тип рассматриваются как функции или пространства или времени или какогонибудь другого явления». Их внутренний смысл * чрезвычайно разнообразен:

«расположенные от максимума к минимуму, ряды показывают, в какой Важность рядов Герри подчеркивал тем, что всю задачу научной статистики он ограничивал «сериацией явлений».

последовательности идут степени интенсивности явлений: расположенные по пространственной смежности они показывают интенсивность явлений в их географическом распределении; расположенные по времени, они обозначают колебания в историческом развитии явления. Эти колебания могут состоять в правильном росте или убыли явления или же в колебательном движении, которое, неравномерно меняясь, опять приходят к одному и тому же максимуму или минимуму» (А.И. Чупров).

По способу изображения явлений резко различаются две категории рядов статистические и динамические; первые показывают строение или расчленение социальной массы в состоянии неподвижности, причем в основе такого расчленения может лежать территориальный или вещный признак;

динамические показывают направление и силу эволюции явления, цифры здесь, очевидно, расположатся по признаку времени.

Так как ряды являются комбинацией из абсолютных и производных величин, о чем уже сообщалось раньше, то, говоря о свойствах рядов, мы во многих случаях принуждены будем повторять уже сказанное, почему в этом случае можно быть кратким. Но сначала на примерах покажем, какое значение имеет установление рядов и их сопоставление. Из результатов земскостатистических переписей в Полтавской губернии в 1900 и 1910 гг. получены, между прочим, такие ряды: * Поденщика во время уборки хлеба Срокового рабочего за Пример и последующие взяты у Н.А.Каблукова.

Ряды выясняют общий рост заработной платы, причем более всего поднялась плата у поденщика, менее всего у рабочего на срок.

Из обзора статистических данных о движении заработной платы сельских рабочих в Московской губернии за 30-летие с 1884 по 1913 можно привести такие ряды:

харчах харчах другой платы Из сопоставления этих рядов видно, что плата все время росла; кроме того, из последнего ряда видим, что расход на харчи изменяется в направлении постепенного роста его. Нужно оговорить, что эти же ряды, говоря о внешнем росте заработной платы, не говорят еще об ее реальном росте, который является функцией от более сложного числа факторов.

Первый вопрос, который предъявляется к рядам, это их критика. Но критика рядов прежде всего и теснейшим образом связана с критикой средних величин, составляя как бы две стороны медали; в основу оценки средней полагается, как мы видели, характер того ряда цифр, из которого она получена, а оценка ряда получается, главным образом, путем сопоставления его отдельных членов со средней величиной. Поэтому то, что сказано было выше о значении измерения отклонений для оценки средних и для использования их в непосредственных целях статистического анализа, в той же мере относится к оценке и к аналитическому использованию рядов.

Для целей сравнения ряды, из каких бы чисел они не состояли, обычно приводятся к одному основанию, и для этого над ними нужно произвести счетные операции. Операция эта проделывается единственно в целях повышения наглядности сопоставлений и необходима она лишь постольку, поскольку сопоставление не приведенных к одинаковому основанию цифр не дает достаточно наглядных результатов. Это особенно нужно тогда, когда подлежащие сопоставлению ряды состоят из очень различных по абсолютной величине цифр, один или одни, например, из двухзначных или трехзначных цифр, а другой или другие из пятизначных и более.

Приведение к одному основанию совершается трояким образом А. По сумме членов ряда, которая принимается за 100, а буде нужно за 1.000 или даже за 10.000. Так, германские промысловые переписи 1882, 1895 и 1907 гг. дали распределение населения по четырем категориям самодеятельные, прислуга, домочадцы и самостоятельные без профессии в ряде абсолютных цифр, не дававших ясной картины об их взаимной величине и не позволявших судить об эволюции вопроса за период 1882-1907 гг.

Приняв же для каждого указанного года общую сумму населения за 100, получим также ряды Из этих рядов легко видеть, что число самостоятельных (с профессией и без) возросло и составило к 1907 г. большую долю лиц в составе всего населения нежели то было раньше; а домочадцы и прислуга убавились и образовали в населении меньшую долю, чем было раньше.

Следующие ряды, отнесенные также к сумме членов ряда показывают смертность в Соединенных Штатах Северной Америки на 1000 жителей:

Ряды дают возможность делать многообразные заключения. Ряды показывают изменения явления, как по местностям, так и по возрастам.

Наконец следующий ряд, также отнесенный к сумме членов ряда показывает, какой % в Берлинском королевском ломбарде составляли среди прочего заложенного имущества карманные часы:

Ряд обнаруживает бросающуюся в глаза устойчивость явления. Средняя же цена отдельного экземпляра заложенных часов составляла, для тех же годов: 21 марка 40 пфеннигов, 21 м. 50 пф., 21 м. 15 пф., 21 м. 1 пф. и 21 м. пфеннигов.

Б. Числа ряда приводятся к одному основанию, за которое берется одна из величин ряда; чаще всего это будет наименьшая или наибольшая. Так, при изучении постепенного изменения личного состава армий по роду войск на протяжении известного числа лет будут представлять интерес цифры, относящиеся до артиллерии, кавалерии, воздушного флота, бронесил и т.д.;

выразить как функции от пехоты, т.е. последнюю взять за 100, а по ней определить другие рода войск. Так в статистических отчетах часто и делается.

Принятие за основание наибольшей или наименьшей величины ряда особенно удобоприменимо и показательно, когда мы имеем ряд с правильным повышением или понижением, т.е. при изменении величины в одном направлении.

В. Наконец, ряды приводятся к одному основанию по средней величине из числа членов ряда, причем она также принимается за 100 или за 1000, а затем посредством пропорции вычисляется отношение величины каждого члена ряда к этой средней, принятой за основание. Приведение к средней величине всего целесообразнее в тех случаях, когда мы имеем ряд волнообразный, при котором изменение величин следует не в определенном направлении, а то повышаясь, то понижаясь. Для примера приведем сопоставление хлебных цен в Германии с колебаниями преступности.

Первые выражены в марках за 50 килограмм хлеба и колеблются между 5,69 и 11,45; вторые выражены в числе краж на тысячу жителей и колеблются между 19,3 и 38,6. При рассмотрении этих двух рядов в непреобразованном виде требуется не малое усилие ума, чтобы сопоставить колебание одного с колебаниями другого. Но если оба ряда привести, например, к выведенной из каждого данного ряда средней, приняв последнюю за 1000, то получаются такие (вычисленные Янсоном) два ряда производных чисел:

1.256-1.382-1.272-770-810-921-931-962-819-587-753-881-1.191-1.183-975- 1.397-1.473-1.601-1.019-880-904-924-950-958-850-850-954-933-1.099-1.211-875- Теперь параллелизм колебаний обоих рядов становится совершенно наглядным и сам собою бросается в глаза.

В вопросе о рядах важную сторону играет их анализ, который может выразиться в изучении одного какого-либо ряда, самого по себе, или в сопоставлении двух или нескольких рядов. Подобное изучение может касаться рядов на всех ступенях их обработки, будут ли они выражены в абсолютных или относительных величинах, приведены ли к одному основанию или нет. При анализе важны две стороны: одна имеет задачу выяснить достоинство рядов, их ценность, т.е. говоря языком статистики, выяснить степень постоянства, устойчивости ряда или рядов; вторая старается понять существо отражаемого рядом (рядами) явления, т.е. выяснить ход ряда, характер его колебаний в смысле роста убыли, периодичности, параллелизма и т.п.

Первая сторона тесно связана с уже рассмотренным вопросом об устойчивости средней как лежащей в основе устойчивости всякого ряда.

Очевидно, что степень устойчивости ряда или размеры его колеблемости показывают, насколько известные явления, сами по себе, способны поддаваться изменениям или колебаниям и, значит, насколько они способны отражать на себе действия тех или других причин. С другой стороны сопоставление данных, характеризующих устойчивость различных рядов находящихся, между собою в причинной зависимости, может дать понять о силе действия того явления, которое может быть рассматриваемо как причина другого.

Во втором случае речь, прежде всего, идет о такой числительной или технической обработке ряда или рядов, распределенных по тому или иному принципу, чтобы существо их хода рост ли, убыль, периодичность и т.п., выступало с достаточной наглядностью как при рассмотрении одного ряда, так и при сопоставлении двух или нескольких.

В случае одного ряда целью анализа будет затем установление чисто фактической, внешне отраженной закономерности, которая проявляется в росте, убыли, параллелизме и т.д. и которая будет, затем, подлежать объяснению умозаключающим процессом вне статистического пути. В случае сопоставления (метод параллельных рядов) целью анализа будет установление аналогичного или противоположного характера колебаний, из которого получается право заключить о наличности более или менее непосредственной, в первом случае прямой, во втором обратной зависимости.

Но при этом надо заметить, что искомая закономерность колебаний одного ряда или искомая аналогия (противоположность) колебаний нескольких рядов очень часто затушевываются случайными колебаниями цифр, неожиданными отклонениями их от закономерного хода в рядах.

Очевидно, в этом случае пред нами постоянные причины, проявляющиеся в искомой закономерности, в параллелизме или антагонизме колебаний, скрещиваются с влиянием посторонних (случайных) причин и нередко ими параллельных рядах явлениями или признаками приходится в таких случаях подвергать ряды численным операциям или различным группировкам, направленным к тому, чтобы устранить влияние случайных колебаний и выявить основную тенденцию данного ряда или взаимоотношение основных устремлений одного или нескольких сопоставляемых рядов.

Не входя в подробности подобных устремлений, упомянем лишь о наиболее частых приемах; таковыми будут: разбивка ряда или рядов на части и вычисление для каждой из них отдельной средней величины (или вывод групповых средних), разбивка по величине членов одного из рядов и т.д.

Для нас достаточно на примерах пояснить сущность сопоставления рядов, как одной из наиболее плодотворных операций в анализе рядов.

Особенного внимания заслуживают ряды, если между ними наблюдается постоянное правильное соотношение, выражающееся в том, что числа отдельных рядов изменяются или в одном направлении, т.е. там и тут возрастают или падают, или же в одном ряду числа изменяются в направлении возрастающем, а в другом падают или обратно: в одном уменьшаются, в другом возрастают.

соотношение рядов называется корреляцией, причем при изменении обоих рядов в одном направлении мы будем иметь положительную корреляцию, при изменении же в противоположных направлениях отрицательную.

Приведем пример положительной корреляции:

надела в группе означенных группах с 1858 по 1878 г.

Мы видим здесь увеличение прироста населения по мере увеличения надела: пред нами связь двух явлений, представленная с достаточной убедительностью. Но связь эта, по существу, может быть различная.

Соотношение изменений может происходить или оттого, что одно явление составляет причину другого, или оба они являются результатом одной общей причины. Выяснение существа связи, строго говоря, уже выходит за пределы статистической работы: приведя наблюденные и учтенные явления в такой вид, который дал определенные ряды, она сделала свое дело. Дальнейшая работа вывода должна выпасть на долю той или другой науки, знакомой специально с обстановкой рассматриваемого явления и уже, вероятно, с некоторыми соприкасающимися с ним закономерностями.

Но не трудно видеть, что уже самое установление при помощи рядов постоянного правильного соотношения двух явлений имеет большое значение, так как является прочной базой для дальнейших изысканий и ведет к уяснению многого. Иногда один факт постоянного соотношения открывает нам многое. Возьмем такие ряды:

Мы видим, как для всех возрастов сила у богатых выше силы у бедных.

Уже это указание, само по себе, может доставить материал для мыслей и соображений, как государству, так и обществу и отдельным классам населения, хотя причина связи остается в тумане, так как для выяснения ее, как справедливо говорит проф. Е.Е. Слуцкий *, «мало быть статистиком, а нужно быть биологом, медиком, метеорологом, экономистом и т.д., смотря по области исследования».

Еще рельефнее связь между степенью экономической состоятельности и физическим здоровьем выражается следующими рядами возраста мальчиков, где взята и категория средних семейств, рост выражен в сантиметрах: ** В этих рядах мы видим не только уменьшенный рост у бедных по сравнению с богатыми, но даже постепенность его падения при переходе через категорию средних.

«Теория корреляции».

Ее приводит Н.А.Каблуков по труду: A.Niceforo: Antropologie der nikatscultienden Klasten.

Следующие ряды * представляют пример отрицательной корреляции:

приходящихся Вопрос о рядах является одним из наиболее сложных и поучительных вопросов в статистике. Нам пришлось остановиться на самых элементарных его сторонах. При более специальном рассмотрении возникает ряд тем, хотя и доступных упрощенному изложению, но находящих свое полное решение только в математической статистике и, значит, нуждающихся в высшем математическом анализе. Упомянем вкратце о более интересных вопросах.

ВЫРАВНИВАНИЕ РЯДОВ. А. Выравнивание рядов операция, широко применяемая в разных областях прикладной статистики, например, страхование, пенсионное дело, в так называемой формальной теории смертности и т.д. Цель его устранить в рядах случайные колебания и получить преобразованный ряд чисел, выражающий действие одних только управляющих данным явлением постоянных причин. Дело в том, что эмпирический ряд никогда не совпадает с теоретическим, ** отсюда, цель выравнивания сводится к преобразованию ряда «таким образом, чтобы отдельные эмпирические величины его были заменены наиболее вероятными Р.М.Орженцкого, «имеет троякое значение: 1) закон распределения величин ряда выступает с теоретической ясностью, недоступною статистическому материалу в его эмпирическом виде; 2) несоответствие эмпирического ряда с Они приводятся Янсоном по шведским данным. См. цитированное выше сочинение, том I, стр. 158.

Один из углов многочисленных расхождений между эмпирической и теоретической статистикой; тех расхождений, которые отражают собою два разных миросозерцания и которые практически ведут ко многим трудностям.

теоретическим в известных случаях может указывать на присутствие в эмпирическом ряде особых причин, посторонних эмпирическому закону распределения, и навести на их исследование и последующее открытие и 3) найдя теоретический закон распределения мы можем a priore найти теоретическую величину любого члена ряда, хотя бы этот член не дан был эмпирически», т.е. можем интерполировать недостающие в статистическом материале величины.

Те приемы выравнивания, которые можно отнести к категории элементарных можно свести к двум главным видам: механическим или вычислительно-механическим и графическим. И тот, и другой прием, построенные на не совсем прочных соображениях страдают недочетами и неосмотрительности *. Более сложные приемы выравнивания, при которых принимаются во внимание все вообще члены ряда, а не некоторые или не группы гораздо надежнее, но в основе их лежат формулы высшего математического анализа и соответствующие им кривые.

ИНТЕРПОЛИРОВАНИЕ РЯДОВ. Б. Интерполирование рядов. Оно близко соприкасается с вопросом о выравнивании и состоит в заполнении недостающих членов эмпирического ряда. Статистику сплошь и рядом приходится иметь дело с дефектным материалом, в котором не хватает данных; например, за известные года или за известные районы; интерполяция и задается целью заполнить проистекающие отсюда пробелы. В основе всех приемов интерполяции лежит основная гипотеза, которую Zizek выражает такими словами: «то строение ряда, которое может быть установлено на основания известных его членов, распространяется и на те его члены, которых величина эмпирически не дана». Относительно элементарных приемов В области прикладной статистики пенсионное дело, страхование прием выравнивания не вызывает сомнения и отвечает вполне практическим нуждам, но в области «общей статистики», например, при изучении общественных явлений, целесообразность выравнивания вызывает разнообразные сомнения.

интерполирования нужно заметить то же, что было уже сказано относительно выравнивания: к ним нужно относиться с большой осторожностью.

В. Из приемов, основанных на началах высшего математического анализа и имеющих задачей выяснить взаимоотношения между двумя или несколькими статистическими рядами, надлежит упомянуть два: один, который состоит в подыскании соответствующей типу данного явления эмпирической формулы или, говоря иначе, в изображении зависимости между рядами в виде аналитической функции той или другой степени, другой так называемый способ корреляции.

разновидность первого приема это приведение эмпирически данных рядов к простейшему случаю зависимости, графически выражающейся прямой линией и аналитически простейшим уравнением первой степени вида у = а+вх, причем коэффициенты а и в вычисляются из всей совокупности цифр сопоставляемых рядов по так называемому методу наименьших квадратов. В иных случаях, когда уравнение первой степени не решает вопроса, применяются выражаемые разными кривыми уравнения высших или, 1) непрерывность вычисляемых изменений зависимого признака и 2) равномерная применимость вычисленных величин в любой части ряда;

отрицательной будет та, что сложная совокупность взаимоотношений искусственно вгоняется в упрощенную зависимость между двумя признаками, принимаемыми за х и у уравнения.

СПОСОБ КОРРЕЛЯЦИИ. Способ корреляции заслуживает несколько большего внимания. Выше была уже определена корреляционная зависимость, которую можно рассматривать как синоним, просто, статистической зависимости. Мы уже видели, что взаимоотношение рядов и их зависимость часто усматриваются непосредственно, воспринимаются просто зрительным впечатлением. Но, во-первых, такое восприятие случается не всегда и, во-вторых, оно всегда не отличается точностью и ясностью.

Задача «способа корреляции» дать точную численную меру степени такой зависимости, изобразить ее математически. Эта мера дается так называемым коэффициентом корреляции, который должен быть всегда рассматриваем в связи с его средней (или вероятной) ошибкой, и с которым тесно связаны формулы, так называемых, коэффициентов регрессии, в свою очередь долженствующих быть рассматриваемыми в связи с их средними ошибками.

Способ корреляции принадлежит к области высшего анализа, и его принципиального достоинства способа не возникает сомнений, и ценность его определенна; иначе обстоит вопрос с оценкой его, как орудия статистического анализа. В этом отношении мнения статистиков расходятся. Статистики «не математики», вроде Н.А. Каблукова, стесняются сказать о применении способа корреляции свое решительное слово, но все же скорее считают, что и зрительное восприятие корреляционной связи во многих случаях вполне достаточно. Немецкий статистик S.Schott говорит несколько решительнее:

«установление более или менее тесной корреляционной связи путем зрительного впечатления совершенно достаточно и, во всяком случае, более заслуживает рекомендации, нежели сомнительнее числовое установление ее путем псевдоматематических операций». А.А.Кауфман * считает, что способ корреляции дает гораздо менее, чем думают его сторонники, что его можно заменить помощью элементарных приемов статистического анализа и что точность численного выражения при этом способе является в значительной степени кажущейся.** вычисление коэффициента корреляции может в лучшем случае, играть роль Цитируются выше «Теория и методы Статистики», стр. 569.

Более подробно автор развил свои взгляды в статье в «Статистическом Вестнике» за 1914-15 г. № 3.

дополнения к элементарному каузальному анализу; дополнения, положительная ценность которого, однако, далеко не всегда сможет оправдать вычислительного труда, но ни в коем случае не может заменить элементарного анализа, который во всяком случае сохраняет свое самостоятельное значение.

Нужно, наконец, два слова сказать о чисто технической или вычислительной работе, которую вызывает обработка статистического материала. Снятый с карточек, описей или ведомостей огромный конгломерат цифр вызывает необходимость производства над ним ряда арифметических выкладок, преимущественно сложения и деления. Эти операции столь крупны, монотонны и утомительны, требуют такого упорного и длительного внимания, а совершенные ошибки или просмотры могут оказать столь зловещее влияние, что всякое техническое облегчение, всякие разумно обоснованные сокращения (например, целесообразное отбрасывание цифр в числах со многими десятичными знаками), всякие практические навыки и механические приспособления, облегчающие операции, являются сугубо желательными. Сюда относятся применения наших счетов (при суммировании чисел), логарифмических таблиц (при производстве деления или умножения), употребления вспомогательных таблиц (в тех случаях, когда постоянно или часто повторяются одни и те же делители или множители) и т.п.

В новейшее время, в тех же целях упрощения стали применять механические аппараты для производства вычислений, например, счетная линейка, введенная в употребление Бертильоном, а особенно счетные машины разных типов. Первая из них, потом оказавшаяся непрактичной, была построена Беббеджем. Более удачливой оказалась система Тома, а особенно ее разновидность, усовершенствованная Буркгардтом.



Pages:     | 1 |   ...   | 2 | 3 || 5 | 6 |   ...   | 11 |


Похожие работы:

«Анализ роли океана и атмосферы в их взаимодействии в зонах действия среднеширотных циклонов на основе спутниковых СВЧ-радиометрических и судовых измерений А.Г. Гранков, А.А. Мильшин Фрязинская часть Института радиотехники и электроники РАН, 141190 г. Фрязино Московской обл., пл. Введенского E-mail: [email protected]; [email protected] Приведены результаты анализа возможностей использования данных спутниковых СВЧ-радиометрических (микроволновых) измерений для изучения значимости...»

«Приложение 1.1. МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования Московский государственный технический университет радиотехники, электроники и автоматики (МГТУ МИРЭА) УТВЕРЖДАЮ: 12 ноября 2012 г. ПРОГРАММА МЕЖДИСЦИПЛИНАРНОГО КУРСА МДК 00. Физические основы технологических лазеров и типовые технологические процессы лазерной обработки материалов 2012 г. Программа междисциплинарного курса...»

«Реализация требований ФГОС ООО средствами новых УМК “English 5-9” (авторы: Кузовлев В.П., Лапа Н.М., Перегудова Э.Ш. и др., изд-во Просвещение) В.П. Кузовлев к.п.н., профессор, руководитель авторского коллектива [email protected] УМКc Английский язык 1 2-11 www.prosv.ru/umk/we Вопросы для обсуждения Все ли учебники включены в федеральный перечень на 2014/2015 гг.? Какую позицию они там занимают? Какова степень готовности УМКс “English 5-9”? Как план их выпуска соотносится с графиком перехода на...»

«БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ХИМИЧЕСКИЙ ФАКУЛЬТЕТ КАФЕДРА АНАЛИТИЧЕСКОЙ ХИМИИ ПРОГРАММА ОБЩЕГО КУРСА АНАЛИТИЧЕСКАЯ ХИМИЯ ДЛЯ СТУДЕНТОВ 2 КУРСА ХИМИЧЕСКОГО ФАКУЛЬТЕТА СПЕЦИАЛЬНОСТИ: 1-31 05 01 – ХИМИЯ СПЕЦИАЛИЗАЦИИ: 1-31 05 01-01 Химия (научно-производственная деятельность) Лекций – 40 часов Семинарских занятий – 18 часов Лабораторных занятий – 114 часов Контроль самостоятельной работы –18 часов Составители – профессор Мечковский С.А. профессор Лещев С.М. Утверждена Советом...»

«1 Министерство образования и науки Российской Федерации Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования Нижегородский государственный университет им. Н.И. Лобачевского Арзамасский филиал Программа вступительного испытания в магистратуру АФ ННГУ в 2014году по ПЕДАГОГИКЕ Арзамас, 2013 2 Настоящая программа составлена на основании требований федерального государственного образовательного стандарта высшего профессионального образования (ФГОС...»

«МИНОБРНАУКИ РОССИИ Федеральное государственное автономное образовательное учреждение высшего профессионального образования Южный федеральный университет Институт управления в экономических, экологических и социальных системах УТВЕРЖДАЮ Директор Института управления в экономических, экологических и социальных системах _/ Петров В.В. / _ _ ПРОГРАММА ВСТУПИТЕЛЬНОГО ИСПЫТАНИЯ В МАГИСТРАТУРУ по направлению подготовки 20.04.01 Техносферная безопасность Ростов-на-Дону Пояснительная записка...»

«ТАВРИЧЕСКИЙ НАЦИОНАЛЬНЫЙ УНИВЕРСИТЕТ имени В.И.ВЕРНАДСКОГО Утверждаю Председатель Приемной комиссии (подпись) _ 2014 года ПРОГРАММА вступительного испытания в аспирантуру по специальной дисциплине по направлению подготовки: 45.06.01 Языкознание и литературоведение Профиль: германские языки (немецкий, английский) Утверждено на заседании приемной комиссии Таврического национального университета имени В.И. Вернадского (протокол № 4 от 22 мая 2014 года) Симферополь - Программа вступительного...»

«МИНИСТЕРСТВО СПОРТА, ТУРИЗМА И МОЛОДЕЖНОЙ ПОЛИТИКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования Российский государственный университет физической культуры, спорта, молодежи и туризма (ГЦОЛИФК) Иркутский филиал ФГБОУ ВПО РГУФКСМиТ БИОМЕХАНИКА Программа дисциплины федерального компонента цикла ЕН для студентов, обучающихся по специальности 032101.65 ФИЗИЧЕСКАЯ КУЛЬТУРА И СПОРТ и направлению 032100.62 ФИЗИЧЕСКАЯ...»

«ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ЗДРАВООХРАНЕНИЮ И СОЦИАЛЬНОМУ РАЗВИТИЮ ВОЛГОГРАДСКИЙ ГОСУДАРСТВЕННЫЙ МЕДИЦИНСКИЙ УНИВЕРСИТЕТ РАБОЧА УЧЕБНОЙ ДИСЦИПЛИНЫ ВНУТРЕННИЕ БОЛЕЗНИ Для специальности 060101 (040100) Лечебное дело Факультет Лечебный Кафедра Амбулаторной и скорой медицинской помощи Курс VI Семестр 11-12 Форма обучения - очная Лекции в XI семестре - 1 2 часов XI семестр: практические зан. 140 часов + сам. работа 70 часов = 210 часов XII семестр: практические зан. 116 часов + сам. работа 64 часа =...»

«Р.Ю. Виппер Учебник истории ДРЕВНОСТЬ Москва Книга по Требованию УДК 93 ББК 63.3 Р.Ю. Виппер Учебник истории: ДРЕВНОСТЬ / Р.Ю. Виппер – М.: Книга по Требованию, 2011. – 239 с. ISBN 978-5-458-23057-5 Учебник истории в 3 томах, написанный профессором истории Робертом Юрьевичем Виппером (1859-1954), содержит систематическое изложение событий всемирной истории с древности до начала ХХ века. Книги неоднократно переиздавались до и после 1917 года и пользовались широкой популярностью не только как...»

«1 ВВЕДЕНИЕ В соответствии с п. 40 Положения о подготовке научно-педагогических и научных кадров в системе послевузовского профессионального образования в Российской Федерации, утвержденного Приказом Министерства общего и профессионального образования от 27 марта 1998 г. № 814 (в редакции Приказов Минобразования РФ от 16.03.2000 № 780, от 27.11.2000 № 3410, от 17.02.2004 № 696), (зарегистрировано в Минюсте РФ 5 августа 1998 г. № 1582), поступающие в аспирантуру сдают вступительные экзамены в...»

«Министерство образования и науки Российской Федерации Беловский институт (филиал) федерального государственного бюджетного образовательного учреждения высшего профессионального образования Кемеровский государственный университет Кафедра финансов Рабочая программа профессионального модуля Ведение бухгалтерского учета источников формирования имущества, выполнение работ по инвентаризации имущества и финансовых обязательств организации по специальности среднего профессионального образования 080114...»

«Научно-практическое издание Дерматовенерология Под редакцией А.А. Кубановой СодержаНИе Предисловие Участники издания Методология создания и программа обеспечения качества. viii Список аббревиатур Болезни кожи Экзема Атопический дерматит Псориаз Истинная (акантолитическая) пузырчатка Красная волчанка Ограниченная (локализованная) склеродермия Угревая болезнь Алопеция гнездная Витилиго Злокачественные лимфомы кожи Саркома Капоши Аногенитальные бородавки Дерматомикозы Микроспория Трихофития...»

«МИНИСТЕРСТВО ОБРАЗОВАНИЯ РЕСПУБЛИКИ БЕЛАРУСЬ Учебно-методическое объединение по гуманитарному образованию УТВЕРЖДАЮ Первый заместитель Министра образования Республики Беларусь А.И.Жук Регистрационный № ТД-/тип. СЛАВЯНСКИЙ ЯЗЫК (БОЛГАРСКИЙ) Типовая учебная программа для высших учебных заведений по специальности 1-21 05 04 Славянская филология СОГЛАСОВАНО СОГЛАСОВАНО Начальник Управления высшего и Председатель учебносреднего специального образования методического объединения Ю.И. Миксюк по...»

«МИНИСТЕРСТВО Государственное РОССИЙСКИЙ ОБРАЗОВАНИЯ И НАУКИ бюджетное образовательное ГОСУДАРСТВЕННЫЙ РОССИЙСКОЙ учреждение высшего ГУМАНИТАРНЫЙ ФЕДЕРАЦИИ профессионального УНИВЕРСИТЕТ образования ФИЛИАЛ В Г. БАЛАШИХЕ Кафедра экономико-управленческих и правовых дисциплин Филиала РГГУ в городе Балашихе УТВЕРЖДАЮ Директор Филиала РГГУ в г. Балашихе Т.Н. Миронова ДЕМОГРАФИЯ Учебно-методический комплекс для студентов очного и заочного отделений Для специальности 080504 - государственное и...»

«ПРОГРАММА деловой игры Как эффективно подготовить и управлять инвестиционным проектом: успешная практика Внешэкономбанка и его партнеров в рамках образовательного проекта Подготовка специалистов – участников инвестиционных проектов, реализуемых при поддержке институтов развития Уральский федеральный университет им. первого Президента России Б.Н. Ельцина, г. Екатеринбург, 12-14 сентября 2012 г. 1 ПРОГРАММА 12 сентября (среда) Время Тема занятий Эксперт Регистрация участников 9:00-9:30 30 мин....»

«УДК 330 (560) Вартаньян Эгнара Гайковна Vartanian Egnara Gaikovna доктор исторических наук, профессор, D.Phil. in History, профессор кафедры новой, новейшей истории Professor of Modern, Contemporary History и международных отношений and International Relations Department, Кубанского государственного университета Kuban State University тел.: (918) 45-92-036 [email protected] ОПЫТ РАЗВИТИЯ ЭКОНОМИКИ ECONOMIC DEVELOPMENT ТУРЕЦКОЙ РЕСПУБЛИКИ IN THE REPUBLIC OF TURKEY: В НОВЕЙШЕЕ ВРЕМЯ:...»

«Пояснительная записка Специальная педагогика, являясь составной частью педагогики, включает теорию и историю специальной педагогики и специального образования лиц с ограниченными возможностями и предметные области составляющего специальную педагогику научного и практического знания об образовании отдельных категорий лиц с особыми образовательными потребностями (с нарушениями сенсорной сферы, интеллекта, речи и др.). Программа вступительных испытаний ориентирует соискателя в основных проблемах...»

«Ассоциация студентов-физиков и молодых учёных России Северный (Арктический) федеральный университет Архангельский научный центр УрО РАН Институт электрофизики УрО РАН Правительство Архангельской области проводят Девятнадцатую Всероссийскую научную конференцию студентов-физиков и молодых ученых ВНКСФ-19 28 марта - 4 апреля 2013 года г. Архангельск УЧАСТНИКИ КОНФЕРЕНЦИИ Участниками ВНКСФ-19 могут стать студенты, аспиранты и молодые ученые из России и других стран, приславшие заявку на участие в...»

«Министерство образования и наук и Российской Федерации Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования Уральский государственный горный университет Уральская горнопромышленная декада, 1-10 апреля 2013 года, г. Екатеринбург МЕЖДУНАРОДНАЯ НАУЧНО-ПРАКТИЧЕСКАЯ КОНФЕРЕНЦИЯ УРАЛЬСКАЯ ГОРНАЯ ШКОЛА – РЕГИОНАМ 8-9 апреля 2013 года Сборник докладов Ответственный за выпуск доктор технических наук, профессор Н. Г. Валиев Екатеринбург – 2013 М34 Косарев...»










 
2014 www.av.disus.ru - «Бесплатная электронная библиотека - Авторефераты, Диссертации, Монографии, Программы»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.