§ 74 Статистические методы в естественных и гуманитарных науках

В § 8 мы уже говорили о том, какую роль играют математические методы в обработке результатов научных экспериментов и наблюдений. В этом параграфе мы познакомимся с ними подробнее на основе тех представлений, которые мы получили, знакомясь с понятием вероятности.

Мы будем рассматривать системы, состоящие из достаточно большого числа элементов. Что такое «достаточно большое»? Это зависит от того, какая система исследуется. Иногда число элементов может быть действительно огромным, как, например, число молекул в физических экспериментах, где оно составляет миллиарды миллиардов. Иногда, например в социальных исследованиях, оно может иметь величину порядка нескольких тысяч, а в некоторых случаях, таких как психологические исследования, может быть равным всего нескольким десяткам. Однако независимо от того, какой порядок имеет число исследуемых элементов системы, во всех этих случаях применяют методы математической статистики, которые строятся на общих математических принципах. Слово «статистика» происходит от того же корня, что и штат[24]. Вначале оно обозначало описание экономического или политического состояния государства или города. Впоследствии этот термин стал использоваться в более широком смысле и, в соответствии с одним из определений, обозначать представление результатов в наиболее сжатой форме.

Потребность в использовании статистики и её методов возникает при исследовании таких систем, где требуется выявить свойства целого на основании поведения его частей или элементов. При этом это поведение либо в принципе не наблюдаемо, как, например, поведение отдельных молекул в газах, либо обладает очень большим разнообразием. Последнее встречается в социологических и психологических исследованиях, где на основании самых различных предпочтений, суждений и поступков отдельных людей требуется сделать выводы, касающиеся всей группы или сообщества. Точно такая же ситуация часто возникает в биологии, когда каждое отдельное животное или растение проявляет во время эксперимента или наблюдения самые различные свойства, на основе которых надо описать всю группу этих организмов в целом.

В этот раз мы будем исследовать не размножение бактерий, как в § 8, а способность людей к решению определённого типа задач. Предположим, что психолог разработал систему тренинга, которая, как он думает, повышает успешность этого решения. Психолог выдвигает гипотезу, что разработанная им система тренинга эффективна. Но это только гипотеза, и она нуждается в проверке. Каким образом нужно грамотно провести эту проверку? Для этого надо создать две группы испытуемых, одна из которых будет контрольной, а другая – экспериментальной. Важно, чтобы эти группы в среднем ничем не различались между собой. В этом случае говорят, что они должны быть выравнены по всем основным свойствам, которые могут характеризовать человека. Это значит, что в них должен быть равным средний возраст испытуемых, уровень их образования, одинаковое соотношение мужчин и женщин и т. д. Если это условие не будет соблюдено, то всегда можно будет сказать, что на успешность решения задач повлиял не тренинг, а какое-то другое различие между группами. Создав такие группы, психолог начинает проводить тренинг. Испытуемые экспериментальной группы периодически (допустим, через день) приходят на занятия и проводят там определённое время (допустим, полтора часа). Для того чтобы эксперимент был убедительным, испытуемые контрольной группы также должны через день приходить в то же помещение на полтора часа, но вместо тренинга заниматься там чем-либо другим, например слушать музыку или читать журнал.

Таблица 7

Оформление результатов эксперимента

Когда требуемое количество занятий проведено, психолог приступает к проверке эффективности своего метода, т. е. даёт испытуемым обеих групп определённое количество задач и определяет, со сколькими из них справился каждый участник эксперимента. Предположим, что задач было 10, а испытуемых по 15 в каждой группе. Полученные результаты выглядят так (табл. 7).

Для того чтобы сравнить результаты, полученные в группах, надо сначала вычислить средний результат в каждой группе. Для этой цели обычно берётся среднее арифметическое значение, которое вычисляется как сумма всех полученных значений, делённая на число испытуемых. В таблице среднее арифметическое обозначено в последнем столбце буквой М. Мы видим, что среднее количество решённых задач в экспериментальной группе больше, чем в контрольной. Однако это различие невелико, и вполне возможно, что оно получилось чисто случайно. Представьте себе, что мы случайным образом разделили 30 человек на две группы и, ничего с ними не делая, провели в каждой из групп испытание. Мы всегда получим какое-нибудь различие просто за счёт того, что способность к решению задач у всех испытуемых разная. Но в этом случае полученное различие будет объясняться случайными причинами. Как убедиться в том, что полученные психологом в эксперименте результаты не случайны, а действительно подтверждают эффективность разработанного им тренинга? Для этого существуют методы математической статистики, которые позволяют вычислить вероятность того, что полученные различия не случайны. Если эта вероятность окажется достаточно большой, то будут все основания считать, что разработанный тренинг действительно увеличивает способность к решению задач этого типа. В большинстве научных исследований принято, что такая вероятность должна быть не менее 0,95, тогда вероятность ошибки равна 1 – 0,95 = 0,05. Это значит, что в одном из двадцати случаев мы будем ошибочно считать, что наш метод действенен, в то время как на самом деле различия между группами являются чисто случайными. Ещё более уверенный вывод мы можем сделать, если окажется, что вероятность того, что полученные различия окажутся не случайными, будет равна 0,99 или 0,999. Тогда мы будем ошибаться всего в одном случае из ста или из тысячи. В противном случае вероятность ошибки слишком велика, поэтому говорят, что полученные различия не являются достоверными. Именно такой результат и получил наш психолог в своём исследовании. Его тренинг не дал достоверных результатов.

Но можно ли на этом основании утверждать, что разработанный психологом тренинг бесполезен? Нельзя, потому что для того, чтобы решить этот вопрос, требуется провести большее число испытаний. Вероятность определяется тем точнее, чем больше испытаний или наблюдений мы проводим.

Когда вероятность какого-либо события установлена на основании большого числа испытаний, она позволяет делать правильные прогнозы. Допустим, что проведён опрос среди жителей города, касающийся того, верят ли они рекламе стирального порошка. Из тысячи опрошенных мужчин и женщин различного возраста 428 ответили утвердительно. На этом основании можно сделать вывод, что вероятность того, что какой-то человек доверяет рекламе, равна приблизительно 0,43. Если в городе живёт 1 млн жителей, то 430 тыс. из них поверят рекламе. При правильном расчёте ошибка будет небольшой, и на этом основании рекламодатель может решить, выгодно ли ему платить за размещение своей рекламы.

Проверьте свои знания

1. В каких случаях требуется использование методов математической статистики?

2. Как вычисляется среднее арифметическое значение?

3. Вероятность чего определяется в результате статистической обработки экспериментальных данных?

4. От чего зависит точность прогноза, сделанного на основе статистической обработки данных?

Задания

1. Подберите эпиграф к данному параграфу.

2. Опираясь на полученные на уроках истории знания, приведите примеры использования статистики и её методов в древних государствах.

3. Объясните, как методы математической статистики применяются в современных демографических исследованиях.

4. Существует такое понятие, как «печальная статистика». Какое значение вкладывается в это словосочетание? Какие примеры из этой области вам известны? Как, по вашему мнению, можно изменить в лучшую сторону данную ситуацию?

Ваша будущая профессия

1. Докажите, что знание методов математической статистики необходимо не только специалистам, но и любому современному человеку.

2. Используя дополнительные источники информации, выясните, чем занимаются и где работают врачи-кибернетики.

3. Используя дополнительную литературу и ресурсы Интернета, выясните, что является областью деятельности актуариев.

4. Статистик – профессия, которая требует от специалиста высокой работоспособности, развитого аналитического мышления, математических способностей, хорошей памяти, способности к концентрации внимания в течение длительного времени. Статистики работают в банках и больницах, компаниях сотовой связи и телевизионных компаниях, страховых компаниях и магазинах, электронной торговле и исследовательских центрах. Напишите краткое эссе о том, какую именно работу выполняют статистики в этих сферах.