Какая модель является статистической. Статистическое моделирование. Федеральное государственное автономное образовательное учреждение высшего профессионального образования «Южный федеральный университет»

Статистическое моделирование

Статистическое и эконометрическое модели́рование - исследование объектов познания на их статистических моделях ; построение и изучение моделей реально существующих предметов, процессов или явлений (например: экономических процессов в эконометрике) с целью получения объяснений этих явлений, а также для предсказания явлений или показателей, интересующих исследователя.

Оценка параметров таких моделей производится с помощью статистическиx методов . Например: метод максимального правдоподобия , метод наименьших квадратов , метод моментов .

Y = b_1 + b_2×X

где Y - расходы, X - доход, b_1 и b_2 - параметры уравнения (parameters), u - стохастическая ошибка (disturbance, error term).

Виды статистических и эконометрических моделей

Линейная регрессия (OLS) Регрессии на бинальные переменные Авторегрессионная модель Система одновременных уравнений (SEM) Модель линейной вероятности (LPM) Логит модель (Logit) Пробит модель (Probit) и др.

Wikimedia Foundation . 2010 .

Смотреть что такое "Статистическое моделирование" в других словарях:

    Статистическое моделирование - способ исследования процессов поведения вероятностных систем в условиях, когда неизвестны внутренние взаимодействия в этих системах. Он заключается в машинной имитации изучаемого процесса, который как бы копируется на… … Экономико-математический словарь

    Метод прикладной и вычислительной математики, состоящий в реализации на ЭВМ специально разрабатываемых стохастич. моделей изучаемых явлений или объектов. Расширение области применения С. м. связано с быстрым развитием техники и особенно… … Математическая энциклопедия

    Численный метод решения математических задач, при котором искомые величины представляют вероятностными характеристиками какого либо случайного явления, это явление моделируется, после чего нужные характеристики приближённо определяют… … Большая советская энциклопедия

    Моделирование ситуаций с использованием статистических закономерностей, присущих рассматриваемому явлению. Словарь бизнес терминов. Академик.ру. 2001 … Словарь бизнес-терминов

    Моделирование исследование объектов познания на их моделях; построение и изучение моделей реально существующих объектов, процессов или явлений с целью получения объяснений этих явлений, а также для предсказания явлений, интересующих… … Википедия

    МОДЕЛИРОВАНИЕ ИМИТАЦИОННОЕ в социологии - вид моделирования математического, состоящий в воспроизведении на ЭВМ социального процесса либо функционирования социальной системы. Почти всегда предполагает воспроизведение случайных факторов, влияющих на изучаемое явление, и, как следствие,… … Социология: Энциклопедия

    МОДЕЛИРОВАНИЕ, СТАТИСТИЧЕСКОЕ - разработка разнообразных моделей, которые отображают статистические закономерности описываемого объекта, явления. Общей специфической чертой этих моделей является учет случайных возмущений или отклонений. Объектами С.м. являются различные… … Большой экономический словарь

    МОДЕЛИРОВАНИЕ СТАТИСТИЧЕСКОЕ - представление или описание некоторого феномена или системы взаимосвязей между явлениями посредством набора переменных (показателей, признаков) и статистических взаимосвязей между ними. Цель М.С. (как и любого другого моделирования) представить… … Социология: Энциклопедия

    Для улучшения этой статьи желательно?: Исправить статью согласно стилистическим правилам Википедии. Имитационное моделирование (ситуационное … Википедия

    ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ - (...от франц. modele образец) метод исследования каких либо явлений и процессов методом статистических испытаний (метод Монте Карло) с помощью ЭВМ. Метод основан на розыгрыше (имитации) воздействия случайных факторов на изучаемое явление или… … Энциклопедический словарь по психологии и педагогике

Книги

  • Статистическое моделирование. Методы Монте-Карло. Учебное пособие для бакалавриата и магистратуры , Михайлов Г.А.. Учебное пособие посвящено особенностям моделирования случайных величин, процессов и полей. Особое внимание уделяется численному интегрированию, в частности методу Монте-Карло. Дается решение…

Статистические и теоретико-вероятностные методы составляют методологическую основу одноименного вида моделирования. На этом уровне формализации модели речь о вскрытии закона, обеспечивающего устранение неопределенности при принятии решения, пока еще не идет, но существует некоторый массив наблюдений за данной системой или ее аналогом, позволяющих сделать некие выводы относительно прошлого/текущего/будущего состояния системы, основываясь на гипотезе об инвариантности ее поведения.

Как всегда, сформулируем определение… Статистическая или теоретико-вероятностная модель (стохастическая модель) - это модель, в которой обеспечивается учет влияния случайных факторов в процессе функционирования системы, основанная на применении статистической или теоретико-вероятностной методологии по отношению к повторяющимся феноменам . Данная модель оперирует количественными критериями при оценке повторяющихся явлений и позволяет учитывать их нелинейность, динамику, случайные возмущения за счет выдвижения на основе анализа результатов наблюдений гипотез о характере распределения некоторых случайных величин, сказывающихся на поведении системы.

По существу, теоретико-вероятностные и статистические модели отличаются уровнем неопределенности знаний о моделируемой системе, существующей на момент синтеза модели. В случае, когда представления о системе носят, скорее, теоретический характер и основываются исключительно на гипотезах о характере системы и возмущающих воздействий, не подкрепленных результатами наблюдений, теоретико-вероятностная модель является единственно возможной. Когда же на этапе синтеза модели уже существуют данные, полученные опытным путем, появляется возможность подкрепления гипотез за счет их статистической обработки. Это становится очевидным, если рассмотреть соотношение между методами математической статистики и теории вероятностей. Математическая статистика - это наука, изучающая методы вскрытия закономерностей, свойственных большим совокупностям однородных объектов или событий, на основании их выборочного обследования (либо большим массивам данных, полученных в результате наблюдения за одним и тем же объектом на протяжении достаточно протяженного интервала времени). Теория же вероятностей изучает количественные закономерности, которым следуют случайные явления, если эти явления определяются событиями известной вероятности. Соответственно, математическая статистика является связующим звеном между теорией вероятностей и явлениями реального мира, поскольку позволяет сформулировать оценки вероятности тех или иных событий на основе анализа статистических данных.

Можно утверждать, что статистические модели представляют собой особый вид математических моделей, использующих в качестве исходных данных не только актуальные данные о текущем состоянии объекта, но и данные, характеризующие состояние либо других объектов данного класса, либо этого объекта, но в иной момент времени. Статистические модели применимы для изучения массовых явлений любой природы, включая и те, которые не относятся к категории вероятностно определенных (математическая статистика приспособлена и для решения детерминированных задач). При моделировании последних статистический процесс вводится в модель искусственно для получения статистических оценок численного решения (например, точности измерения параметров детерминированного процесса).

Методы математической статистики и теории вероятности могут вводиться, в том числе, и в логические и логико-лингвистические модели, как это было указано в предыдущем подразделе. Например, могут рассматриваться методы интеграции статистических оценок в модели семантических отношений для придания различных весов дугам, связывающим отдельные вершины. Статистические оценки могут быть внедрены и в системы представления тезаурусов для разрешения ситуаций полисемии без обращения к процедурам контекстного анализа. Иными словами, статистические методы могут составлять как основу модели, так и применяться для модификации моделей других типов.

Для обработки результатов наблюдений используются методы корреляционного, регрессионного, факторного, кластерного и иных видов анализа, оперирующих статистическими гипотезами. Особая роль здесь отводится методу статистических испытаний (методу Монте-Карло ). Это метод численного решения математических задач, основанный на многократном теоретико-вероятностном и статистическом моделировании случайных величин или процессов с целью построения статистических оценок для искомых величин. Сущность метода состоит в реализации многократного моделирования случайного явления с помощью некоторой процедуры, дающей случайный результат. Для этого с применением ЭВМ создается некоторое множество реализаций случайных процессов, моделирующих возмущающие воздействия на исследуемый объект или процесс, после чего производится моделирование этого процесса или объекта в условиях, определяемых полученными случайными воздействиями. Результаты такого моделирования обрабатывают с использованием методов математической статистики. При этом могут варьироваться тип и параметры распределения случайной величины.

Реализация случайного процесса методом Монте-Карло представляет собой последовательность розыгрышей единичных жребиев, перемежающихся обычными расчетами, в ходе которых определяется результат возмущающего воздействия на объект или процесс, на исход операции.

Поскольку адекватность модели распределения случайных воздействий в общем случае установить трудно, задачей моделирования с применением метода Монте-Карло является обеспечение робастности полученных решений (устойчивости к изменению параметров закона распределения случайных величин и начальных условий моделирования) . Если результат моделирования не является робастным (существенно зависит от параметров закона распределения и параметров модели), то это свидетельствует о наличии высокого риска при принятии решения в данной реализации моделируемой системы.

Важную роль в статистических моделях играют гипотезы о характере процессов смены состояний в моделируемой системе. Так, например, весьма интересный случай представляет собой гипотеза о «марковости » процессов (получившая название в честь русского ученого А.А. Маркова - начало XX века). Марковские процессы представляют собой случай процесса с детерминированными вероятностями, для которого ранняя предыстория смены состояний системы на некотором предшествующем интервале времени несущественна для установления вероятности наступления следующего события - основное значение придается ее текущему состоянию . Если существует уверенность в марковости процесса, это существенно меняет представления о системе (она может рассматриваться как «инерционная», в большой степени зависящая от текущего ее состояния и характера возмущающего воздействия). Принцип марковости был открыт при анализе текстов на естественных языках, где вероятность появления следующего символа может быть предсказана на основе статистического анализа текстовых массивов, на данном конкретном языке.

Статистическое моделирование тесно сопряжено с имитационным моделированием , ходе которого модель объекта нередко «погружается в вероятностную (статистическую) среду», в которой проигрываются различные ситуации и режимы функционирования модели/объекта. Однако имитационные модели могут реализовываться и в детерминированных средах.

Методы статистического моделирования широко распространены в сфере стратегического планирования и управления . Широкому распространению методов статистического моделирования в сфере оперативного управления препятствует высокая трудоемкость процесса моделирования. В основном это связано с необходимостью глубокой математической проработки моделей и высокими требованиями, предъявляемыми к математическим познаниям пользователей.

Статистическое наблюдение.

Сущность статистического наблюдения.

Начальным этапом всякого статистического исследования служит планомерный, научно организованный сбор данных о явлениях и процессах общественной жизни, называемый статистическим наблюдением. Значение этого этапа исследования определяется тем, что использование лишь вполне объективной и достаточно полной, полученной в результате статистического наблюдения, на последующих этапах в состоянии обеспечить научно обоснованные выводы о характере и закономерностях развития изучаемого объекта. Статистическое наблюдение осуществляется путем оценки и регистрации признаков единиц изучаемой совокупности в соответствующих учетных документах. Полученные таким образом данные представляют собой факты, так или иначе характеризующие явления общественной жизни. Использование аргументации, основанной на фактах, не противоречит применению теоретического анализа, поскольку всякая теория в конечном счете основывается на фактическом материале. Доказательная способность фактов еще больше возрастает в результате статистической обработки, обеспечивающей их систематизацию, представление в сжатом виде. Статистическое наблюдение следует отличать от других форм наблюдений, осуществляемых в повседневной жизни, основанных на чувственном восприятии. Статистическим можно назвать лишь такое наблюдение, которое обеспечивает регистрацию устанавливаемых фактов в учетных документах для последующего их обобщения. Конкретными примерами статистического наблюдения служит систематическое собирание сведений, например на машиностроительных предприятиях о количестве произведенных машин и узлов, издержках производства, прибыли и т. д. Статистическое наблюдение должно удовлетворять довольно жестким требованиям: 1. Наблюдаемые явления должны иметь определенное народнохозяйственное значение, научную либо практическую ценность, выражать определенные социально-экономические типы явлений. 2. Статистическое наблюдение должно обеспечить сбор массовых данных, в которых отражается вся совокупность фактов, относящихся к рассматриваемому вопросу, поскольку общественные явления находятся в постоянном изменении, развитии, имеют различные качественные состояния.

Неполные данные, недостаточно разносторонне характеризующие процесс, приводят к тому, что из их анализа делаются ошибочные выводы. 3. Многообразие причин и факторов, определяющих развитие социальных и экономических явлений, предопределяет ориентацию статистического наблюдения наряду со сбором данных, непосредственно характеризующих изучаемый объект, на учет фактов и событий, под влиянием которых осуществляется изменение его состояний. 4. Для обеспечения достоверности статистических данных на стадии статистического наблюдения необходима тщательная проверка качества собираемых фактов. Строгая достоверность его данных- одна их важнейших характеристик статистического наблюдения. Дефекты статистической информации, выражающиеся в ее недостоверности, не могут быть устранены в процессе дальнейшей обработки, поэтому их появление затрудняет принятие научно обоснованных решений и сбалансированность экономики. 5. Статистическое наблюдение должно проводиться на научной основе по заранее разработанным системе, плану и правилам (программе), обеспечивающим строго научное решение всех программно-методологических и организационных вопросов.

Программно-методологическое обеспечение статистического наблюдения.

Подготовка к статистическому наблюдению, обеспечивающая успех дела, предполагает необходимость своевременного решения ряда методологических вопросов, связанных с определением задач, цели, объекта, единицы наблюдения, разработкой программы и инструментария, определением способа сбора статистических данных. Задачи статистического наблюдения непосредственно вытекают из задач статистического исследования и состоят, в частности, в получении массовых данных непосредственно о состоянии изучаемого объекта, в учете состояния явлений, оказывающих влияние на объект, изучении данных о процессе развития явлений. Цели наблюдения определяются, прежде всего, нуждами информационного обеспечения для экономического и социального развития общества. Поставленные перед государственной статистикой цели уточняются и конкретизируются ее руководящими органами, в результате чего определяются направления и масштаб работы. В зависимости от цели решается вопрос об объекте статистического наблюдения, т.е. что именно следует наблюдать. Под объектом понимается совокупность вещественных предметов, предприятий, трудовых коллективов, лиц и т.д., посредством которых осуществляются явления и процессы, подлежащие статистическому исследованию. Объектами наблюдения в зависимости от целей могут выступать, в частности, массы единиц производственного оборудования, продукции, товарно материальных ценностей, населенных пунктов, районов, предприятий, организаций и учреждений различных отраслей народного хозяйства, население и отдельные его категории и т.д. Установление объекта статистического наблюдения связано с определением его границ на основе соответствующего критерия, выраженного некоторым характерным ограничительным признаком, называемым цензом. Выбор ценза оказывает существенное влияние на формирование однородных совокупностей, обеспечивает невозможность смешения различных объектов либо недоучета некоторой части объекта. Сущность объекта статистического наблюдения уясняется полнее при рассмотрении единиц, из которых он состоит: Единицами наблюдения служат первичные элементы объекта статистического наблюдения, являющиеся носителями регистрируемых признаков.

От единицы наблюдения следует отличать отчетную единицу. Отчетной единицей служит такая единица статистического наблюдения, от которой в установленном порядке получают информацию, подлежащую регистрации. В ряде случаев оба понятия совпадают, но нередко они имеют и вполне самостоятельное значение. Учесть все множество признаков, характеризующих объект наблюдения, оказывается невозможным и нецелесообразным, поэтому при разработке плана статистического наблюдения следует тщательно и квалифицированно решать вопрос о составе признаков, подлежащих регистрации в соответствии с поставленной целью. Перечень признаков, формулируемых в виде вопросов, обращаемых к единицам совокупности, на которые должно дать ответ статистическое исследование, представляет собой программу статистического наблюдения.

Чтобы получить исчерпывающую характеристику изучаемого явления, в составе программы должен быть учтен весь круг его существенных признаков. Однако проблематичность практического осуществления этого принципа обусловливает необходимость включения в программу лишь наиболее существенных признаков, выражающих социально-экономические типы явления, его важнейшие черты, свойства и взаимосвязи. Объем программы регламентируется величиной ресурсов, имеющихся в распоряжении статистических органов, сроками получения результатов, требованиями к степени детализации разработок и т.д. Содержание программы определяется характером и свойствами изучаемого объекта, целями и задачами исследования. К числу общих требований к составлению программы относится недопустимость включения в ее состав вопросов, на которые затруднительно получить точные, вполне достоверные ответы, дающие объективную картину той или иной ситуации. При рассмотрении некоторых наиболее важных признаков в состав программы принято включать контрольные вопросы, служащие для согласованности получаемых сведений. Чтобы усилить взаимопроверку вопросов и аналитичность программы наблюдения, взаимосвязанные вопросы располагаются в определенной последовательности, иногда в блоках взаимосвязанных признаков.

Вопросы программы статистического наблюдения должны быть сформулированы четко, ясно, лаконично, не допуская возможности различных их истолкований. В программе нередко приводится перечень возможных вариантов ответов, посредством которых уточняется смысловое содержание вопросов. Методологическое обеспечение статистического наблюдения предполагает, что одновременно с программой наблюдения составляется и программа ее разработки. Задачи исследования формулируются в перечне обобщающих статистических показателей. Эти показатели должны быть получены в результате обработки собранного материала, признаков, с которыми корреспондируется каждый показатель, и макетов статистических таблиц, где представлены результаты обработки первичной информации. Программа разработки, выявляя недостающую информацию, позволяет уточнить программу статистического наблюдения. Проведение статистического наблюдения предполагает необходимость подготовки соответствующего инструментария: формуляров и инструкции по их заполнению. Статистический формуляр - это первичный документ, в котором фиксируются ответы на вопросы программы по каждой из единиц совокупности. Формуляр, таким образом, - это носитель первичной информации. Для всех формуляров характерны некоторые обязательные элементы: содержательная часть, включающая перечень вопросов программы, свободная графа либо несколько граф для записи ответов и шифров (кодов) ответов, титульная и адресная печати. Статистические формуляры в целях обеспечения единства трактовки их содержательной части обычно сопровождаются инструкцией, т.е. письменными указаниями и разъяснениями к заполнению бланков статистического наблюдения. Инструкция разъясняет цель статистического наблюдения, характеризует его объект и единицу, время и продолжительность наблюдения, порядок оформления документации, сроки представления результатов. Однако главное назначение инструкции состоит в разъяснении содержания вопросов программы, как следует давать на них ответы и заполнять формуляр.

Виды и способы статистического наблюдения.

Успех дела сбора качественных и полных исходных данных с учетом требования экономного расходования материальных, трудовых и финансовых ресурсов во многом определяется решением вопроса о выборе вида, способа и организационной формы статистического наблюдения.

Виды статистического наблюдения.

Необходимость выбора того или иного варианта сбора статистических данных, в наибольшей мере соответствующего условиям решаемой задачи, определяется наличием нескольких видов наблюдения, различающихся прежде всего по признаку характера учета фактов во времени. Систематическое наблюдение, осуществляемое непрерывно и обязательно по мере возникновения признаков явления, называется текущим. Текущее наблюдение проводится на основе первичных документов, содержащих информацию, необходимую для достаточно полной характеристики изучаемого явления. Статистическое наблюдение, проводимое через некоторые равные промежутки времени, называется периодическим. Примером может служить перепись населения. Наблюдение, проводимое время от времени, без соблюдения строгой периодичности либо в разовом порядке, называется единовременным. Виды статистического наблюдения дифференцируются с учетом различия информации по признаку полноты охвата совокупности. В связи с этим различают сплошное и не сплошное наблюдения. Сплошным называют наблюдение, учитывающее все без исключения единицы изучаемой совокупности. Не сплошное наблюдение заведомо ориентируется на учет некоторой, как правило, достаточно массовой части единиц наблюдения, позволяющей тем не менее получить устойчивые обобщающие характеристики все статистической совокупности. В статистической практике применяются различные виды не сплошного наблюдения: выборочное, способ основного массива, анкетное и монографическое. Качество не сплошного наблюдения уступает результатам сплошного, однако в ряде случаев статистическое наблюдение вообще оказывается возможным только как не сплошное. Для получения представительной характеристики всей статистической совокупности по некоторой части ее единиц применяют выборочное наблюдение, основанное на научных принципах формирования выборочной совокупности. Случайный характер отбора единиц совокупности гарантирует беспристрастность результатов выборки, предупреждает их тенденциозность. По способу основного массива производится отбор наиболее крупных, наиболее существенных единиц совокупности, преобладающих в общей их массе по изучаемому признаку. Специфическим видом статистического наблюдения служит монографическое описание, представляющее собой детальное обследование отдельного, но весьма типичного объекта, обусловливающего интерес и с точки зрения изучения всей совокупности.

Способы статистического наблюдения.

Дифференциация разновидностей статистического наблюдения возможна также в зависимости от источников и способов получения первичной информации. В связи с этим различают непосредственное наблюдение, опрос и документальное наблюдение. Непосредственным называют наблюдение, осуществляемое путем подсчета, измерения значений признаков, снятия показаний приборов специальными лицами, осуществляющими наблюдениями, иначе говоря- регистраторами. Достаточно часто ввиду невозможности применения иных способов статистическое наблюдение осуществляется путем опроса по некоторому перечню вопросов. Ответы фиксируются в специальном формуляре. В зависимости от способов получения ответов различают экспедиционный и корреспондентский способы, а также способ саморегистрации. Экспедиционный способ опроса осуществляется в устной форме специальным лицом (счетчиком, экспедитором), заполняющим одновременно формуляр или бланк обследования.

Корреспондентский способ опроса организуется путем рассылки статистическими органами бланков обследования некоторому соответствующим образом подготовленному кругу лиц, называемых корреспондентами. Последние обязаны согласно договоренности заполнить бланк и вернуть его в статистическую организацию. Проверка правильности заполнения формуляров имеет место при опросе способом саморегистрации. Опросные листы заполняют, как и при корреспондентском способе, сами опрашиваемые, но их раздачу и сбор, а также инструктаж и контроль правильности заполнения осуществляют счетчики.

Основные организационные формы статистического наблюдения.

Все разнообразие видов и способов наблюдения осуществляется на практике посредством двух основных организационных форм: отчетности и специально организованного наблюдения. Статистическая отчетность - основная форма статистического наблюдения в социальном обществе, охватывающая все предприятия, организации и учреждения производственной и непроизводственной сфер. Отчетность- это систематическое представление в установленные сроки учетно-статистической документации в виде отчетов, всесторонне характеризующих итоги работы предприятий и учреждений в течение отчетных периодов. Отчетность непосредственно связана с первичными и бухгалтерскими учетными документами, базируется на них и представляет собой их систематизацию, т.е. результат обработки и обобщения. Отчетность осуществляется по строго установленной форме, утверждаемой Госкомстатом России. Перечень всех форм с указанием их реквизитов (принадлежностей) называется табелем отчетности. Каждая из форм отчетности должна содержать следующие сведения: наименование; номер и дату утверждения; наименование предприятия, его адрес и подчиненность; адреса, в которые представляется отчетность; периодичность, дату представления, способ передачи; содержательную часть в виде таблицы; должностной состав лиц, ответственных за разработку и достоверность отчетных данных, т.е. обязанных подписать отчет. Многообразие условий производственного процесса в различных отраслях материального производства, специфичность воспроизводственного процесса в локальных условиях, учет значимости тех или иных показателей обусловливают различие видов отчетности. Различают, прежде всего, типовую и специализированную отчетность. Типовая отчетность имеет одинаковую форму и содержание для всех предприятий либо учреждений отрасли народного хозяйства. Специализированная отчетность выражает специфические для отдельных предприятий отрасли моменты. По принципу периодичности отчетность подразделяется на годовую и текущую: квартальную, месячную, двухнедельную, недельную. В зависимости от способа передачи информации различают почтовую и телеграфную отчетность. Статистические переписи служат второй по значению организационной формой статистического наблюдения. Перепись представляет собой специально организованное статистическое наблюдение, направленное на учет численности и состава определенных объектов (явлений), а также установление качественных характеристик их совокупностей на некоторый момент времени. Переписи представляют статистическую информацию, не предусмотренную отчетностью, а в ряде случаев существенно уточняют данные текущего учета.

Для обеспечения высокого качества результатов статистических переписей осуществляется комплекс подготовительных работ. Содержание организационных мероприятий по подготовке переписей, осуществляемых согласно требованиям и правилам статистической науки, излагается в специально разрабатываемом документе, называемом организационном планом статистического наблюдения. В организационном плане должны найти решение вопросы о субъекте (исполнителе) статистического наблюдения, о месте, времени, сроках и порядке проведения, об организации переписных участков, о подборе и подготовке счетных работников, обеспечении их необходимой учетной документацией, о проведении ряда других подготовительных работ и т.д. Субъектом наблюдения выступает организация (учреждение) либо его подразделение, ответственное за наблюдение, организующее его проведение, а также непосредственно выполняющие функции по сбору и обработке статистических данных. Вопрос о месте наблюдения (месте регистрации фактов) возникает преимущественно при проведении статистико-социологических исследований и решается в зависимости от цели исследования.

Время наблюдения представляет собой период времени, в течение которого должна быть начата и завершена работа по регистрации и проверке полученных данных. Время наблюдения выбирается на основе критерия минимальной пространственной мобильности изучаемого объекта. От времени наблюдения следует отличать критический момент, к которому приурочены собранные данные.

Понятие статистического наблюдения - довольно интересная тема для рассмотрения. Статистические наблюдения используются практически везде, где только можно обусловить их применение. Вместе с тем, несмотря на обширную область применения, статистические наблюдения являются довольно-таки сложным предметом и ошибки нередки. Однако в целом статистические наблюдения как предмет для рассмотрения представляют собой большой интерес.

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

МИНОБРНАУКИ РОССИИ

Федеральное государственное автономное образовательное
учреждение высшего профессионального образования
«Южный федеральный университет»

Кафедра «Информационно- измерительная техника и технология»

Специальность

230201 Информационные системы и технологии

РЕФЕРАТ

По предмету: «Организация исследований и разработок»

На тему: «Методы математического моделирования в статистике»

Выполнил студент: Строцев Василий Андреевич

Преподаватель: Гусенко Тамара Григорьевна

1. Элементы математической статистики

Математической статистикой называют раздел математики, посвященный математическим методам систематизации, обработки и использования статистических данных для научных и практических выводов. Статистические данные здесь понимаются как сведения о числе объектов в какой-либо более или менее обширной совокупности, обладающих теми или иными признаками.

Главная цель математической статистики - получение осмысленных, научно обоснованных выводов из подверженных случайному разбросу данных. При этом само изучаемое явление, генерирующее эти данные, чаще всего слишком сложно, чтобы можно было составить его полное описание, отражающее все детали. Поэтому статистические выводы делаются на основе некоторой математической вероятностной модели реального случайного явления, которая должна воспроизводить его существенные черты и исключать те, которые предполагаются несущественными. Методы математической статистики позволяют по наблюдениям над изучаемым явлением определить вероятностные характеристики случайных величин, участвующих в математической модели, описывающей это явление.

Задача математической статистики - установление закономерностей, которым подчинены массовые случайные явления, основано на изучении методами теории вероятностей статистических данных- результатов наблюдений. Статистические данные представляют собой данные, полученные в результате обследования большого числа объектов или явлений; следовательно, математическая статистика имеет дело с массовыми явлениями.

Первая задача математической статистики - указать способы сбора и группировки статистических сведений, полученных в результате наблюдений или в результате специально поставленных экспериментов.

Вторая задача математической статистики - разработать методы анализа статистических данных в зависимости от целей исследования.

Современная математическая статистика разрабатывает способы определения числа необходимых испытаний до начала исследования, в ходе исследования и решает многие другие задачи. Современную математическую статистику определяют как науку о принятии решений в условиях неопределенности.

Здача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов.

1.1 Генеральная и выборочная совокупность статистических данных

Пусть требуется изучить совокупность однородных объектов относительно некоторого качественного или количественного признака, характеризующего эти объекты.

Качественными признаками объект обладает либо не обладает. Они не поддаются непосредственному измерению (например, спортивная специализация, квалификация, национальность, территориальная принадлежность и т. п.).

Количественные признаки представляют собой результаты подсчета или измерения. В соответствии с этим они делятся на дискретные и непрерывные.

Иногда проводиться сплошное обследование, т.е. обследуют каждый из объектов совокупности относительно признака, которым интересуются. На практике сплошное обследование применяют сравнительно редко. Например, если совокупность содержит очень большое число объектов, то провести сплошное обследование физически невозможно. В таких случаях случайно отбирают из всей совокупности ограниченное число объектов и подвергают их изучению. Различают генеральную и выборочную совокупности.

Выборочной совокупностью (выборкой) называют совокупность случайно отобранных объектов.

Генеральной (основной) совокупностью называют совокупность, объектов из которых производится выборка.

Объемом совокупности (выборочной или генеральной) называют число объектов этой совокупности. Например, если из 1000 деталей отобрано для обследования 100 деталей, то объем генеральной совокупности N = 1000, а объем выборки n =100. Число объектов генеральной совокупности N значительно превосходит объем выборки n.

1.2 Способы выборки

При составлении выборки можно поступать двумя способами: после того как объект отобран и над ним произведено наблюдение, он может быть возвращен либо не возвращен в генеральную совокупность. В соответствии со сказанным выборки подразделяют на повторные и бесповторные.

Повторной называют выборку, при которой отобранный объект (перед отбором следующего) возвращается в генеральную совокупность.

Бесповторной называют выборку, при которой отобранный объект в генеральную совокупность не возвращается.

Для того чтобы по данным выборки можно было достаточно уверенно судить об интересующем признаке генеральной совокупности, необходимо, чтобы объекты выборки правильно его представляли (выборка должна правильно представлять пропорции генеральной совокупности) - выборка должна быть репрезентативной (представительной).

Выборка будет репрезентативной, если:

· каждый объект выборки отобран случайно из генеральной совокупности;

· все объекты имеют одинаковую вероятность попасть в выборку.

1.3 Способы группировки статистических данных

1.3.1 Дискретный вариационный ряд

Обычно полученные наблюдаемые данные представляют собой множество расположенных в беспорядке чисел. Просматривая это множество чисел, трудно выявить какую-либо закономерность их варьирования (изменения). Для изучения закономерностей варьирования значений случайной величины опытные данные подвергают обработке.

Пример 1. Проводились наблюдения над числом Х оценок полученных студентами ВУЗа на экзаменах. Наблюдения в течение часа дали следующие результаты: 3; 4; 3; 5; 4; 2; 2; 4; 4; 3; 5; 2; 4; 5; 4; 3; 4; 3; 3; 4; 4; 2; 2; 5; 5; 4; 5; 2; 3; 4; 4; 3; 4; 5; 2; 5; 5; 4; 3; 3; 4; 2; 4; 4; 5; 4; 3; 5; 3; 5; 4; 4; 5; 4; 4; 5; 4; 5; 5; 5. Здесь число Х является дискретной случайной величиной, а полученные о ней сведения представляют собой статистические (наблюдаемые) данные.

Расположив приведенные выше данные в порядке неубывания и сгруппировав их так, что в каждой отдельной группе значения случайной величины будут одинаковы, получают ранжированный ряд данных наблюдения.

В примере 1 имеем четыре группы со следующими значениями случайной величины: 2; 3; 4; 5. Значение случайной величины, соответствующее отдельной группе сгруппированного ряда наблюдаемых данных, называют вариантом, а изменение этого значения варьированием.

Варианты обозначают малыми буквами латинского алфавита с соответствующими порядковому номеру группы индексами - xi . Число, которое показывает, сколько раз встречается соответствующий вариант в ряде наблюдений называют частотой варианта и обозначают соответственно - ni .

Сумма всех частот ряда - объем выборки. Отношение частоты варианта к объему выборки ni / n = wi называют относительной частотой.

Статистическим распределением выборки называют перечень вариантов и соответствующих им частот или относительных частот (табл. 1, табл. 2).

Пример 2. Задано распределение частот выборки объема n = 20 :

Таблица 1

Контроль : 0,15 + 0,50 + 0, 35 = 1.

Статистическое распределение можно задать также в виде последовательности интервалов и соответствующих им частот (в качестве частоты, соответствующей интервалу, принимают сумму частот, попавших в этот интервал).

Дискретным вариационным рядом распределения называют ранжированную совокупность вариантов xi с соответствующими им частотами ni или относительными частотами wi .

Для рассмотренного выше примера 1 дискретный вариационный ряд имеет вид:

Таблица 3

Контроль : сумма всех частот вариационного ряда (сумма значений второй строки таблицы 3) есть объем выборки (в примере 1 n = 60 ); сумма относительных частот вариационного ряда должна быть равна 1 (сумма значений третьей строки таблицы 3)

1.3.2 Интервальный вариационный ряд

Если изучаемая случайная величина является непрерывной, то ранжирование и группировка наблюдаемых значений зачастую не позволяют выделить характерные черты варьирования ее значений. Это объясняется тем, что отдельные значения случайной величины могут как угодно мало отличаться друг от друга и поэтому в совокупности наблюдаемых данных одинаковые значения величины могут встречаться редко, а частоты вариантов мало отличаются друг от друга.

Нецелесообразно также построение дискретного ряда для дискретной случайной величины, число возможных значений которой велико. В подобных случаях следует строить интервальный вариационный ряд распределения.

Для построения такого ряда весь интервал варьирования наблюдаемых значений случайной величины разбивают на ряд частичных интервалов и подсчитывают частоту попадания значений величины в каждый частичный интервал.

Интервальным вариационным рядом называют упорядоченную совокупность интервалов варьирования значений случайной величины с соответствующими частотами или относительными частотами попаданий в каждый из них значений величины.

Для построения интервального ряда необходимо:

1. определить величину частичных интервалов;

2. определить ширину интервалов;

3. установить для каждого интервала его верхнюю и нижнюю границы;

4. сгруппировать результаты наблюдении.

1. Вопрос о выборе числа и ширины интервалов группировки приходится решать в каждом конкретном случае исходя из целей исследования, объема выборки и степени варьирования признака в выборке.

Приблизительно число интервалов k можно оценить исходя только из объема выборки n одним из следующих способов:

· по формуле Стержеса : k = 1 + 3,32·lg n ;

· с помощью таблицы 1.

Таблица 1

2. Обычно предпочтительны интервалы одинаковой ширины. Для определения ширины интервалов h вычисляют:

· размах варьирования R - значений выборки: R = xmax - xmin , где xmax и xmin - максимальная и минимальная варианты выборки;

· ширину каждого из интервалов h определяют по следующей формуле: h = R/k .

3. Нижняя граница первого интервала xh1 выбирается так, чтобы минимальная варианта выборки xmin попадала примерно в середину этого интервала: xh1 = xmin - 0,5·h .

Промежуточные интервалы получают прибавляя к концу предыдущего интервала длину частичного интервала h :

xhi = xhi-1 +h .

Построение шкалы интервалов на основе вычисления границ интервалов продолжается до тех пор, пока величина xhi удовлетворяет соотношению:

xhi < xmax + 0,5·h .

4. В соответствии со шкалой интервалов производится группирование значений признака - для каждого частичного интервала вычисляется сумма частот ni вариант, попавших в i -й интервал. При этом в интервал включают значения случайной величины, большие или равные нижней границе и меньшие верхней границы интервала.

1.4 Полигон и гистограмма

Для наглядности строят различные графики статистического распределения. По данным дискретного вариационного ряда строят полигон частот или относительных частот.

Полигоном частот называют ломанную, отрезки которой соединяют точки (x1 ; n1 ), (x2 ; n2 ),..., (xk ; nk ). Для построения полигона частот на оси абсцисс откладывают варианты xi , а на оси ординат - соответствующие им частоты ni . Точки (xi ; ni ) соединяют отрезками прямых и получают полигон частот (Рис. 1).

Полигоном относительных частот называют ломанную, отрезки которой соединяют точки (x1 ; W1 ), (x2 ; W2 ),..., (xk ; Wk ). Для построения полигона относительных частот на оси абсцисс откладывают варианты xi , а на оси ординат - соответствующие им относительные частоты Wi . Точки (xi ; Wi ) соединяют отрезками прямых и получают полигон относительных частот. В случае непрерывного признака целесообразно строить гистограмму.

Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиной h , а высоты равны отношению ni / h (плотность частоты).

Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии ni / h .

Площадь i hni / h = ni - сумме частот вариант i - го интервала; следовательно, площадь гистограммы частот равна сумме всех частот, т.е. объему выборки.

Гистограммой относительных частотназывают ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиной h , а высоты равны отношению Wi / h (плотность относительной частоты).

Для построения гистограммы относительных частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии Wi / h (Рис. 2).

Площадьi - го частичного прямоугольника равна hWi / h = Wi - относительной частоте вариант попавших в i - й интервал. Следовательно, площадь гистограммы относительных частот равна сумме всех относительных частот, т.е. единице.

1.5 Оценка параметров генеральной совокупности

Основными параметрами генеральной совокупности являются математическое ожидание (генеральная средняя) М(Х) и среднее квадратическое отклонение s . Это постоянные величины, которые можно оценить по выборочным данным. Оценка генерального параметра, выражаемая одним числом, называется точечной.

Точечной оценкой генеральной средней является выборочное среднее.

Выборочным средним называется среднее арифметическое значение признака выборочной совокупности.

Если все значения x1, x2,..., xn признака выборки различны (или если данные не сгруппированы), то:

x1, x2,..., xn n1, n2,..., nk , причем n1 + n2 +...+ nk = n (или если выборочное среднее вычисляется по вариационному ряду), то

В том случае, когда статистические данные представлены в виде интервального вариационного ряда, при вычислении выборочного среднего значениями вариант считают середины интервалов.

Выборочное среднее является основной характеристикой положения, показывает центр распределения совокупности, позволяет охарактеризовать исследуемую совокупность одним числом, проследить тенденцию развития, сравнить различные совокупности (выборочное среднее является той точкой, сумма отклонений наблюдений от которой равна 0).

Для оценки с тепени разброса (отклонения) какого-то показателя от его среднего значения, наряду с максимальным и минимальным значениями, используются понятия дисперсии и стандартного отклонения.

Дисперсия выборки или выборочная дисперсия (от английского variance) - это мера изменчивости переменной. Термин впервые введен Фишером в 1918 году.

Выборочной дисперсией Dв называют среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения.

Если все значения x1, x2,..., xn признака выборки объема n различны, то:

Если же все значения признака x1, x2,..., xn имеют соответственно частоты n1, n2,..., nk , причем n1 + n2 +...+ nk = n , то

Дисперсия меняется от нуля до бесконечности. Крайнее значение 0 означает отсутствие изменчивости, когда значения переменной постоянны.

Среднее квадратическое отклонение (стандартное отклонение), (от английского standard deviation) вычисляется как корень квадратный из дисперсии.

Чем выше дисперсия или стандартное отклонение, тем сильнее разбросаны значения переменной относительно среднего.

Непараметрическими характеристиками положения являются мода и медиана.

Модой Mo называется варианта, имеющая наибольшую частоту или относительную частоту.

Медианой Me называется варианта, которая делит вариационный ряд на две части, равные по числу вариант.

При нечетном числе вариант (n=2k+1)

Me = xk+1 ,

а при четном числе вариант (n=2k)

Me = (xk + xk+1)/2 .

2. Корреляционный и регрессионный анализ

2.1 Корреляционный анализ

математический статистический группировка корреляционный

Корреляционный анализ предусматривает установление статистической связи между случайными величинами. Он может быть использован в педагогических исследованиях для оценки влияния одних факторов на другие и установления связи между ними в совокупности с другими параметрами - математическими ожиданиями и среднеквадратическими отклонениями. Корреляционный анализ непосредственно не может быть применен к выявлению причинно-следственных связей между случайными процессами. Он только устанавливает связь статистических характеристик связанных случайных процессов.

Пусть имеется две случайные величины X и Y c математическими ожиданиями mx и my соответственно. Корреляционный момент

Kxy =M((X-mx)(Y-my))

будет характеризовать связь между величинами X и Y. Для удобства использования корреляционные моменты нормируют по формуле

где уx и уy - среднеквадратические отклонения величин X и Y. Величина Kk - называется коэффициентом корреляции величин X и Y.

Для дискретных случайных величин, с которыми мы имеем дело, оценка коэффициента корреляции вычисляется по формуле

Формула для вычисления коэффициента корреляции справедлива при условии, что связь между случайными величинами линейна и каждая из этих величин подчинена нормальному закону.

Оценить статистическую связь между уровнем школьной подготовки и успеваемостью студентов первого курса по дисциплине «Информатика» Школьная подготовка оценивается путем тестирования при поступлении в вуз (величина X). Успеваемость студентов оценивается по результатам экзамена после первого семестра (величина Y). Номер студента обозначен N.

Исходные данные для расчета сведены в таблицу

Подставив данные из таблицы в выражение (1), получаем Kk=0,78.

Видим, что статистические характеристики величин X и Y близки друг к другу.

2.2 Регрессионный анализ

Регрессионный анализ ставит перед собой задачу статистического исследования зависимости между зависимой переменной и независимой переменной (регрессором или предикатором). В простейшем случае предполагается, что эта зависимость является линейной. Решается задача построения линейной зависимости вида y=ax+b, где хi и yi независимая и зависимая переменный соответственно (i=1,2,3,…). Решение находится методом наименьших квадратов. Минимизируется величина

min находятся коэффициенты a и b.

Расчетные формулы имеют следующий вид:

По существу, совокупность экспериментально полученных точек приближенно заменяется аналитической зависимостью y=ax+b. Такая замена существенно упрощает математические преобразования и может быть использована при построении аналитических моделей. В общем случае для построения регрессионной зависимости может быть выбрана не только линейная, но и любая другая функция. Естественно, формулы вычисления искомых параметров усложняются.

3. Математические методы оптимизации экспериментов

3.1 Симплексный метод оптимизации

Симплексом называется правильный многогранник, имеющий п+1 вершину, где п - число факторов, влияющих на процесс. Так, например, если факторов два, то симплексом является правильный треугольник.

Рис. 1 Оптимизация по симплексному методу

Начальная серия опытов соответствует вершинам исходного симплекса (точки 1, 2 и 3). Условия этих первых опытов берутся из области значений факторов, соответствующих наиболее благоприятным из известных режимов оптимизируемого процесса. Сравнивая между собой результаты опытов в точках 1, 2 и 3, находят среди них самый «плохой», с точки зрения выбранного критерия оптимальности. Пусть, например, самым «неудачным» оказался опыт в точке 1. Этот опыт исключают из рассмотрения, а вместо него в состав симплекса вводят опыт в точке 4, которая симметрична точке 1 относительно противоположной стороны треугольника, соединяющей точки 2 и 3.

Далее сравнивают между собой результаты опытов в вершинах нового симплекса, отбрасывают самый «неудачный» из них и переносят соответствующую вершину симплекса в точку 5. Затем рассмотренная процедура повторяется в течение всего процесса оптимизации.

Если экстремум критерия оптимальности достигнут, то дальнейшее движение симплекса прекращается. Это значит, что новый шаг возвращает исследователя в предыдущую точку факторного пространства.

Если существует несколько экстремумов критерия оптимальности, то этот метод позволяет найти тот из них, который расположен ближе к точкам исходного симплекса. Поэтому, если есть подозрение о существовании нескольких экстремумов критерия оптимальности, нужно осуществить их поиск, каждый раз начиная оптимизацию из новой области факторного пространства. Затем следует сравнить между собой найденные оптимальные условия и из всех вариантов выбрать наилучший.

При оптимизации необходимо принимать во внимание ограничения, наложенные на влияющие факторы и функции отклика.

Важно отметить, что при пользовании симплексным методом не обязательно дублировать опыты. Дело в том, что ошибка в отдельном опыте может только несколько замедлить оптимизацию. Если же последующие опыты выполняются безупречно, то движение к оптимуму продолжается.

Матрица опытов исходного симплекса в кодированных переменных приведена в табл.11.

Величины, входящие в эту таблицу, рассчитываются по следующим формулам:

Здесь i--номер фактора в матрице планирования. Символом 0 обозначены координаты центра плана, т. е. основной уровень.

Таблица 11

Матрица исходного симплекса

Номер опыта

X 2

Функция отклика

K 2

K 2

Опыты, представленные в табл. 11, соответствуют вершинам симплекса, сторона которого равна единице, а центр совпадает с началом координат (в кодированных переменных).

Результаты расчетов, выполненных на основании табл. 11 и формул (*).приведены в табл. 12.

Таблица 12

Условия начальной серии опытов

Номер опыта

Очевидно, наибольшее количество опытов приходится ставить в начале эксперимента. Затем на каждом шаге оптимизации выполняется только один опыт.

Приступая к оптимизации, необходимо с помощью табл. 11 или 12 рассчитать матрицу исходной серии опытов в физических переменных, пользуясь формулой

В дальнейшем все операции производятся только с физическими1. переменными.

Условия каждого нового опыта рассчитываются по формуле:

где п-- число факторов в матрице планирования;

j -- номер опыта;

i--номер фактора;

Значение i-го фактора в самом «неудачном» опыте предыдущего симплекса.

Следует отметить, что на любом шаге оптимизации, осуществляемой симплексным методом, можно включить в программу исследований новый фактор, который до тех пор не принимался во внимание, но оставался на постоянном уровне.

При этом значения всех ранее рассматриваемых факторов рассчитываются по формуле:

где 1= 1, 2,..., п, то есть являются средними арифметическими значениями соответствующих координат предыдущего симплекса.

Значение вновь вводимого фактора определяется по формуле:

где x0(n+1)--основной уровень этого фактора;

Дxn+1--выбранный шаг варьирования для данного фактора;

Rn +1, kn +1 --величины, рассчитываемые по формулам (*).

Отметим, что добавление нового фактора в состав полного «факторного эксперимента сопровождается увеличением количества опытов вдвое. В этом смысле симплексный метод имеет очевидное преимущество.

Пример 3.2. Пусть требуется с помощью симплексного метода оптимизировать выход целевого продукта у (%), который получается при взаимодействии двух реагентов с концентрациями x1 и x2 () при температуре x3 (°С).

Выберем основные уровни и шаги варьирования факторов и сведем их в табл. 13.

Таблица 13

Значения уровней факторов и шагов варьирования

Основной уровень

Шаг варьирования

Пользуясь формулой (3.5) и табл. 12, рассчитаем условия проведения первых четырех опытов и полученные результаты сведем в табл. 14. Так, например, для третьего опыта

x31=1+0,1*0==1; x32== 1,50 +0,2 (--0,578) ==1,38; x33=60+5*0,204==61.

Таблица 14

Оптимизация симплексным методом

Номер опыта

Функция отклика

Сравнивая между собой результаты первых четырех опытов, видим, что самый низкий выход целевого продукта получился в третьем опыте. Этот опыт следует исключить из дальнейшего рассмотрения.

Заменим его опытом 5, условия проведения которого рассчитаем по формуле (**):

В новом симплексе, образованном опытами 1, 2, 4 и 5, самым «неудачным» является опыт 4. Его заменим опытом 6, условия которого найдем, пользуясь той же формулой (**).

Рассмотрим теперь вопрос о том, как включить в программу исследований еще один фактор, например скорость вращения мешалки. Пусть до этих пор она была постоянной и равной 500 об/мин. Теперь будем считать эту величину фактором x4 и примем для нее шаг варьирования Дx4==100 об/мин.

Предыдущий симплекс для трех факторов (см. табл. 14) состоит из опытов 1, 2, 5 и 6. Чтобы из него получить новый симплекс для четырех факторов, введем опыт 7 (табл. 15).

Таблица 15

Добавление нового фактора в программу оптимизации

Номер опыта

Функция отклика

Условия проведения 7-го опыта найдем по формулам (3.7) и (3.8):

Размещено на Allbest.ru

...

Подобные документы

    Математические методы систематизации и использования статистических данных для научных и практических выводов. Закон распределения дискретной случайной величины. Понятие генеральной совокупности. Задачи статистических наблюдений. Выборочное распределение.

    реферат , добавлен 10.12.2010

    Понятие математической статистики как науки о математических методах систематизации и использования статистических данных для научных и практических выводов. Точечные оценки параметров статистических распределений. Анализ вычисления средних величин.

    курсовая работа , добавлен 13.12.2014

    Математическая статистика как наука о математических методах систематизации статистических данных, ее показатели. Составление интегральных статистических распределений выборочной совокупности, построение гистограмм. Вычисление точечных оценок параметров.

    курсовая работа , добавлен 10.04.2011

    Первичный анализ и основные характеристики статистических данных. Точечные оценки параметров распределения. Доверительные интервалы для неизвестного математического ожидания и для среднего квадратического отклонения. Проверка статистических гипотез.

    дипломная работа , добавлен 18.01.2016

    Статистика – наука о массовых явлениях в природе и обществе; получение, обработка, анализ данных. Демографическая статистика, прогноз численности населения России. Методы обработки статистических данных: элементы логики, комбинаторики, теории вероятности.

    презентация , добавлен 19.12.2012

    Применение в статистике конкретных методов в зависимости от заданий. Методы массовых наблюдений, группировок, обобщающих показателей, динамических рядов, индексный метод. Корреляционный и дисперсный анализ. Расчет средних статистических величин.

    контрольная работа , добавлен 21.09.2009

    Получение статистических данных для обобщенной характеристики состояния и развития явления. Виды, способы и организационные формы статистического наблюдения. Статистический формуляр, сводка и группировка данных. Статистические таблицы и графики.

    реферат , добавлен 12.11.2009

    Определение математического ожидания и среднеквадратического отклонения с целью подбора закона распределения к выборке статистических данных об отказах элементов автомобиля. Нахождения числа событий в заданном интервале; расчет значения критерия Пирсона.

    контрольная работа , добавлен 01.04.2014

    Табличный метод представления данных правовой статистики. Абсолютные и обобщающие показатели. Относительные величины, их основные виды и применение. Среднее геометрическое, мода и медиана. Метод выборочного наблюдения. Классификация рядов динамики.

    контрольная работа , добавлен 29.03.2013

    Первичная обработка статистических данных по количеству зарегистрированных абонентских терминалов сотовой связи за 2008 год на 1000 населения в регионах России. Интервальное оценивание параметров. Гипотеза о виде распределения. Регрессионный анализ.

Математическая статистика – раздел прикладной математики, непосредственно примыкающий и основанный на теории вероятностей. Как и любая математическая теория, математическая статистика развивается в рамках некоторой модели, описывающей определенный круг реальных явлений. Чтобы определить статистическую модель и объяснить специфику задач математической статистики, напомним некоторые положения из теории вероятностей.

Математическая модель случайных явлений, изучаемых в теории вероятностей, основывается на понятии вероятностного пространства . При этом в каждой конкретной ситуации вероятность считается полностью известной числовой функцией на -алгебре , то есть для любого полностью определено число . Основной задачей теории вероятностей является разработка методов нахождения вероятностей различных сложных событий по известным вероятностям более простых (например, по известным законам распределения случайных величин определяются их числовые характеристики и законы распределения функций от случайных величин).

Однако на практике при изучении конкретного случайного эксперимента вероятность , как правило, неизвестна или известна частично. Можно только предположить, что истинная вероятность является элементом некоторого класса вероятностей (в худшем случае - класс всевозможных вероятностей, которые можно задать на ). Класс называют совокупностью допустимых для описания данного эксперимента вероятностей , а набор - статистической моделью эксперимента. В общем случае задачей математической статистики является уточнение вероятностной модели изучаемого случайного явления (то есть отыскание истинной или близкой к ней вероятности ), используя информацию, доставляемую наблюдаемыми исходами эксперимента, которые называют статистическими данными.

В классической математической статистике, изучением которой мы будем заниматься далее, имеют дело со случайными экспериментами, состоящими в проведении n повторных независимых наблюдений над некоторой случайной величиной , имеющей неизвестное распределение вероятностей, т.е. неизвестную функцию распределения . В этом случае множество всех возможных значений наблюдаемой случайной величины называют генеральной совокупностью , имеющей функцию распределения или распределенной согласно . Числа , являющиеся результатом независимых наблюдений над случайной величиной , называют выборкой из генеральной совокупности или выборочными (статистическими) данными. Число наблюдений называется объемом выборки.

Основная задача математической статистики состоит в том, как по выборке из генеральной совокупности, извлекая из нее максимум информации, сделать обоснованные выводы относительно неизвестных вероятностных характеристик наблюдаемой случайной величины .

Под статистической моделью, отвечающей повторным независимым наблюдениям над случайной величиной , естественно, вместо понимать набор , где - генеральная совокупность, - -алгебра борелевских подмножеств из , - класс допустимых функций распределения для данной случайной величины , которому принадлежит и истинная неизвестная функция распределения .

Часто тройку называют статистическим экспериментом.

Если функции распределения из заданы с точностью до значений некоторого параметра , то есть ( - параметрическое множество), то такая модель называется параметрической . Говорят, что в этом случае известен тип распределения наблюдаемой случайной величины, а неизвестен только параметр, от которого распределение зависит. Параметр может быть как скалярным, так и векторным.

Статистическая модель называется непрерывной или дискретной , если таковыми являются все составляющие класс функции распределения соответственно.

Пример 1 . Предположим, что распределение наблюдаемой случайной величины является гауссовским с известной дисперсией и неизвестным математическим ожиданием .

В этом случае статистическая модель является непрерывной и имеет вид:

Если и дисперсия неизвестна, то статистическая модель имеет вид:

а функция распределения имеет плотность вероятностей

Это, так называемая, общая нормальная модель, обозначаемая .

Пример 2 . Предположим, что распределение наблюдаемой случайной величины является пуассоновским с неизвестным параметром . В этом случае статистическая модель является дискретной и имеет вид: , случайными величинами (при этом говорят, что случайные величины - копии ), и который еще не принял конкретного значения в результате эксперимента. Переход от выборки конкретной к выборке случайной будет неоднократно использоваться далее при решении теоретических вопросов и задач для получения выводов, справедливых для любой выборки из генеральной совокупности.

Основные задачи, рассматриваемые в математической статистике, можно разбить на две большие группы:

1. Задачи, связанные с определением неизвестного закона распределения наблюдаемой случайной величины и параметров в него входящих (они рассматриваются в рамках статистической теории оценивания).

2. Задачи, связанные с проверкой гипотез относительно закона распределения наблюдаемой случайной величины (решаются в рамках теории проверки статистических гипотез).