Однажды студент рассказал как сдал зачет по программному продукту, а на следующем курсе не сумел его использовать. Рассказал и пожал плечами. А я запомнил, что цель любого курса – решение собственных задач после курса. По вёснам веду статистику у медиков и придумал шаблоны для обработки собственных данных методами из национальных стандартов. Делюсь результатом.

На примере значений роста и веса 5000 мужчин и 5000 женщин в MS Excel и Jupiter Lab построены гистограммы и ящики с усами, рассчитаны среднее, дисперсия, стандартное отклонение, дана интервальная оценка генеральной средней и оценка вероятности попадания в заданных интервал. В MS Exsel дополнительно рассчитан коэффициент корреляции и оценена его значимость. На основе произвольной задачи из учебника добавлен дисперсионный анализ ANOVA.

Команды и формулы подробно прокомментированы. Не зная инструментария Excel и Python, и не залезая в справочники, можно заменить данные, изменить форму отчета и дизайн графиков.

Методы, термины и определения в учебниках по статистике различаются, поэтому по возможности использованы термины и методы из ГОСТ Р 50779.10-2000 "Статистические методы. Вероятность и основы статистики. Термины и определения", ГОСТ Р ИСО 3534-1-2019 "Статистические методы. Словарь и условные обозначения. Часть 1. Общие статистические термины и термины, используемые в теории вероятностей", и ГОСТ Р 50779.21-2004 "Статистические методы. Правила определения и методы расчета статистических характеристик по выборочным данным".

Скачать все можно здесь

Текущая версия шаблона в MS Excel "20210608 mystat.xlsx". Шаблон JupiterLab "20210401-7_mystat.ipynb" запускается по инструкции в файле "Что делать.txt".

Шаблоны сделаны не для студентов, а совместно со студентами во время семестра. И эти шаблоны – процесс, а не результат. В следующем семестре процесс продолжится. Если найдете неточность или не найдете нужного вам метода сообщайте, дорабатывайте, присылайте. Обновлю версию и вставлю ваше имя или ник в поле «Участники разработки».

Если вы хотите доработать шаблон и выложить его где-то еще, предлагаю добавить себя в список авторов, сославшись на авторов предыдущей версии.

Комментарии (6)


  1. Elpi
    05.01.2022 14:09
    +3

    Понравился деловой и товарищеский подход. Вы предоставляете готовый инструментарий. Спасибо.

    Маленькая "придирка" по графику в ПВУ (корреляция роста и веса). Оранжевая кривая справа выходит далеко за эксперимент - там максимум 200, а кривая до 220. Не думаю, что это корректно.


    1. iva2000 Автор
      05.01.2022 14:33
      +1

      Прогноз, сэр...


      1. Elpi
        05.01.2022 16:35

        Что, все так плохо? :)


        1. iva2000 Автор
          06.01.2022 15:29

          Ок, уменьшил прогноз с 20 до 5 единиц.


  1. max1gu
    06.01.2022 12:21

    Там где тренды нарисованы, очень желательно вы водить кроме формулы тренда ещё и R^2, чтобы понимать. на сколько качественно тренд соответствует данным. И тогда была в числе видна разница между линейным (0,7447) и степенным (0,7435) трендом - линейный лучше.


    1. iva2000 Автор
      06.01.2022 13:55

      Спасибо, добавил R^2 на графики

      В комментарии указал "Визуально видно, что кубическая лучше аппроксимирует данные, но величина коэффициент детерминации (он же R-квадрат, он же R^2) для линейной несколько выше. Поэтому следует считать остановиться на выводе о линейной зависимости веса от роста."

      Также на титульном листе указал "Внесены дополнения по замечаниям: Elpi, max1gu".