Предсказать настроение человека, а тем более женщины, не простая задача. Существует множество методик, к примеру, принимающих во внимание физиологические аспекты, гормональный уровень или фазы луны.
Я же решил пойти своим путём опираясь на логику и статистику.
Прошу читателя не относится слишком серьёзно к данному труду, это исследование носит скорее развлекательный характер нежели научный. И всё же я буду признателен за плюс к карме за приложенные старания и уйму потраченного времени и нервов.
Почти за год мною был собран сет данных, основанный на ежедневных опросах моей спутницы (далее "исследуемый объект" или ИО) по двадцати трём пунктам, как я предположил, способным наиболее выражено повлиять на настроение ИО.
Исследуемый объект. 1. ФИО: данные скрыты; 2. Пол: женский; 3. Возраст: 27 лет; 4. Место проживания: Россия, г. Москва; 5. Профессия: IT разработчик; 6. Место работы: данные скрыты;
Задача
Исходя из статистически значимых признаков определить наиболее важные - влияющие на настроение исследуемого объекта.
В первой части статьи я визуализирую в некой степени очевидные, а зачастую, как оказалось, совершенно неочевидные закономерности, полученные мною в ходе анализа собранных данных. На основе полученных выводов, исследуемому объекту будут выданы рекомендации для прохождения тестового месяца, во время которого я продолжу собирать данные по заявленным ранее 23 фичам.
Во второй части статьи я сравню итоговый показатель настроения в тестовом месяце с аналогичным показателем за прошедший год, а также обучу простенькую модель предсказания на имеющихся тренировочных данных. Качество модели буду проверять данных тестового месяца.
Данные
Признаюсь, мне пришлось вручную заполнить около 10% данных, опираясь на среднемесячные показатели, а в каких-то случаях на логику или память... Не так просто в течении года придерживаться графику ежевечернего заполнения таблицы двум работающим людям, с присущими, как и всем людям, бытовым обязанностям и сложностям.
В список фичей намеренно не попадали такие данные, на которые невозможно повлиять, например курс валюты или количество осадков. В процессе анализа я осознал, что это было ошибкой, ведь если скорректировать свои привычки, скажем в дождливый день, это может весомо повлиять на результат, на настроение.
Так же в сете присутствуют существенные выбросы, что затрудняло интерпретацию результатов, такие как праздники, отпуск или начало боевых действий на Украине.
sense |
sleep_inter |
sleep_time |
phy_cond |
tot_work_time |
work_h_o |
line_code |
cook_food |
cont_time |
cont_platform |
serial_time |
ind_learn_time |
course_time |
cardio_time |
stretch_time |
numb_steps |
numb_meals |
meat |
vegetable |
fruit |
milk |
dessert |
alcohol |
4 |
01_09 |
8 |
5 |
40 |
1 |
130 |
1 |
120 |
y_tube |
135 |
0 |
0 |
30 |
0 |
1040 |
3 |
pork&chiken |
1 |
1 |
0 |
0 |
0 |
Фичи я решил поделить по шести секторам
Физическое состояние
Интервалы сна (sleep_inter). Номинативная переменная
Время сна (sleep_time). Количественная переменная
Общее физическое состояние (phy_cond). Номинативная переменная
Рабочая активность
Общее время работы в минутах (tot_work_time). Количественная переменная
Работа дома/ Работа в офисе (work_h_o). Номинативная переменная
Кол-во строк кода (line_code). Количественная переменная. Как выяснилось фича ни на что не влияет от слова совсем
Готовка еды (cook_food). Номинативная переменная
Еда
Кол-во приёмов пищи (numb_meals). Номинативная переменная
Какое мясо употреблялось в пищу (meat). Номинативная переменная
Отдельно пять номинативных фич - овощи, фрукты, молоко, сладкое, алкоголь
Просмотр контента
Общее время просмотра контента (cont_time). Количественная переменная
Площадка и площадки просмотра контента (cont_platform). Номинативная переменная
Время просмотра сериала/фильма (serial_time). Количественная переменная
Спорт
Кардио тренировка в минутах (cardio_time). Количественная переменная
Растяжка тренировка в минутах (stretch_time). Количественная переменная
Кол-во пройденных шагов за день (numb_steps). Количественная переменная
Самообразование
Самостоятельное образование в минутах (ind_learn_time). Количественная переменная
Образование на курсах в минутах (course_time). Количественная переменная
Анализ
Итак! Всё готово, и я предлагаю безотлагательно приступать. Загодя попрошу прощения за весьма внушительный лонгрид - я правда старался излагать информацию компактно и всячески подкреплять понятными визуальными образами.
Первым делом, взглянув на тепловую карту корреляции переменных между собой, я выделил сектора максимально связанные с целевой переменной настроения (sense). Ожидаемо оными оказались разделы отвечающие за физическое состояние и рабочую активность. Они и станут основными якорями для дальнейшего выявления взаимосвязей.
matrix = np.triu(all_feat_for_corr.corr())
sns.set_style("white")
sns.heatmap(all_feat_for_corr.corr(), annot=True, mask=matrix, fmt='.1g', vmin=-1, vmax=1,
center=0, cmap='bwr', cbar=False).get_figure().savefig('all_feat.png')
Общее физическое состояние и интервалы сна показывают максимальную корреляцию. Весомо выделяется положительная количество рабочего времени к настроению. Хорошее настроение при плодотворной работе может быть, как причиной, так и следствием, или первым и вторым одновременно.
Рассмотрим какие интервалы сна наиболее благоприятны исходя из настроения и физического состояния.
На обоих графиках лидируют интервалы начинающиеся с часа ночи (01:00-00:08, 01:00-00:09, 01:00-00:10). Восемь часов сна в среднем с часа ночи запомним как оптимальный период сна.
Логично предположить, что в выходные можно позволить себе поспать немногим больше. Проверим эту теорию, построив графики для будних и выходных (вместе с праздничными) днями.
И да, ожидаемо, в будни это интервалы 01:00-00:08 и 01:00-00:09, а по выходным лучше спать 9 часов с часу до десяти.
sns.set(rc={'figure.figsize':(20,5)})
sns.set_style("white")
sns.set_context("paper", font_scale=2)
colors = ['#7FFFD4', '#6890F0', '#78C850','#F8D030', '#F08030']
gr = sns.countplot(x="sleep_inter", hue="sense", data=sentiment_df, palette=colors)
plt.title('Optimal sleep interval (Sense)', fontsize=24)
plt.xlabel('Sleep interval', fontsize=18)
plt.ylabel('Count', fontsize=18)
gr.legend(bbox_to_anchor= (1.2,1), fontsize='18');
Я счёл необходимым подробней рассмотреть взаимосвязь настроения и показателя рабочего времени в минутах. Успешней всего с этим справятся боксплоты. Медианные показатели фиксируют интервал работы 400-420 минут (то есть около 7 часов работы фултайм) при хорошем настроение (4 и 5 балов).
Та же динамика наблюдается и при сравнении с физическим состоянием (не стал визуализировать материал в статье - экономлю Ваше время). Ниже тоже распределение в зависимости от локации - дом или офис (голубые боксы - офис, оранжевые - дом). Результат неоднозначный. В дни с хорошем настроением (4 и 5 балов) ИО меньше работала дома нежели в офисе, а значит дела шли быстрей, а значит зачем "платить" больше при том же результате.
sns.set(rc={'figure.figsize':(5,5)})
colors = ['#7FFFD4', '#F08030']
sns.boxplot(x="sense", y="tot_work_time", hue='work_h_o', data=work_sense_df,
palette=colors);
sns.stripplot(x="sense", y="tot_work_time", data=work_sense_df,
size=2, color=".1", linewidth=0)
plt.title('Dependence of mood on\n work time (home or office)', fontsize=22)
plt.xlabel("Sense", fontsize=18)
plt.ylabel('Total work time, min', fontsize=18);
Изучим эту гипотезу подробней. Возможно, дело в готовке пищи? Ведь если работаешь дома -> освобождается время на проезд, и, следовательно, почему бы не приготовить самому себе пищу. Многим это приносит удовольствие, в частности и нашему объекту (инсайд от автора). И это подтверждают таблицы ниже.
Слева. Распределение кол-ва дней с приготовлением пищи в зависимости от локации работы с указанием среднего показателя времени работы в минутах без учёта настроения. Справа. Тоже самое, только в дни с хорошим настроением.
Предварительный вывод - лучше работать дома, при этом готовить ;)
Наиболее интересный сектор для анализа - сектор еды. Предварительно посмотрим на корреляцию с настроением каждой переменной.
Ожидаемо фрукты и овощи положительно влияют на целевую переменную, а вот отношение с молочными продуктами, лично для меня, стало неожиданностью.
Прежде рассмотрим отдельно употребляемые продукты в рабочие и не рабочие дни в зависимости от настроения (левая и правая таблицы соответственно).
work_day_eat_df = sentiment_df.drop(index=[92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105,
152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 206, 218, 219, 274, 275, 281, 282])
work_day = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday']
work_day_eat_df = work_day_eat_df.loc[work_day_eat_df['day_week'].isin(work_day)]
best_eat_wd_df= work_day_eat_df.groupby(['sense'], as_index=False).agg(
{'vegetable': 'sum', 'fruit': 'sum', 'milk': 'sum', 'dessert': 'sum', 'alcohol': 'sum'})
rest_day_eatt_df = sentiment_df[~sentiment_df.index.isin(work_day_eat_df.index)]
best_eat_rd_df= rest_day_eatt_df.groupby(['sense'], as_index=False).agg(
{'vegetable': 'sum', 'fruit': 'sum', 'milk': 'sum', 'dessert': 'sum', 'alcohol': 'sum'})
Употребление молочных продуктов именно в рабочие дни наихудшем образом сказывается на настроение, по выходным же дням распределение близко к нормальному. Фрукты, овощи и сладкое одинаково полезно для настроения в любой день, кто бы сомневался. А вот алкоголь всё же следует употреблять только по выходным, даже без учёта последствий на следующий рабочий день.
Изучим такой немаловажный фактор, как количество приёмов пищи. Построим график распределения приёмов относительно физического состояния, которое напрямую связано с настроением.
С большим отрывом лидирует показатель в три приёма пищи за день. Факт в какой-то степени очевидный, но также требующий доказательств.
В процессе анализа я наткнулся на связь между кол-вом приёмов пищи и средним показателем пройденных за день шагов (таблица ниже).
Занимательно наблюдать как пройденное расстояние влияет на аппетит. А "переедание" (4 приёма пищи) напротив свидетельствует о снижение физической активности.
best_eat_for_step_df= sentiment_df.groupby(['numb_meals'], as_index=False).agg({'numb_steps': 'mean'}).round(0)
Самое вкусное напоследок. Выбор мяса, как основу составляющую рацион большинства людей, следует рассмотреть детально.
В целом динамика ясна. В таблице ниже приведены соотношения видов мяса со средними значениями большинства значимых фич. Курица+свинина (pork&chiken) и курица+свинина+говядина с отрывом лидируют в пользе для физического состояния и настроения. Такую тенденцию можно отметить и в соотношение с кол-вом пройденных шагов(numb_steps). Употребление же рыбы (pork&fish, fish) приводит к обратному эффекту.
Наученный опытом, я решил изучить закономерности в выборе мяса раздельно, в рабочие и не рабочие дни. В таблице "А" демонстрируется зависимость употребления мясо к среднему показателю рабочего времени в дни приёма, следовательно влияние оного на трудоспособность. И картина представляется уже не столь однозначной. Курица с рыбой (chiken&fish) показывает тождественные результаты с бывшими лидерами. А если взглянуть на туже таблицу, но в дни с хорошем настроением (табл. "Б"), употребление говядины в пищу (beef) демонстрирует существенную пользу. В выходные дни (таблица "В") в рацион рекомендуется добавлять связку рыба+говядина (fish&beef) и свинина+курица+рыба (pork&chiken&fish).
work_meat_notsense_df = work_meat_df.groupby(['meat'], as_index=False).agg({'tot_work_time': 'mean'}).round(0)
work_meat_sense_df = work_meat_df.groupby(['sense', 'meat'], as_index=False).agg({'tot_work_time': 'mean'}).round(0)
work_meat_sense_df = work_meat_sense_df.loc[work_meat_sense_df['sense'] > 3]
work_meat_sense_df = work_meat_sense_df.groupby('meat', as_index=False).agg({'tot_work_time': 'mean'}).round(0)
rest_meat_sense_df = sentiment_df[~sentiment_df.index.isin(work_meat_df.index)]
rest_meat_sense_df = rest_meat_sense_df.groupby(['meat'], as_index=False).agg({'sense': 'mean'}).round(2)
Переходим к исследованию сектора просмотра контента.
Явную связь демонстрируют признаки времени просмотра контента (cont_time) и площадки просмотра (cont_platform), что подталкивает к идее нахождения оптимальной связки в этом признаке.
Выведем таблицу с указанием максимального времени для площадок, с указанием настроения (табл. "А"). В хорошем настроение исследуемый объект чаще уделяет внимание инстаграму или всем площадкам вместе. Ваш покорный слуга предположил, что ситуация может существенно изменится в зависимости от рабочего графика ИО и не ошибся. В таблице "Б" указано тоже распределение в рабочие дни, а таблице "В" в выходные и праздничные.
Исходя из предоставленного анализа, берусь заключить что в рабочие дни ИО следует забыть про ютуб (возможно из-за длины роликов длинные сюжеты негативно сказываются на концентрации) и уделить внимание инстаграму и возможно тик-ток. По выходным же дням преимущественно влияет на хорошее настроение просмотр ютуба, либо иных площадок.
Уместно будет определить оптимальное время просмотра контента и сериалов. В данном исследование, считаю, целесообразно отталкиваться от показателей времени работы и настроения в определённый день.
Следуя, графикам, представленным ниже (слева - контент, справа - сериалы), можно заключить, что по рабочим дням (при оптимальном времени работы - 7 часов и хорошем настроение) просматривать контент площадки следует не более часа, а наилучшее время для просмотра фильма или сериала варьируется в интервале 60-90 минут - один фильм или две серии :)
work_cont_df = work_day_cont_df.loc[work_day_cont_df['cont_time'] != 0]
sns.set_style("white")
sns.set_context("paper", font_scale=1.5)
colors = ['#7FFFD4', '#6890F0', '#78C850','#F8D030', '#F08030']
best_cont_time = sns.displot(work_cont_df, x="cont_time", y='tot_work_time',
hue="sense", kind="kde", fill=True, palette=colors);
plt.title('Viewing time of the content\ndepending on working hours', fontsize=20)
plt.xlabel('Viewing time, min', fontsize=16)
plt.ylabel('Working time, min', fontsize=16)
gr.legend(bbox_to_anchor= (1.2,1), fontsize='16');
А каким образом на интервалы сна может влиять просмотр сериалов накануне. Построим таблицу для дней с хорошим настроением.
Всё же для лучших интервалов сна в рабочие дни (01:00-00:08 и 01:00-00:09) будет лучше ограничиться одной серией или коротким фильмом. В выходные дни (благоприятный интервал сна 01:00-00:10) возможно позволить себе больше. *Таблицу распечатать и наклеить на ноут бук.
sleep_inter = serial_work_df.sleep_inter.values.tolist()
sleep_inter = sleep_inter[1:]
sense = serial_work_df.sense.values.tolist()
sense = sense[1:]
serial_time = serial_work_df.serial_time.values.tolist()
serial_time = serial_time[0:204]
serial_df = pd.DataFrame({'sleep_inter': sleep_inter, 'serial_time': serial_time, 'sense': sense,
serial_df = serial_df.loc[serial_df['serial_time'] != 0]
serial_df = serial_df.loc[serial_df['sense'] > 3]
serial_df = serial_df.groupby('sleep_inter', as_index=False).agg({'serial_time': 'mean'}).round(0)
Определённо значимый сектор спорта если не для целевой переменной настроения, то для физического состояния определённо.
Рассматривая тепловую карту, на фоне остальных выделяется фича кол-ва шагов в день (numb_steps). Тем не менее далее я представлю результат анализа не очевидных связей в этом секторе.
Сначала разберёмся с шагами. На боксе ниже довольно чётко выражена связь пройденных шагов с интервалами сна. Определённые ранее, оптимальные интервалы в среднем показывают большее кол-во пройденных шагов за день, которые в свою очередь неплохо коррелируют с настроением и физическим состоянием. Всё сходится, лучше спишь -> больше ходишь -> лучше общее состояние и настроение.
А какое оптимальное кол-во шагов нужно пройти за день исходя из интервала сна? Зная это, в теории :)) возможно повлиять на своё настроение! Ответ в таблице ниже...
** Таблицу распечатываем и крепим к входной двери квартиры (с внутренней стороны).
best_sleep_interval = sentiment_df.groupby(['sense', 'sleep_inter'], as_index=False).agg({'numb_steps': 'mean'}).round(0)
best_sleep_interval = best_sleep_interval.loc[best_sleep_interval['sense'] == 5]
best_sleep_interval = best_sleep_interval.drop('sense', axis=1)
Не менее интересную закономерность я вывел, построив таблицу зависимости кардио тренировки (cardio_time) с интервалами сна. Средние показатели тренировки максимальны перед благоприятными интервалами сна. Больше бегаешь -> лучше спишь. Выходит, для хорошего сна требуется пробежать не менее 50 минут...
По аналогии работы с фичёй кол-ва шагов, построим таблицу для кардио тренировки и узнаем сколько полезно бегать после определённого сна.
*** Таблицу распечатываем и кидаем в спортивную сумку
Растяжка в тренировочном процессе ИО длится всегда одинаковое количество времени - 45 минут. В связи с этим я решил, проанализировать сколько занятий растяжкой в неделю будут благоприятно сказываться на средних значениях статистически значимых для настроения признаков.
В приведённой ниже таблице, со значительным перевесом побеждает одна тренировка в неделю, хорошая новость для ИО :))
stretch_time_df = sentiment_df.drop(index=[0, 316, 317, 318])
df_stretch_for_week = pd.DataFrame()
while stretch_time_df.shape[0] > 0:
week_df = stretch_time_df[:7]
stretch_time_df = stretch_time_df[7:]
new_frame_dict = {'sense': week_df["sense"].mean(), 'phy_cond': week_df["phy_cond"].mean(),
'sleep_time': week_df["sleep_time"].mean(), 'numb_meals': week_df["numb_meals"].mean(),
'stretch_time': week_df["stretch_time"].sum()//45}
temp_df = pd.DataFrame(new_frame_dict, index=[0])
df_stretch_for_week = pd.concat([df_stretch_for_week, temp_df], axis=0)
df_stretch_for_week = df_stretch_for_week.groupby('stretch_time', as_index=False).agg(
{'sense': 'mean', 'phy_cond': 'mean', 'sleep_time': 'mean', 'numb_meals': 'mean', }).round(2)
Наконец крайний по счёту, но не по важности сектор саморазвития исследуемого объекта. Основная задача в том, чтобы исходя из статистики определить, как и сколько правильней заниматься самообразованием. Принципиальный триггер для образования — это время, в частности время рабочего дня.
Ниже представлены графики корреляции времени, потраченного на образование, ко времени рабочего дня. Слева демонстрируется данные для самообразования, справа для организованного образования на курсах соответственно.
На реальных данных довольно редко можно увидеть такую прямую как на виде слева, но это случилось! Время, потраченное на самообразование близко к 1 коррелирует с рабочем временем. На тепловой карте подобного не наблюдалось, так как изымалась статистика по всем дням, включая выходные и праздники. Исходя из предположения, что возрастание времени работы положительно сказывается на настроение, можно смело заключить, что самообразование положительно влияет на настроение. Больше учишься -> лучше настроение...
И, напротив, динамика обучения на курсах совершенно не соотносится со временем работы (вид справа). Можно ли из данного исследования заключить, что обучение на курсах негативно влияет на настроение? Очень сомневаюсь…
По итогу вышеупомянутого исследования, считаю необходимым определить оптимальное время для обучения, так же опираясь на время работы и показатели настроения в эти дни. Ниже представлены графики для обоих видов обучения соответственно. Немногим более часа требуется уделять самообразованию в обоих случаях в рабочие дни.
Итог
В ходе анализа скромного объёма данных, я попытался найти наиболее благоприятные значения для каждого имеющегося признака. На момент написания статьи ИО проводит тестовый месяц, стараясь следовать моим рекомендациям :) и уже совсем скоро, во второй части статьи я напишу о достигнутых результатах.
Спасибо за внимание!
Комментарии (34)
yurikmellon
24.06.2022 13:33+10Карма ниже некуда, терять мне нечего...
Всё не читал, но цель то исследования какая? Определить "даст" вечером или "не даст"?
databorodata Автор
24.06.2022 13:44+4Цель понять что и в какой степени влияет на её настроение.. и вообще понять возможно ли это понять исходя из того набора данных которые собрал) поверь, даже это было не просто))
Щас думаю что для объективности месяц теста мало. Тем более не исключён фактор субъективной оценки
yurikmellon
24.06.2022 13:58т.е. цель это исследование ради исследования? Ну вот понял ты ЧТО именно влияет на настроение ИО. Дальше то что? Наверное, всё таки, эти данные нужно как то интерпретировать и использовать. Например, если интегральный показатель, условно равен 9 из 10, то вечером на ужин утка по пекински, а если 2 из 10, то пельмени магазинные.
databorodata Автор
24.06.2022 14:19+2Ну да, всё так. Собственно это заявлено и в задаче исследования и подобные выводы делаются на протяжение всей статьи.
Так то я проделал много анализа над этим сетом, в статью попало самое интересное. Возможно если дольше посидеть, можно ещё что интересное найти.
butsan
24.06.2022 16:19+8Вообще-то: «Счастлива женщина - счастлива вся семья».
0xd34df00d
24.06.2022 18:48+11С другой стороны, нет женщины — нет проблем.
vassabi
24.06.2022 19:28-2но это ж скучно. И с внуками потом фигня.
Вот вы - сколько труда в жизни переделано, а кому результат в итоге?
0xd34df00d
24.06.2022 20:48+8Ну скука — это дело такое, её легко развеять.
Вот вы — сколько труда в жизни переделано, а кому результат в итоге?
Гитхабу. А, впрочем, какая в итоге разница?
Medeyko
25.06.2022 12:56+3Мирозданию.
Чем внуки таким уж очень особенным отличаются, чтобы какая-то особая польза была от того, чтобы им чего-го отдать?
Основанная на естественном отборе генов эволюция очень медленная, за сотню лет ничего особенного произойти не может.
Даже искусственный-то отбор за этот срок дал бы не слишком впечатляющие результаты. (Вон, в ИЦиГ СО РАН лисиц ускоренно искусственным отбором отбирали, изменения достаточно ограниченные, при том, что у лисиц репродуктивный цикл в пару десятков раз короче, чем у человека, и отбор был куда более жёстким)
Поэтому, если не произойдёт какого-то катаклизма с обрушением цивилизации в каменный век, в ближайшую сотню лет влияние естественней эволюции человека заведомо станет пренебрежимо малым на фоне искусственного влияния на его гены. Так что строить свою жизнь, исходя из естественного отбора не стоит.
Но если уж очень хочется остаться на парадигме естественного отбора, можно отдать всё нажитое непосильным трудом братьям/сёстрам (у которых больше ваших генов, чем у ваших внуков), на худой конец - прочим кровным родственникам; в таком случае ваше влияние на генофонд человечества по сравнению с отдачей всего внукам не изменится.
Если хочется внести кардинально больший вклад в генофонд человечества, то самый простой и эффективный способ - стать донором спермы.
Если хочется воспитать ребёнка, можно его усыновить. Выбрав предварительно ребёнка с нужными параметрами, а не доверившись игре случая.
А так, воспитываемые вами собственные биологические дети и внуки - это хорошо, в них есть своя прелесть. Но незаменимыми они не являются ни по какому параметру.
(Если говорить о полном наборе факторов в комплексе, то опять же, не видно признаков эмерджентности, то есть нужные факторы можно усиливать независимо, нет причин всё реализовывать через внуков.)
KIA3167
24.06.2022 14:24+2А почему выводы в тексте исследования? Так-то грамотно изложено, объект исследования своеобразный. Все считают этих объектов каким-то полифакторными, сложно исследуемыми, а тут прекрасно раскладывается в двух измерениях по каждому рассмотренному фактору.
Спасибо. Работу необходимо продолжить
databorodata Автор
24.06.2022 14:25Спасибо за поддержку. Не совсем понял вопрос про вывод в тексте исследования.
Где он должен быть?
epic_raccoon
24.06.2022 15:17+1Думаю по ходу статьи можно делать какие-то короткие промежуточные выводы по описываемым в данный момент показателям, а в конце сделать полную сводку полученной информации.
Мне кажется, так было бы удобнее увидеть итоговую картину в целом
databorodata Автор
24.06.2022 15:20Согласен, думал об этом - но решил сделать компактней и живей, статья и так крупноватая вышла, не каждый дочитает до конца. Я решил выделять выводы жирным шрифтом.
Вторую часть начну с резюме выводов полученных в первой части
Tutanhomon
26.06.2022 13:59+2до конца все дочитают, как раз чтобы увидеть основные выводы, пропустив промежуточные :)
Vladusik2
24.06.2022 17:25+7Попробуйте расширить аудиторию, а то маленькая выборка) Еще изучите влияние дней цикла на поведение, может придется учитывать.
databorodata Автор
24.06.2022 18:14+1На публикацию изучения дней цикла я разрешения не получил)
Конечно же это сильно влияет
vassabi
24.06.2022 18:17+1понятно, что на публикацию - нет
но они же учитывались ?
databorodata Автор
24.06.2022 18:56+2да, но я не могу публиковать. следовательно и опираться на результаты после тестового месяца если буду использовать эти умозаключения.
serhit
27.06.2022 09:02+1На самом деле, действительно, "настроение" - это показатель, у которого должна быть "сезонность": недельный (выходные - работа), месячные, готовые (день рождения, Новый год, лето-зима).
Понятно, что данные за год не позволяют смотреть на годовую сезонность - но недельную и месячную наверное надо учитывать.databorodata Автор
27.06.2022 09:46Спасибо за замечание, я думал об этом. В моём случае был набор данных за 319 дней
с 1 августа 21года по 15 июня 22го. Набор и так маленький. Если, скажем, рассматривать отдельно зиму, то это выйдет 90 дней, а если ещё убрать выходные и праздники - так совсем маленькая выборка выйдет. Я же ограничился только выделением рабочих и не рабочих дней. Было бы у меня 3 года хотя бы наблюдений - думаю, я бы поступил как вы говорите.
Конечно было бы интересно рассмотреть статистику исходя из менструальных циклов.. Но увы) на такое ИО разрешения не дал..
События на Украине был прям существенным выбросом - на недели 3.. Но это жизнь и нельзя просто взять и выкинуть 3 недели из данных
Neom1an
24.06.2022 18:12+9Состояние и настроение женщины очень сильно зависит от уровней гормонов, которые изменяются циклично. Это, возможно, фактор, который перевешивает все 23 указанных здесь в одну калитку. Таким образом, статья как развлечение - ок, валидность полученных результатов - под большим вопросом. Как пример сомнительного выбора критериев оценки без понимания сути вопроса- идеально.
databorodata Автор
24.06.2022 19:00согласен, и в начале изложения материала об этом сказал. для серьёзной научной работы думаю нужно использовать совершенно другие фичи.
но всё же я верю что даже эти 23 фичи способны в какой-то степени повлиять
Neom1an
24.06.2022 21:52+3Любуясь тенью Фудзи на снегу в лучах восходящего солнца не следует забывать о вкладе улитки, сидящей на склоне, в совершенство контура
vassabi
24.06.2022 18:18+4Возраст: 27 лет;
Профессия: IT разработчик;
ага, теперь понятно почему изучателя еще не выставили "на коврик" :)
Krasnoarmeec
24.06.2022 22:14+6А Вы смелый человек. Ставить эксперименты на жене это не для слабых духом.
Моя жена, например, хорошо стреляет. Тут даже бежать бесполезно.
databorodata Автор
24.06.2022 22:49+3ну она то в общем идею поддержала. только довольно сложно было проводить опрос в дни с отметкой 1 или 2 в настроение) Тем более это же в целом анонимно
anna_ovzyak
24.06.2022 23:38+3Статья повеселила, вы прям подошли серьезно. Следующий этап, когда добавится ребёнок, можете предугадывать кому укладывать спать вам или жена в добродушном настроении ????
Да и с ребёнком легко поднять настроение, надо просто предложить погулять и оставить жену дома одну на пару часов.
R7R
25.06.2022 16:09+5Я женат уже 37,5 лет.
Читать мысли жены научился давно (что взаимно :)
А вот предсказать ее настроение все еще могу с большим трудом :)
Прим. У меня еще и дочка есть :)databorodata Автор
26.06.2022 10:16Начинайте собирать свой дата сет))
R7R
26.06.2022 14:39+1Начинайте собирать свой дата сет))
Поздно уже… начинать надо было тогда, когда с нами жила еще и теща :)
butsan
Вообще-то: «Счастлива женщина - счастлива вся семья».