Прототип простого сервиса для здорового питания +2
В контексте статьи картинка обретает двойной смысл.
Дисклеймер
В обществе в принципе много "наносного" касательно "правильной" еды, "диет", "стиля жизни" и прочего. Как правило это просто проявления относительно высокого уровня зарплат в конкретном регионе и низкого уровня грамотности людей. Мы с моей девушкой поставили для себя очень простую задачу — есть вкусно, просто, дешево, правильно и быстро.
И так получилось, что при выборе инструмента планирования такого питания взор пал на PostgreSQL, который стоит на домашнем сервере. Аналогично можно легко сделать и в Excel или Гугл-таблицах, но в нашем случае SQL оказался более быстрым + есть открытые базы с готовыми данными. Данная статья может рассматриваться вами как "заготовка" для аналогичного SQL сервиса или просто как идея, которую вы можете взять и применить для себя.
Также обратите внимание — чтобы пользоваться этим в полной мере, вы должны хотя бы чуточку уметь в табличные процессоры (Excel).
Группы людей, которым "зайдет" статья:
- Люди, которые знают SQL хотя бы на уровне простейших запросов (если вы DBA — некоторые упрощения здесь сделаны для экономии времени, а не по той причине, о которой вы подумали) ;
- Люди, которые хотят контролировать что они едят;
- Люди, которые хотят есть вкусно, недорого, просто и полезно;
- Люди, которые хотят попробовать поковыряться в SQL-сервере или просто уверены в использовании этого инструмента;
Группы людей, которым не "зайдет" статья:
- Почему функция возвращает просто запрос? Надо в 100 раз сложнее!
- Так схемы делают только… / я ем все что попало / зачем SQL — давайте вообще монгу / кто так форматирует запросы итд;
- Готовить — не барское дело!
- Надо все нормализовать еще на 10 рядов!
Вступление:
Так уж получилось, что некоторое время я жил в Москве. Москва (в моем мире), как правило, характеризуется:
Низким качеством доступного питания или высокой ценой чуть менее доступного;
Общей резиновостью продуктов из магазина (если вы были на Кипре хоть раз — вы поймете);
Отсутствием способов питаться одновременно и правильно, и дешево и вкусно не прилагая усилий (не говорю про маркетинговые сервисы с маржинальностью в 50-60%, где все равно надо готовить);
Наличием рынков, где в принципе все доступно по нормальным ценам, но в "сыром" виде;
TLDR для нетерпеливых и продвинутых:
- Скачайте себе дамп базы PostgreSQL (9.5+) базы по ссылке и распакуйте;
- Если устраивают пресеты, которые есть, то просто вбейте запрос:
SELECT * FROM get_random_menu()
- Запрос отдаст вам json (если вы дочитали до сюда, то вы легко поменяете на нужный вам формат или дернете запрос каким-нибудь драйвером) с меню на неделю (7 дней) из расчета:
- 2 взрослых человека — мужчина и женщина (recommended_daily_intake);
- Расчет количества еды — просто экстраполяцией через калорийность (почему — описано ниже);
- Питание 4 раза в сутки
- Завтрак из нескольких блюд;
- Обед;
- Ужин;
- Перекус вечером;
- Меню выбирается случайно при каждом запросе;
- Если не устраивают пресеты или нужно поменять количество людей (тут установлено для мужчины и женщины со средними потребностями):
- Функция get_random_menu() подскажет, что поменять;
- Основные таблицы, которые стоит подстраиваться под себя
- recommended_daily_intake;
- Все таблицы, содержащие слово dish;
- Структура немного сложная, но она станет понятной, если вы почитаете запросы;
Результат:
По этой причине мы решили сделать мини-сервис для себя, куда мы внесли простые блюда которые нам нравятся. Вообще мы пробовали работать с базой USDA — но она оказалась избыточно сложной. По такому сервису мы попробовали покупать еду в течение ~ 10 недель, и выяснили по опыту, что:
- В алгоритме были разные баги с пропорциями, которые мы поправили (15 килограмм квашеной капусты в неделю это сильно);
- В среднем в неделю на 2 человек уходит порядка 4 000 рублей (!) + 1.5-2 часа на покупку + 30-40 минут на готовку вдвоем ежедневно. В месяц получается в районе 8 000-10 000 рублей на человека;
- Девушка еще и значительно похудела (приятный бонус);
- Оба перестали тратить деньги на покупку пищи вообще. И на обеды тоже;
- Самый удобный формат работы с базой — выгрузил через любую доступную программу в таблицу, сделал сводную таблицу, залил на телефон;
- Отмечать готовку блюд проще всего с телефона / компьютера в таблице;
- Простая и вкусная еда и огромная экономия времени на планировании (10 часов макс. на разработку этого позволяет жить почти 3 месяца не думая про еду);
Вообще, может когда-нибудь руки дойдут и до такого (описание как превратить алгоритм в приложение и продукт), но пока общение с коллегами и рынок подсказывают, что "богатые" готовить не будут (скорее заплатят маржу в 50-80% сервисам), а "бедные" в России — не будут платить за приложение.
Почему "наивная" оптимизация по калориям? Почему не по белкам?
Потому, что работает, а механизма идеального измерения потребностей все равно нет (или мы его не знаем).
Функция get_random_menu() также отдает идеальное потребление калорий, белков и углеводов — вы можете сравнивать руками. Я пробовал применять алгоритмы линейной и нелинейной оптимизации в Питоне (сгенерировал 10,000 меню случайно, попробовал улучшать веса для "идеальной" подгонки, за час-два не добился результата, оставил), но скорее всего из-за нашего набора блюд там в принципе не особо возможно иметь 100% попадание — белков и углеводов в среднем меньше на 15-20% чем "идеал".
Описание технической составляющей, базы и функций:
В общем заполнение структуры данных и написание функций заняло примерно 3-4 часа на таблицы и 2-3 часа на функции и хорошо выражается ER схемой:
Обратите внимание на то, что:
- Лучше использовать PostgreSQL 9.5+, т.к. используется несколько функции по работе с json, которые не так давно появились;
- Есть понятие блюда (dish), есть понятие того в рамках каких приемов пищи оно может приниматься (dish_serving_choice, dish_serving);
- dish_menu — пример лога купленной пищи, потом оказалось проще собирать в экселе;
- Не каждое блюдо можно есть, скажем, на завтрак для этого есть dish_type;
- Блюда состоят из ингредиентов (dish_ingredient), но не содержат воды (в ней нет калорий — оптимизация не сработает) — все пропорции посчитаны с учетом этого факта;
- Мы приняли по сути несколько предположений:
- Пропорции приема калорий в рамках приемов пищи (dish_serving_choice);
- Требуемая калорийность (ниже);
- Состав блюд (dish_contents);
Также есть 2 таблицы с описанием потребностей людей, их модификация требуется для изменения числа людей
Проще всего понять (если вы знаете SQL) как это все работает посмотрев на пару основных функций
getPrimitiveMenu
- Базовая функция. которая просто создает случайное меню;
- Создает случайное меню на 7 дней;
- Рандомизация по сути делается через ORDER BY random();
- Неделю мы создаем простой конструкцией unnest(ARRAY[1,2,3,4,5,6,7]);
- Остальное — тривиально;
CREATE OR REPLACE FUNCTION "usda28"."getPrimitiveMenu"()
RETURNS SETOF "pg_catalog"."record" AS $BODY$
BEGIN
RETURN QUERY
SELECT
raw_data1.week_day ::INTEGER as week_day,
raw_data1.meal_order :: INTEGER as meal_id,
raw_data1.meal :: VARCHAR as meal,
raw_data1.balance ::NUMERIC as dish_share,
raw_data1.dish_type :: VARCHAR as dish_type,
d.title :: VARCHAR as dish_title,
d.deliciousness :: INTEGER as dish_taste,
dc.portion :: NUMERIC as proportion,
di.id::INTEGER as dish_ingredient_id,
di.title ::VARCHAR as di_title,
di.calories :: INTEGER as calories_per_100,
di.carbs :: INTEGER as carbs_per_100,
di.fat :: INTEGER as fat_per_100,
di.protein :: INTEGER as protein_per_100
FROM
(
SELECT
dsc.calorie_balance as balance,
ds.title as meal,
dsc.dish_serving_id,
dsc.choice_id,
ds.id as meal_order,
dt.title as dish_type,
presets.week_day as week_day,
(
SELECT
d."id"
FROM
usda28.dish d
/* Checking that the dish has actual ingredients, otherwise errors are possible */
JOIN usda28.dish_contents dc ON dc.dish_id = d."id"
WHERE
d.dish_type_id = dsc.dish_type_id
ORDER BY
random()
LIMIT
1
) as dish_id
FROM
(
SELECT
servings_count.dsc_id as dsc_id,
trunc(servings_count.choice_count * random() + 1)::INTEGER as preset_choice,
unnest(ARRAY[1,2,3,4,5,6,7]) as week_day
FROM
(
SELECT DISTINCT
dsc.dish_serving_id as dsc_id,
COUNT(DISTINCT dsc.choice_id) as choice_count
FROM
usda28.dish_serving_choice dsc
GROUP BY
dsc.dish_serving_id
) servings_count
ORDER BY
unnest(ARRAY[1,2,3,4,5,6,7])
) presets
JOIN usda28.dish_serving_choice dsc ON dsc.choice_id = presets.preset_choice AND dsc.dish_serving_id = presets.dsc_id
JOIN usda28.dish_serving ds ON ds."id" = dsc.dish_serving_id
JOIN usda28.dish_type dt ON dt."id" = dsc.dish_type_id
ORDER BY
presets.week_day ASC,
dsc.dish_serving_id ASC
) raw_data1
JOIN usda28.dish d ON d."id" = raw_data1.dish_id
JOIN usda28.dish_contents dc ON dc.dish_id = d."id"
JOIN usda28.dish_ingredient di ON di."id" = dc.ingredient_id
ORDER BY
raw_data1.week_day ASC,
raw_data1.meal_order ASC,
d.title ASC;
END
$BODY$
LANGUAGE 'plpgsql' VOLATILE COST 100
ROWS 1000
;
get_random_menu
- Функция, которая взвешивает меню по калориям и отдает случайное меню;
- Если не знаете про window functions — почитайте;
- По сути функция берет то, что сделала предыдущая функция + считает количество калорий подзапросом (… ) nut;
- Условно сложная формула по сути является просто школьной пропорцией;
CREATE OR REPLACE FUNCTION "usda28"."get_random_menu"()
RETURNS "pg_catalog"."json" AS $BODY$ SELECT
to_json(array_agg(a))
FROM
(
SELECT
(SELECT md5(''||now()::text||random()::text) as menu_uuid),
raw_data.week_day as week_day,
raw_data.meal_id as meal_id,
raw_data.meal as meal,
raw_data.dish_type as dish_type,
raw_data.dish_title as dish_title,
raw_data.dish_ingredient_id as dish_ingredient_id,
raw_data.ingredient_title as ingredient_title,
raw_data.dish_share,
raw_data.proportion,
raw_data.calories_per_100,
raw_data.carbs_per_100,
raw_data.fat_per_100,
raw_data.protein_per_100,
trunc( raw_data.proportion * raw_data.dish_share * raw_data.calories * 100 / SUM(raw_data.stat_weight) OVER (PARTITION BY
raw_data.week_day,
raw_data.meal_id,
raw_data.meal,
raw_data.dish_type,
raw_data.dish_title
) )as grams_guesstimate
FROM
(
SELECT
menu.week_day as week_day,
menu.meal_id as meal_id,
menu.meal as meal,
menu.dish_type as dish_type,
menu.dish_title as dish_title,
menu.dish_ingredient_id as dish_ingredient_id,
menu.di_title as ingredient_title,
menu.dish_share,
menu.proportion,
menu.calories_per_100,
menu.carbs_per_100,
menu.fat_per_100,
menu.protein_per_100,
nut.calories,
menu.proportion * menu.calories_per_100 as stat_weight
FROM
(
SELECT
week_day,
meal_id,
meal,
dish_share,
dish_type,
dish_title,
dish_taste,
proportion,
dish_ingredient_id,
di_title,
calories_per_100,
carbs_per_100,
fat_per_100,
protein_per_100
FROM
usda28."getPrimitiveMenu"()
) menu
JOIN
(
SELECT
SUM (rdi.carbs) * mlp.proportion as carbs,
SUM (rdi.fat) * mlp.proportion as fat,
SUM (rdi.protein) * mlp.proportion as protein,
SUM (rdi.calories) * mlp.proportion as calories,
ml.title as meal_title,
ml."id" as meal_id
FROM
usda28.recommended_daily_intake rdi
JOIN usda28.activity_types atp ON atp."id" = rdi.activity_type_id AND atp."id" = 1
JOIN usda28.meal_proportions mlp ON 1=1
JOIN usda28.dish_serving ml ON ml.id = mlp.meal_id
GROUP BY
ml.title,
mlp.proportion,
ml."id"
) nut ON nut.meal_id = menu.meal_id
) raw_data
ORDER BY
raw_data.meal_id ASC,
raw_data.week_day ASC,
raw_data.dish_type ASC
) a
$BODY$
LANGUAGE 'sql' VOLATILE COST 100
;
Если понравилось — пишите в личку.
PapaBubaDiop
Быстро не стыкуется с древней чехословацкой поговоркой:
snakers4
Быстро = быстро покупать и не тратить время на организацию процесса, а не быстро жевать =)
PapaBubaDiop
Для меня субботний поход на рынок за едой — процесс, полный удовольствия. Тайно признаюсь — это восхитительней, чем поход в музей)
snakers4
Вот и пообщались на IT-сайте про еду xDDD
Vladal
Как пропатчить…?
snakers4
У вас проблема с открытием дампа?
Vladal
Уже разобрался. Извините.