На днях столкнулся с интересной задачкой, которая показалась мне достойной аудитории данного ресурса. Условие ее следующее:

«Найти максимально допустимое отклонение массы конфеты при ее производстве, чтобы нетто коробки, состоящей из 12 штук их, не выходило за пределы 310±7 грамм в 90% случаев. Закон распределения считать нормальным.»

Стоит сказать, что условие не было выдернуто из интернета или подсмотрено на каком-нибудь ресурсе занимательных задач, а пришло от одного очень хорошего друга, который по должности своей инженер по организации и управлению производством на одной небезызвестной кондитерской фабрике. То есть задача имеет вполне реальное происхождение, а ее решение — практическую пользу.

Я предложил читателям решить задачу самостоятельно и должен сказать, что они справились с этим лучше меня. В своем же решении я я сделал не верное допущение.

1. Условности


Условимся обозначать большими буквами параметры для коробки и маленькими — для конфет.
Пускай и — соответственно масса нетто коробки и ее допустимое отклонение, такое, что в процентах случаев она не выходит за пределы .
Пускай и — соответственно масса конфеты и ее допустимое отклонение, такое, что в процентах случаев она не выходит за пределы .
Количество конфет в коробке .

2. Нормальное распределение


Нормальное распределение описывается функцией Гаусса:


, где — математическое ожидание, — стандартное отклонение, квадрат которого — называется дисперсией.

В случае с конфетами , a , поэтому:


В случае с коробкой конфет , a :


Вероятность того что масса конфеты не выйдет за пределы равна:


Вероятность того что нетто коробки не выйдет за пределы равна:


Рисунок ниже хорошо иллюстрирует все выше сказанное:


Найдем вероятность для конфеты:


, где — функция распределения, а — функция ошибок.

Таким образом для конфеты:


Аналогично для коробки:



3. Центральная предельная теорема


Из центральной предельной теоремы следует что если существуют независимые случайные величины:


, то их сумма:

будет обладать параметрами:


Применительно к нашей ситуации имеем:



4. Вероятности и моя ошибка


Я ошибочно посчитал что совокупная вероятность для коробки равна произведению вероятностей для отдельных конфет. Другими словами:


, откуда:

Получилась система уравнений:


Решив ее относительно :

, вывел:

, где — обратная функция ошибок и нашел вполне конкретные цифры:








Такое решение я обосновал следующим образом: необходимо, чтобы масса конфеты не выходила за пределы 25.8333±3.2212 в 99.13% случаев (1 на 115). И хотя такой ответ не является противоречащим, правда в том что только является верным ответом. Так как при таком и меньшем стандартном отклонении нам ничего не нужно отбрасывать, о чем многие читатели мне долго намекали и были правы.

5. Проверка


Как же без нее. Проверку состряпал в матлабе. Вкратце создаем 1000000 конфет с найденными параметрами по нормальному закону. Случайным (равновероятным) образом из них формируем 1000000 группок (считай коробок) по 12 штук. Проверяем количество таких групп не вышедших за пределы 310±7 и делим на общее, получая таким образом ту самую вероятность для коробки. И так 1000 раз.

Код
% Number of candys
nC = 1000000 ;

% Mass deviation of a single candy
mC = normrnd ( m , s , 1 , nC ) ;

% Number of candys in the box
n = 12 ;

% Number of boxes
nB = 1000000 ;

% Number of experiments
nE = 1000;

pB = zeros ( 1, nE );

for k = 1 : nE
    % Random index of n candys
    i = random ( 'unid' , nC , nB, n ) ;

    % The mass of each boxes
    j = 1 : nB ;
    mB  = sum ( mC ( i ( j , : ) ) , 2 )' ;

    % Mask boxes that out of range
    mask = ( mB < M + dM ) .* ( mB > M - dM );

    % Probability of out of the range
    pB ( k ) = sum ( mask ) / nB;
end

В итоге получился такой вот красивый график:


Осмелюсь предположить что 1 млн. коробок мало и если устремить их количество в бесконечность, наши вероятности будут ровно в 90%.

Гораздо интереснее случай, когда аппарат для разлива конфет имеет константное стандартное отклонение, которое больше 1.2285 и нужно найти те самые границы , выше которых, при заданной , конфеты нужно отбросить, чтобы удовлетворять тем же условиям. Это куда более сложная задача, которой я возможно посвящу еще одну статью.

Комментарии (128)


  1. EndUser
    28.09.2015 10:14
    +9

    Не могу классифицировать ситуацию: это действительно «хакатон на халяву» в пользу некоего «известного кондитера»?


  1. tangro
    28.09.2015 10:21
    +15

    Можно просто бахнуть миллиардик экспериментов методом Монте-Карло и получить результат с точностью до надцатого знака после запятой. Тот случай, когда написать два вложенных цикла быстрее, чем вспоминать все законы теории вероятностей.


    1. kraidiky
      28.09.2015 11:30
      +11

      Вот и выросло поколение. :)


      1. tangro
        28.09.2015 23:38
        +2

        Как подсказывает Википедия, метод Монте-Карло впервые был предложен в 1930-ом году Энрико Ферми. С тех пор уже не одно поколение выросло. :)


        1. Plone
          01.10.2015 18:51

          Речь о том, когда «бахнуть миллиардик экспериментов» стало «быстрее».


          1. Mrrl
            01.10.2015 19:01

            Помнится, во времена Декарта вероятности тоже считали с помощью кучи экспериментов, а не каких-то там законов. Так что ничего нового.


    1. viktorpanasiuk
      28.09.2015 11:40

      А вы бахните… Ведь интересно на сколько сойдется ответ.


      1. tangro
        29.09.2015 00:58

        Интересно, конечно.

        Ну вот
        #include <iostream>
        #include <chrono>
        #include <random>
        
        int main()
        {
        	unsigned seed = std::chrono::system_clock::now().time_since_epoch().count();
        	std::default_random_engine generator(seed);
        	std::normal_distribution<double> distribution(0.0, 1.228518);
        
        	const int tests = 500000;
        	const int candiesInBox = 12;
        
        	// let's test all max candy weight from 5.0 to 3.0 with step 0.1
        	for (double m = 5.0; m > 3; m -= 0.01) 
        	{
        		int okBoxes = 0;
        		for (int j = 0; j < tests; ++j)
        		{
        			double sum = 0;
        			for (int i = 0; i < candiesInBox; ++i)
        			{
        				double number;
        				for (;;)
        				{	
        					// let's generate candies till we have a good one
        					number = distribution(generator);
        					if (number < m && number > 0 - m)
        						break;
        				}
        				sum += number;
        			}
        
        			if (sum >= -7.0 && sum <= 7.0)
        				okBoxes++;
        		}
        		std::cout << "For max = " << m << " okBoxes=" << (double)okBoxes / (tests / 100) << "%" << std::endl;
        	}
        
        
        	return 0;
        }
        


        1. viktorpanasiuk
          29.09.2015 01:35

          не верный ответ)


          1. kraidiky
            29.09.2015 02:14

            Вы уверены, что сами правильно решили задачку? Как-то странно выглядит, что все решения включая численные, не совпадают с вашим.


            1. viktorpanasiuk
              29.09.2015 07:57

              да, если он на 35% отличается…


              1. tangro
                29.09.2015 09:46

                Странно, что на миллиарде тестов результаты так отличаются. Давайте проговорим словами, что мы моделируем. Вот есть машина, которая делает конфеты весом 25.8(3) грамма. Понятное дело, что машина не идеальна и конфеты имеют не точно этот вес, а какой-то, определяемый нормальным распределением со среднеквадратичным распределением 1.228518. Т.е. большинство конфет будет около 25.8 грамм плюс\минус пару грамм, но могут иногда встречаться и конфетки весом в килограм (нормальное распределение это позволяет).

                Дальше все конфетки попадают на конвеер, одна за одной. Для того, чтобы в коробки не попадали те самые конфеты весом в килограм (а также слишком легкие) на конвеере стоит автомат, измеряющий вес конфеты и выбрасывающий её, если отклонение веса превышает некоторый вес M. Если М будет очень большим — у нас будет много коробок со слишком большим отклонением веса. Если М будет слишком маленьким — много конфет будет уходить в брак, что удорожает производство. Наша задача — подобрать это M таким образом, чтобы 90% наборов из 12-ти конфет имели суммарное отклонение веса не превышающее 7 грамм.

                Так или не так?


                1. viktorpanasiuk
                  29.09.2015 10:06

                  Можно даже не отбрасывать неугодные конфеты, главное чтобы их процент был не больше некой величины и тогда мы все-равно попадем в нужный нам интервал.


                  1. tangro
                    29.09.2015 10:18
                    +1

                    Но тогда ответ на Вашу задачу — не какое-то одно число, а бесконечный набор пар (допустимый процент бракованых конфет — максимально допустимое отклонение массы). Akela_wolf вон привёл его ниже, но этот ответ Вам тоже не понравился.


                    1. viktorpanasiuk
                      29.09.2015 10:22

                      Ну если этот процент бракованых конфет свести к 0, то уж тем более условие выполнится. Для того чтобы дать верный ответ, его нужно обосновать а не угадывать)


                    1. jzha
                      29.09.2015 11:07
                      +1

                      Не распыляйтесь перед автором поста. Тот же самый совет Akela_wolf.
                      Поскольку в самом начале не было ясно сформулировано, что требуется. С умыслом или без, но автор не написал что же хотели «кондитеры».

                      Видимо, требовалось найти в какой 1-alpha — дов. интервал попадает масса одна конфеты (подчиняется норм. распределению) и границы этого интервала, если границы 90% — дов. интервал коробки из 12 конфет — [303; 317].
                      1-alpha находится через error function и inverse error function от 0.9. Далее, через F находятся границы этого интервала.


                      1. viktorpanasiuk
                        29.09.2015 11:21

                        За что купил, за то и продал. Из уст в уста, как говорится. Чего хотели кондитеры я сам не знаю, так как закон распределения в реальности может быть совсем не нормальным даже в ограниченом интервале. А предложенный вами метод решения верен, если вы правильно учли вероятности.


                        1. jzha
                          29.09.2015 12:44
                          +1

                          Вы что-то додумали, а в условии это не сказали :-). Вы чувствуете разницу в вашей формулировке и в моей?

                          Хорошо, вы хотели показать, что ответ будет «красивым» — 7*qnorm(0.9)/qnorm(0.95), где qnorm — квантиль функция стандартного норм. распределения.
                          Но такое в голове держать не будешь. Быстрее и логичнее произвести «естественные» расчеты, которые будут понятны любому, нежели такой ответ.


                          1. viktorpanasiuk
                            29.09.2015 12:57

                            Додумал то же что и остальные. Мол если это нормальное распределение, то не может быть какого-то ограниченого интервала. И ответ вполне нормальный: масса не должна выходить за пределы m±dm в p процентах случаев.


                        1. jzha
                          29.09.2015 12:49

                          Поэтому это больше похоже на «задачку из учебника», чем на случай из реальной жизни ;). Более не мешаю.


                1. polybook
                  29.09.2015 15:35

                  Решал задачу при помощи Монте-Карло, примерно в тех же условиях (автомат выбрасывает с конвейера конфеты, отличающиеся по весу на d от 25.8). Результат, очевидно, зависит от дисперсии конфеты. При весе 25.8±3 г получается d~2.0, а при весе конфеты 25.8±1.5 г получается d~2.2.

                  Т.е., чем ровнее отдельные конфеты, тем меньше их нужно выкидывать.


        1. Akela_wolf
          29.09.2015 07:22

          Численные методы дают неизбежную погрешность. Поэтому численное решение должно быть в виде X±Z, где X — найденное решение, Z — погрешность.


    1. Arseny_Info
      28.09.2015 12:26
      +1

      Абсолютно согласен.
      Мой пример решения такого решения gist.github.com/anonymous/29eaa6844c6242bedc47


      1. viktorpanasiuk
        28.09.2015 13:10
        -3

        А какой же ответ?


        1. Arseny_Info
          28.09.2015 16:00

          ~1.22


          1. viktorpanasiuk
            28.09.2015 16:17

            это сигма или отклонение?


            1. Arseny_Info
              28.09.2015 16:28

              отклонение


              1. viktorpanasiuk
                28.09.2015 16:32

                тогда не верно)


                1. Arseny_Info
                  28.09.2015 16:48

                  Стоп, я запутался. Сигма же и есть стандартное отклонение: In other words, the standard deviation ? (sigma) is the square root of the variance of X.


                  1. viktorpanasiuk
                    28.09.2015 16:51

                    хорошо, сигма верна, а максимальное допустимое отклонение в массе конфеты? Это только половина решения.


                    1. Arseny_Info
                      28.09.2015 18:36

                      Конкретизируйте вопрос, пожалуйста.
                      Если одна из миллиона конфет будет 20 или 30 грамм, это будет допустимо.


                      1. viktorpanasiuk
                        28.09.2015 18:39

                        да хоть тонну, у нас же нормальное распределение.


                        1. Arseny_Info
                          28.09.2015 19:01

                          Вот именно. Какой ответ ожидается-то? Что-то вроде «99% конфет должны быть 25.8 ± 3.15 г.»?


                          1. viktorpanasiuk
                            28.09.2015 19:03

                            именно так, я писал уже об этом трижды.


    1. Mrrl
      01.10.2015 19:03

      Кстати, точность метода Монте-Карло в типичных случаях — примерно sqrt(1/N). Так что миллиард экспериментов даст в лучшем случае 5 знаков.


  1. sophist
    28.09.2015 12:40

    Максимально допустимое отклонение массы конфеты – от какого значения? От 25,8(3) г?


    1. viktorpanasiuk
      28.09.2015 13:09

      Да, вы правы, математическое ожидание для массы конфеты будет 310 / 12 = 25.8(3) грамма. Но как вы увидете, этот параметр не будет фигурировать в решении.


    1. 0xd34df00d
      28.09.2015 16:03

      В итоге всё равно будет важна лишь дисперсия (функция от этого ±7).


  1. Arastas
    28.09.2015 13:33
    +2

    Слушайте, я, вероятно, что-то туплю, но как согласуются понятия «максимальное отклонение» и «нормальное распределение»? На сколько я помню, при нормальном распределении массы конфеты отклонение от мат. ожидания теоретически не ограничено, просто большое отклонение маловероятно. Если же ограничено, то это уже не нормальное распределение, а какая-то его модификация. Может, надо найти допустимую дисперсию?


    1. viktorpanasiuk
      28.09.2015 14:17

      Меня тоже вначале смутили подобные мысли, но при решении все стало на свои места. И вы правы в том что необходимо искать допустимую дисперсию, все остальное из нее выплывает.


      1. Arastas
        28.09.2015 14:27

        Тут вопрос не в смущении, а в корректной формулировке вопроса — какое должно быть максимальное допустимое среднеквадратичное отклонение веса конфеты, чтобы <далее по тексту>. А не просто отклонение.


        1. viktorpanasiuk
          28.09.2015 14:28

          после публикации решения, в выводах, я коснусь этого вопроса.


    1. Aclz
      28.09.2015 14:18

      не выходило за пределы 310±7 грамм в 90% случаев


      1. viktorpanasiuk
        28.09.2015 14:24

        да, я понимаю, смущает, но при правильном решении таки не выходит, на бесконечной выборке конечно.


        1. Aclz
          28.09.2015 14:41

          Меня, как раз, не смущает. Это было на

          Если же ограничено, то это уже не нормальное распределение
          в том плане, что как такового ограничения нет.


          1. viktorpanasiuk
            28.09.2015 15:10

            Да, именно так, существует не 0 вероятность что коробка конфет будет весить тонну, но из 1 млн. таких коробок примерно 900 000 будет в пределах 310±7 грамм.


          1. Arastas
            28.09.2015 15:11
            +2

            Я вижу это ограничение во фразе: Найти максимально допустимое отклонение массы конфеты. Если мы допускаем, что у конфеты есть какое-то максимальное отклонение, не статистическое, а для каждой конфеты, то я не понимаю, как можно говорить о нормальном распределении. Это чисто терминологический момент.


            1. viktorpanasiuk
              28.09.2015 15:15

              а вы найдите такое отклонение массы конфеты, чтобы верятность пребывания в этих пределах удовлетворяла условию задачи.


              1. Arastas
                28.09.2015 15:27
                +1

                Ох. Мое замечание не про поиск решения, оно про двусмысленность в формулировке. Что такое «максимальное отклонение массы конфеты»? Я, в силу своего знания естественного русского языка, понимаю это так: Если максимальное отклонение массы конфеты составляет 5 грамм от среднего 100 грамм, то ни одна конфета не может весить больше 105 или меньше 95 грамм. Дело в том, что такая формулировка несовместима, на мой взгляд, с фразой «Закон распределения считать нормальным».
                А как Вы понимаете разу про «максимальное отклонение массы конфеты»?


                1. viktorpanasiuk
                  28.09.2015 15:38

                  Ну примерно так. Если конфета при производстве не выходит за пределы m±dm в p процентах случаев, то n таких конфет не выйдет за пределы M±dM в P процентах случаев. А если p будет 1 то уж тем более.


              1. Mrrl
                29.09.2015 13:07
                +1

                Вероятность чего? В задаче фигурирует вероятность выхода массы коробки за диапазон. Если для конфеты нужно найти диапазон, в который попадают те же 90% конфет, то, насколько я понимаю, получится отклонение 7/sqrt(12)=2.02 грамма — даже в таблицы можно не смотреть. Но вообще, «максимальное» отклонение и нормальное распределение несовместимы.


                1. viktorpanasiuk
                  29.09.2015 13:15

                  не верный расчет) согласен, не совместимы, но если нормальное распределение ограничить на найденом отклонении, то со 100% вероятностью условие выполнится.


                  1. Mrrl
                    29.09.2015 13:29

                    Если нормальное распределение ограничить, то оно перестанет быть нормальным, а станет каким-то другим. У него будет два параметра — сигма и ограничение. И для выполнения условия задачи они будут как-то связаны, но решений явно будет бесконечно много.


                    1. viktorpanasiuk
                      29.09.2015 13:43

                      Решение будет одно, для любого распределения и любого интервала. Главное чтобы были известны взаимосвязи.


                      1. Mrrl
                        29.09.2015 13:51

                        Если масса конфет имеет нормальное распределение с сигмой 1.228, то условие про 90% коробок будет выполнено, при этом масса конкретной конфеты может иметь любое значение от минус до плюс бесконечности, и ограничивать ничего не нужно.
                        Если масса распределена равномерно (сигма исходного, не обрезанного, распределения равна бесконечности), то её нужно ограничить интервалом длиной 1.228*sqrt(12)=4.254 — и максимальное отклонение для конфеты будет 2.127 (здесь 12 не имеет отношения к числу конфет в коробке — это просто свойство равномерного распределения).


                        1. viktorpanasiuk
                          29.09.2015 14:16

                          первый ваш абзац заставил меня пересмотреть мое решение и должен согласиться, что таки-да, Вы правы. Для конфеты будет существовать лишь один параметр — сигма, который полностью описывает ее свойства.


    1. Akela_wolf
      28.09.2015 15:02

      Вот-вот мысли о том же. Если считать просто допустимое стандартное отклонение оно выходит примерно 14,7 гр. Тогда 12 таких конфет укладываются в 310 плюс-минус 7 гр. с вероятностью 90%. Но как-то много вышло, если честно.

      Действительно, такое ощущение что в условии задачи чего-то не хватает.


      1. viktorpanasiuk
        28.09.2015 15:12

        у вас действительно слишком большое стандартное отклонение)


  1. jzha
    28.09.2015 15:03

    Вы так сформулировали условие, что не ясно, почему не устраивает решение в лоб?
    Масса одной произвольной конфеты ~ N(310/12, sd^2). В предположении о независимости этих случ. величин, масса коробки ~ N(310, 12*sd^2).
    Находим sd^2 из уравнения F(X < 317) = 0.95 и, если требуется, умножаем результат на 12/11 (finite pop.correction). Оценка sd получена.


    1. Akela_wolf
      28.09.2015 15:04

      У вас неправильная формула. При сумме N случайных величин дисперсия будет sd^2/sqrt(N)


      1. viktorpanasiuk
        28.09.2015 15:17

        дисперсия будет 12*sd^2, а вот стандартное отклонение как раз sd*sqrt(12).


        1. Akela_wolf
          28.09.2015 15:26

          Ну конечно, почему я подумал что нужно делить? Забыл теорвер :)


    1. viktorpanasiuk
      28.09.2015 15:22

      не могли бы вы привести конкретную цифру? И почему <0.95? F — это функция распределения? Оценки sd мало, необходимо отклонение.


      1. Akela_wolf
        28.09.2015 15:32

        F — вероятность выполнения условия. Если величина X распределена нормально, то условие F(M-a <= X <= M+a)=0.9 сводится к F(x <= M+a)=0.95

        Последнее является определением квантиля. Отсюда получаем, что a = 1.65*sd=7 гр., то есть sd=4.24. Это у коробки.
        Для конфеты sd=4.24/sqrt(12)=1.22 гр.


        1. Akela_wolf
          28.09.2015 15:35

          Далее, если следовать правилу трех сигм, то вес конфеты должен быть в пределах 25.8 плюс-минус 3.67 гр. Тогда, с вероятностью 90% вес коробки укладывается в указанный диапазон


        1. Akela_wolf
          28.09.2015 15:40

          Опять я все перепутал, так нельзя делать, нужно обязательно через дисперсию. Для коробки sd=4.24, тогда D=17.98, тогда для конфеты D=17.98/sqrt(12)=3.46 и sd для отдельной конфеты составляет sqrt(3.46)=1.86

          Конечный результат получается такой: математическое ожидание 25.8, среднеквадратическое отклонение 1.86


          1. viktorpanasiuk
            28.09.2015 15:44

            не верно)


            1. Akela_wolf
              28.09.2015 15:46

              Да ну? Вечером голова не соображает, завтра утром еще подумаю. Но мне кажется, что вы все-таки перепутали верно и неверно :)


              1. Akela_wolf
                28.09.2015 15:51

                Нет, у вас все правильно


        1. viktorpanasiuk
          28.09.2015 15:43

          верно)


      1. jzha
        28.09.2015 16:15

        sd = 1.228518 (fpc игнорируем). Это и есть ответ.
        F — кумулятивная функция нормального распределения
        0.95 в силу симметричности плотности нормального распределения.

        Код на R

         sd <- uniroot(function(x) pnorm(317, 310, sqrt(12)*x) - 0.95, lower = 0, upper = 2)$root 

        Проверка
        
        set.seed(123)
        n <- 10000
        boxes <- sapply(1:n, function(i) sum(rnorm(12, 310/12, sd)))
        quantile(boxes, c(0.05, 0.95))
        

        Результат
        5% 95%
        303.0068 317.0503


        1. viktorpanasiuk
          28.09.2015 16:19

          стандартное отклонение верно, но ответом должно быть максимальное отклонение в массе конфеты.


          1. jzha
            28.09.2015 16:58

            Найденное значение — максимально допустимое стандартное отклонение. В том смысле, что при меньшем sd по-прежнему масса не менее 90% коробок будет лежать в требуемом интервале, а при большем sd таких коробок будет менее 90%.
            Ясно, что носитель нормального распределения не ограничен сверху и снизу. Если вы подразумевали truncated normal distribution или какие-то другие дополнительные условия, то об этом надо было заявить внятно в самом начале, а не играть в угадайку.


            1. viktorpanasiuk
              28.09.2015 17:09

              Ну примерно так. Если конфета при производстве не выходит за пределы m±dm в p процентах случаев, то n таких конфет не выйдет за пределы M±dM в P процентах случаев

              Я уже писал. От sd к внятному ответу один маленький шажочек, но почему-то никто не может до него догадаться…


              1. Akela_wolf
                28.09.2015 18:03

                На практике применяют простое правило «3 сигмы», которое дает вероятность попадания в заданный интервал 99%. Остальное — вопрос требуемой точности


                1. viktorpanasiuk
                  28.09.2015 18:04

                  не верный ответ) в физике, например 5 сигм. А математика и вовсе точная наука.


              1. Arastas
                29.09.2015 09:46

                *стёр*


    1. Arastas
      28.09.2015 15:29

      Видимо, Вы имеете ввиду F(303<X<317)=0.90?


      1. Arastas
        28.09.2015 15:50

        Если величина X распределена нормально, то условие F(M-a <= X <= M+a)=0.9 сводится к F(x <= M+a)=0.95

        А да, действительно.


  1. Akela_wolf
    28.09.2015 15:44

    Ну примерно так. Если конфета при производстве не выходит за пределы m±dm в p процентах случаев, то n таких конфет не выйдет за пределы M±dM в P процентах случаев


    Итак, конечный ответ. Если вес отдельно взятой конфеты 25,8±5,58 в 99% случаев (3 сигмы), то вес коробки из 12 конфет 310±7 в 90% случаев


    1. Akela_wolf
      28.09.2015 15:52

      Итак, конечный (самый конечный) ответ. Если вес отдельно взятой конфеты 25,8±3,66 в 99% случаев (3 сигмы), то вес коробки из 12 конфет 310±7 в 90% случаев


      1. viktorpanasiuk
        28.09.2015 15:54

        Близко, но все-таки нет)


        1. Akela_wolf
          28.09.2015 17:59

          С какой точностью требуется ответ?


          1. viktorpanasiuk
            28.09.2015 18:06

            2-3 цифры после запятой будет достаточно. У вас он в первой цифре после запятой уже не тот.


            1. Akela_wolf
              29.09.2015 07:19

              Хорошо, еще одна попытка, считаю с максимальной точностью.
              Вес конфеты должен быть распределен нормально, матожидание 25.833 гр, стандартное отклонение 1.228 гр

              Квантили:
              99% — 2.326. Таким образом, если вес 99 конфет из 100 попадает в диапазон 25.833±2.857, то вес коробки из 12 конфет укладывается в диапазон 310±7 с вероятностью 90%
              99,9% — 3.090 Таким образом, если вес 999 конфет из 1000 попадает в диапазон 25.833±3.796, то вес коробки из 12 конфет укладывается в диапазон 310±7 с вероятностью 90%
              99.99% — 3.715 Таким образом, если вес 9999 конфет из 10000 попадает в диапазон 25.833±4.564, то вес коробки из 12 конфет укладывается в диапазон 310±7 с вероятностью 90%


              1. Akela_wolf
                29.09.2015 07:47

                Наглючил с квантилями, нужно считать не 99%, а 99,5% и т.д. уровни.

                Таким образом:
                Вес конфеты должен быть распределен нормально, матожидание 25.833 гр, стандартное отклонение 1.229 гр

                Квантили:
                95% — 1.645. Таким образом, если вес 9 конфет из 10 попадает в диапазон 25.833±2.021, то вес коробки из 12 конфет укладывается в диапазон 310±7 с вероятностью 90%
                99.5% — 2.576. Таким образом, если вес 99 конфет из 100 попадает в диапазон 25.833±3.164, то вес коробки из 12 конфет укладывается в диапазон 310±7 с вероятностью 90%
                99.95% — 3.291 Таким образом, если вес 999 конфет из 1000 попадает в диапазон 25.833±4.042, то вес коробки из 12 конфет укладывается в диапазон 310±7 с вероятностью 90%
                99.995% — 3.891 Таким образом, если вес 9999 конфет из 10000 попадает в диапазон 25.833±4.78, то вес коробки из 12 конфет укладывается в диапазон 310±7 с вероятностью 90%
                99.9995% — 3.891 Таким образом, если вес 99999 конфет из 100000 попадает в диапазон 25.833±5.427, то вес коробки из 12 конфет укладывается в диапазон 310±7 с вероятностью 90%


                1. viktorpanasiuk
                  29.09.2015 07:58

                  вы разберитесь, какой же процент все-таки должен быть)


                  1. Akela_wolf
                    29.09.2015 08:15

                    Я думаю ответ сформулирован достаточно четко: «Если вес X конфет из Y попадает в диапазон ...».

                    Вообще, задачу стоило сформулировать иначе: в какой диапазон должен укладываться вес 99% (99,9%, 99,99% — точность по желанию) конфет, чтобы вес 90% коробок из 12 конфет укладывался в диапазон 310±7 гр.


                    1. viktorpanasiuk
                      29.09.2015 09:17

                      Ничего формулировать не нужно, этот диапазон содержится в условии задачи)


                      1. Akela_wolf
                        29.09.2015 09:42

                        Чтож, видимо буду ждать вашего решения


  1. knagaev
    29.09.2015 11:32
    +1

    У меня так получилось.
    Если вес коробки распределен нормально, то вероятность симметричного отклонения (попадания в интервал +-7) равна удвоенному интегралу вероятности (функции Лапласа).
    P(303 < S < 317) = 2 * Ф(7 / sigmaS),
    что равно 0.9 из условия.
    Отсюда 7/sigmaS = обратная Ф от 0.45 ~ 1.65
    и sigmaS = 4.(24) в периоде.
    Дисперсия веса коробки sigmaS равна сумме (одинаковых) дисперсий весов конфет sigmaK.
    То есть sigmaS^2 = 12 * sigmaK^2
    отсюда sigmaK = ((7 / 1.65)^2 / 12)^.5 ~ 1.22468
    Теперь в обратную сторону
    90%-ная вероятность попадания веса конфеты K в интервал (K-x, K+x) равна
    P(|310 / 12 — K| < x) = 2 * Ф(x / sigmaK)
    Вероятность у нас должна быть та же, 0.9, следовательно,
    1.65 = x / sigmaK
    x = 1.65 * 1.22468 ~ 2.0207
    Получается, что отклонение не должно превышать 2.0207 грамма с вероятностью 90%.


    1. viktorpanasiuk
      29.09.2015 11:39

      Верно все кроме одного. Впрочем то же что и у остальных)


      1. knagaev
        29.09.2015 11:57

        Так намекните что это одно :) может проблема в недопонимании условия?


        1. viktorpanasiuk
          29.09.2015 12:13

          с чего вы взяли что для конфеты вероятность должна быть такой же как для коробки?


          1. Akela_wolf
            29.09.2015 12:16

            А какой она должна быть? По идее, это данные должны быть в условии задачи


            1. viktorpanasiuk
              29.09.2015 12:24

              они и так в условии)


    1. Akela_wolf
      29.09.2015 12:00

      У нас с вами решение для случая 90% полностью сошлось. И, судя по изложенному решению, мы шли к нему одним и тем же путем.


    1. Mrrl
      29.09.2015 13:10

      2.02=7/sqrt(12). Все остальные формулы для случая той же вероятности не нужны :)


      1. knagaev
        29.09.2015 13:13

        Да я решил полностью расписать, раз уж такая рубка пошла, чтобы проверить, что нигде не вру :)


  1. knagaev
    29.09.2015 13:21

    Ну можно так.
    Если принять, что вес конфеты распределён по нормальному и может улетать куда угодно, то надо потребовать, чтобы 119 из 120 конфет были в интервале.
    Тогда гарантированно только одна коробка из десяти будет бракованной (в которую попадёт эта безумная конфета).
    Значит вероятность попадания в нужный интервал нужно зафиксировать на 119/120 ~ 0,992
    Отсюда максимальное отклонение 2.64 * 1.22468 ~ 3.2332
    Это вы имели в виду?


    1. viktorpanasiuk
      29.09.2015 13:28

      Ой как рядом, но ответ выдан на угад. Представьте что в одной коробке 2 улетевших конфеты, но одна в плюс, а другая в минус и коробка удовлетворяет условию)


      1. knagaev
        29.09.2015 13:34

        Мне кажется, что вероятность такого попадания двух улетевших мала, и ей можно пренебречь.
        1/120 * 1/120 / 2 = 0.35e-5


        1. viktorpanasiuk
          29.09.2015 13:38

          На бесконечной выборке будет бесконечное количество коробок, состоящих только из улетевших конфет. Давайте не будем пренебрегать малыми вероятностями)


          1. knagaev
            29.09.2015 13:50
            +1

            Я это говорю к тому, что если вы говорили о конкретной практичной задаче, то и ответ должен быть практичным.
            Получать третий знак после запятой для отклонения веса конфеты в граммах мне кажется несколько чрезмерным.
            Как говорил один мой преподаватель: «Если вы считаете точность попадания боевого блока метрового диаметра в микронах, то надо что-то исправлять в консерватории».


            1. Mrrl
              29.09.2015 14:06

              Мы измеряем с точностью десятков микрон расстояние до трёхмиллиметрового лазерного пятна. Люди довольны, но хотят, чтобы с такой же точностью определялось его поперечное положение. Что они имеют в виду? Пятно совсем не круглое…


          1. Mrrl
            29.09.2015 13:53

            Да, но эти коробки попадут в разрешенные 10% брака. Так что пренебрегать ими разрешено условиями задачи.


            1. knagaev
              29.09.2015 14:04

              Нее… Автор имеет в виду, что они наоборот вернутся в группу «хороших» коробок, поэтому требование можно смягчить (увеличить допустимый интервал).


  1. vics001
    29.09.2015 18:38

    Думаю условие задачи поставлено некорректно, точнее не хватает данных о распределении самих конфет. Нам известно, что распределение нормальное, но не известно ни среднее ни дисперсия. К примеру, в условиях задачи никак не ограничено среднее. Если представить среднее 10 грамм (аппарат не исправен), то задача вообще не имеет решения. Да и само слово отклонение подразумевает симметрию, насколько я понимаю, нужно добавить в условие, что нормальное распределение имеет мат. ожидание = 310/12. Возможно информация о дисперсии не нужна, надо проверить.


    1. viktorpanasiuk
      29.09.2015 18:44

      то что мат. ожидание 310/12 явно понятно. Дисперсия конфет находится из дисперсии коробок. Диспресия коробок находится из доверительного интервала и известных данных.


      1. vics001
        29.09.2015 19:52

        Честно говоря, это не очевидно, что мат. ожидание 310/12, оно вполне может быть 305/12 с маленькой дисперсией.
        Я не совсем понимаю слово «отклонение»? Это производственный термин, при котором мы не пропускаем конфету в коробку, то есть если конфета отклонилась на 5 грамм от 310/12, то она не проходит в коробку и нас спрашивается определить максимальное значение этого отклонения?

        Если я правильно понял условие, то как раз знание дисперсии здесь обязательно. Понятно, что сумма НРСВ — это НРСВ, с sigma = sigma_bonbon / sqrt(12), тогда если Ф (7*sqrt(12)/sigma_bonbon) >= 0.45, нам вообще не нужно отсеивать конфеты! То есть при условии (7*sqrt(12)/sigma_bonbon >=1.65), что дисперсия конфет < 14.696, максимальное отклонение = infinity, потому что нам вообще не надо ничего отфильтровывать.


        1. viktorpanasiuk
          29.09.2015 20:32

          Вы правы) я ошибался) на самом деле действительно при найденной сигма, достаточно конфеткам возникать в интервале от минус бесконечности до плюс, чтобы удовлетворять условиям задачи.


        1. knagaev
          29.09.2015 22:54

          Это стандартная задача статистического контроля.
          Здесь есть генеральная совокупность с определённым математическим ожиданием и дисперсией.
          Если распределение генсовокупности нормально (это можно принять в большинстве случаев с достаточно сильными ограничениями), то задача контроля по выборке определить оценки параметров, то есть, оценку МО и дисперсии.
          Если задано, что коробка должна быть весом 310 с допустимым отклонением 7, то значит 310 — наиболее «правильное» значение и стремиться надо к нему, а ошибку определять полуразмахом допустимого интервала.
          Тогда вес конфеты должен быть тоже 310/12, а не 305/12. Это оценка с максимальным правдоподобием при заданном нормальном распределении независимых несмещённых величин, и по вероятности сходится к ней.
          Иначе получаются слишком экзотичные допущения.


      1. knagaev
        29.09.2015 19:53

        На самом деле я понял в чём идея задачи, но пока не могу сообразить как решить.
        Дело в том, что если мы выбираем максимальное значение допустимого отклонения, то тем самым обрубаем хвосты нормального распределения, и сумма переменных с таким обрубленным распределением ограничена сверху и меньше, чем сумма необрубленных.
        Доверительный интервал отклонения суммы в данном случае будет функцией от значения допустимого отклонения веса конфеты.
        Надо найти максимальное значение отклонения, которое установит требуемый доверительный интервал (+-7 при 0.9).


        1. vics001
          29.09.2015 20:04

          Обрубаем, но если дисперсия конфет изначальна мала, то ничего обрубать не надо и так получится 90% с допустимой погрешностью. В данном случае допустимое отклонение — бесконечность.


          1. knagaev
            29.09.2015 20:06

            Дисперсия конфет задана дисперсией коробки


            1. vics001
              29.09.2015 20:49

              Уже автор согласился) Если дисперсия коробки задана, то где? Функция распределения коробки неизвестна, потому что она как раз зависит от допустимого отклонения.


              1. viktorpanasiuk
                29.09.2015 20:51

                ну из разброса в ±7 и вероятности в 0.9 вы можете найти сигму для коробки. Это же элементарно.


                1. vics001
                  29.09.2015 21:02

                  А кто сказал, что там нормальное распределение? И как-то вы легко спутали процесс с условием. Представьте производственный процесс, вы хотите сказать, что из условий регулятора (а это выпускать +- 7 в 90%), отбрасывая не нужные конфетки вы можете найти сигму для конфеты (а это аппарат). Понятно, что если вы докажите, что коробка нормальное распределение, вы найдете сигму, но вопрос в другом. Процесс и максимально допустимое отклонение зависит от сигмы одной конфеты, а не коробки.


                  1. viktorpanasiuk
                    29.09.2015 21:20

                    Если конфета производится по нормальному распределению и не отбрасывается, то и вес коробок также будет распределен нормально, но со своим сигма и мю. Наша задача подстроить сигму конфеты так, чтобы площадь под кривой распределения для коробок на интервале M-dM… M+dM была равна 0.9


                    1. vics001
                      29.09.2015 21:29

                      Если конфеты не отбрасываются, то вес коробки распределен нормально, а если отбрасываются, то распределиние зависит от 3х параметров.


                      1. viktorpanasiuk
                        29.09.2015 22:09

                        Вот сейчас пытаюсь решить ту же задачу для случая, когда сигма аппарата изготовителя — константа и больше чем 1.2285. Интересно на сколько нужно ограничить разброс, чтобы удовлетворять условию задачи.


                        1. Mrrl
                          29.09.2015 22:16

                          Наихудший случай — 25.833±1.167. Это когда автомат выпускает конфеты только двух масс — 24.667 и 27.000 гр с равной вероятностью.


                        1. vics001
                          29.09.2015 22:41

                          Естественно это параметр, правда, у меня получилось другое число от 1.2285. Надо найти распределение, когда конфеты отсеиваются, то есть F(mean, sigma, threshold) — если оно нормальное, то дальше просто. Можно путем непрерывности функций найти точку, но надо теоретически посчитать это распределение, я пока не нашел.


  1. vics001
    30.09.2015 00:41

    Я, наверное, сдамся, вот что у меня получилось. Вероятность, что погрешность конфеты составляет меньше ?, P( -? <= x <= ?) = 2 * Ф (? / ?) — 1. Обозначим порог отсеивания ?, тогда получаем след. функцию распределения

    F(x | x <= -?) = 0
    F(x | x >= ?) = 1
    F (x | x >= 0) = 1/2 + ( Ф (x / ?)  - 1/2) * ( 1 + 2 * Ф (-? / ?) + (2 * Ф (-? / ?)) ^ 2 + ... = 1/2 + ( Ф (x / ?) - 1/2 ) / (1 - 2 * Ф (-? / ?) ).
    

    Отсюда можно найти плотность распределения:
    f(x | x <= -? || x >= ? ) = 0
    f(x | ... ) = e ^ (- x*x / (2 *?*?) ) / ( ? * sqrt( 2 * ?) *  (1 - 2 * Ф (-? / ?)) ) 
    


    Несмотря на, то что распределение «похоже» на нормальное, оно отнюдь не является нормальным. Говорить о том, что сумма будет нормальной тоже неправильно, несмотря на допущение ЦПТ тут явно влияют параметры ? и ?. К сожалению посчитать сумму этих двух случайных величин не получается. Если получится посчитать численно распределение, то дальнейшее останется делом техники. Найти 90% квантиль = 7, который при заданном ?, максимизирует ?.


    1. viktorpanasiuk
      30.09.2015 09:27

      Да, тут самое сложное найти рещультирующее распределение для коробки, имея обрезанное нормальное для конфеты. Дальше — дело техники.


      1. knagaev
        30.09.2015 11:53

        Результирующее распределение для независимых величин в строгой теории делается по формуле свёртки.
        Но мне вот кажется, что эту задачу можно решить проще.
        А в конце концов, как в первых постах сразу предложили можно решить семплированием.


    1. knagaev
      30.09.2015 10:06

      А почему в формуле вероятности, что погрешность меньше эпсилон, отнимается единица?


  1. Akela_wolf
    01.10.2015 08:44
    +1

    Итак, вроде бы все обсудили. Хотелось бы увидеть ваше решение