Цель работы: на примере статистики регистрации фоновых космических частиц изучить статистические закономерности однородного во времени случайного процесса; проверить возможность описания исследуемого процесса статистическими законами Пуассона и Гаусса; измерить среднее число регистрируемых космических лучей в секунду и определить погрешность результата.
Оборудование: счётчик Гейгера—Мюллера, компьютер с интерфейсом для связи со счётчиком, расчётная программа.
Теоретическая часть по физике
Радиоактивным излучением называют потоки частиц (протонов, электро-нов и позитронов, альфа-частиц, нейтронов и т.п.) или электромагнитных волн (рентгеновского и гамма- диапазона), способных вызывать ионизацию вещества. Основными источниками радиации являются космические лучи и распад радиоактивных веществ, которые в небольших количествах имеются всюду, в том числе в физических приборах и лабораторных помещениях. Это излучение является радиоактивным фоном, с которым складывается излучение других источников, если они присутствуют. Основную часть фона обычно составляет космическое излучение, которое исходно состоит из протонов (85%), альфа-частиц (ядер гелия) (10%), ядер более тяжёлых элементов (<5%) и электронов и позитронов (1%). Также при взаимодействии этих лучей с атмосферой земли рождается разнообразное множество нестабильных частиц (мюоны, пи-мезоны и др.).
В данной работе для регистрации космического излучения используется счётчик Гейгера—Мюллера. Счётчик представляет собой наполненный газом металлический цилиндр с двумя электродами. Одним из электродов (катодом) служит сам корпус. Другим (анодом) является тонкая нить, натянутая вдоль оси цилиндрического корпуса. Необходимое напряжение (400 В) подaётся на счётчик от смонтированного вместе с ним блока питания через повышающий трансформатор. Радиоактивное излучение (космические частицы) ионизует молекулы газа, которым наполнен счётчик, а также выбивает электроны из его стенок. Образовавшиеся электроны, двигаясь в сильном элек-трическом ноле между электродами счётчика, соударяются с молекулами газа, выбивая из них новые — вторичные электроны. Ускоряясь полем, первичный и вторичные электроны снова ионизуют газ, и т.д. В результате об-разуется лавина электронов, и через счётчик протекает кратковременный импульс тока (разряд). Этот импульс и регистрируется электрической цепью установки, оцифровывается платой аналогово-цифрового преобразователя, и информация о нём через USB-интерфейс передаётся на компьютер.
Число зарегистрированных частиц за некоторое время t зависит, вообще говоря, от размеров счётчика, положения и ориентации его в пространстве, от давления и состава газа и от материала стенок счётчика. Однако при фиксированном положении конкретного счётчика их число пропорционально средней интенсивности пронизывающего счётчик ионизирующего излучения. При постоянной фоновой интенсивности общее количество зарегистрированных частиц будет, конечно, пропорционально времени наблюдения t.
Статистическая обработка данных: базовые сведения.
Результат любого физического измерения содержит погрешности, то есть отличается от «истинного» значения измеряемой величины. Погрешности измерений складываются из ошибок, связанных с несовершенством методики измерений и неточностью калибровки приборов (систематические погрешности), и из случайных погрешностей эксперимента, изменяющих свою величину и знак от опыта к опыту. Частным случаем случайных погрешностей являются статистические погрешности, вызываемые случайными колебаниями (флуктуациями) самой измеряемой величины. К числу таких флуктуирующих величин относится и интенсивность космического излучения.
Далее будем для простоты считать, что все прочие погрешности, помимо статистических, пренебрежимо малы и рассматривать их не будем. В рамках нашего опыта это предположение хорошо выполняется.
Пусть при некотором измерении за время ?=10 с зарегистрировано ?? космических частиц. Из этого отнюдь не следует, что в любые следующие 10 с будет регистрироваться те же ?? частиц: в силу случайных причин при этом можно получить ?−1, ?+2 или, вообще говоря, любое другое значение (которое, как правило, всё же не слишком сильно отличается от ?). Поэтому физический смысл имеет не столько результат отдельного измерения, сколько совокупность множества результатов и её усреднённые характеристики.
Наиболее важной характеристикой является среднее число регистрируемых частиц в единицу времени. Если n1, n2, …nN — результаты ? проведён-ных в одинаковых условиях измерений, можно вычислить выборочное среднее значение числа измерений («выборочное», поскольку определяется из ограниченной «выборки» из ? значений):
Если продолжать проводить измерения, можно ожидать, что выборочное среднее будет стремиться к некоторому конечному пределу, который можно назвать «истинным» средним значением числа регистрируемых частиц. В теории вероятностей оно называется «математическим ожиданием» случайной величины:
Стремление выборочного среднего с ростом числа измерений к математическому ожиданию носит название закона больших чисел. На практике, поскольку реальное число измерений всегда конечно, значение среднего никогда не известно точно, поэтому приходится прибегать к приближённому равенству n'=lim 〈?〉≈〈?〉, которое всегда содержит некоторую погрешность.
Кроме среднего значения важно знать, насколько сильно флуктуируют значения ???? от опыта к опыту. Количественно меру флуктуаций принято из-мерять среднеквадратичным (или стандартным) отклонением ??. По определению, средний квадрат отклонения, называемый также дисперсией, (а точнее — выборочной дисперсией), равен что можно короче записать как
что можно короче записать как
Аналогично, при ?→∞ выборочная дисперсия должна стремиться к некоторому предельному («истинному») значению:
Из теории погрешностей известно, что упомянутая выше погрешность среднего значения 〈?〉 при независимых измерениях связана со стандартным отклонением (погрешностью отдельного измерения) формулой ?〈?〉=(??)/√?.(3)
Таким образом, если среднеквадратичное отклонение ?? стремится к конечному пределу при больших ?, погрешность среднего значения убывает с ростом числа измерений как 1/√?. Иными словами, увеличивая количество измерений, среднее значение можно получать со всё более возрастающей точностью, приближаясь к «истинному» n'. А при конечном ? можно записать, что истинное среднее с высокой вероятностью лежит в интервале:
Гистограммы и вероятности
Среднее и дисперсия — это очень важные характеристики, но не дающие полной информации о флуктуирующей величине. Более детальную информацию о ней можно получить, если собрать статистику того, как часто те или иные значения ? встречаются среди многочисленных результатов опыта. Построим график, откладывая по оси абсцисс число частиц, зарегистрированных при измерениях, а по оси ординат — долю случаев (по отношению к общему числу измерений), в которых было зафиксировано данное количество частиц. Например, если некоторое значение ?? встретилось в серии из ? измерений ?? раз, то по вертикали отложим отрезок высотой ??=??/?. Построенный график содержит дискретно расположенные точки, которые для наглядности обычно соединяются между собой, изображая их в виде совокупности вертикальных прямоугольников, как это изображено на рис. 1. Высота прямоугольника равна доле наблюдаемых случаев ?? (иногда вместо доли изображается просто их число ??), а ширина — интервалу значений ?, которому эта доля соответствует (в данному случае столбики имеют единичную ширину). Такой график принято называть гистограммой.
В пределе ?→∞ столбчатая гистограмма будет стремиться к некоторому предельному состоянию. Предельные значения частот ?? называют вероятностями соответствующих событий (того, что в отдельном опыте получится результат ?). Для вероятностей можно строить различные теоретические модели, которые можно проверять на опыте, сравнивая практические гистограммы со значениями, предсказываемыми теорией вероятностей.
При малых ? гистограмма может довольно сильно отличаться от теоретической. По мере роста числа измерений ? пик гистограммы будет приближаться к предельному среднему значению n'. Ширина гистограммы по порядку величины равна среднеквадратичному отклонению ??. Если величина ? близка к n', её вероятность будет максимальна. А при отклонении от ?' на «расстояния», превышающие ?? в несколько раз, вероятность, как правило, быстро падает до нуля.
Пуассоновский процесс
Если случайные события (регистрация частиц) однородны во времени (не меняют своей средней интенсивности), а каждое последующее событие никак не зависит от того, как и когда произошло предыдущее, то последовательность таких событий принято называть пуассоновским процессом.
Для пуассоновского процесса может быть получено теоретическое распределение вероятностей — распределение Пуассона. Математический вывод распределения и его свойства можно найти в любом руководстве по теории вероятностей. Приведём здесь только основные известные результаты.
Вероятности ?? того, что в эксперименте будет обнаружено ? частиц, для распределения Пуассона имеют вид:
где ?!=1⋅2⋅…⋅? — факториал числа n, а n' — основной (и единственный) параметр распределения, совпадающий со средним числом частиц (отметим, что значение n' может быть дробным, тогда как n всегда целые). Примеры графиков функции ??(?) для различных n' приведены на рис.
Видно, что, во-первых, при малых n' график распределения «прижат» к оси ординат и быстро убывает с ростом ?. Кроме того, весьма велика вероятность не обнаружить в отдельном опыте ни одной частицы (?=0). При больших же n' график распределения стремиться к гладкой симметричной кривой, быстро убывающей к нулю при отдалении от центра. Можно строго показать, что при больших n' распределение Пуассона переходит в так называемое нормальное распределение или распределение Гаусса.
Наиболее характерным свойством распределения Пуассона является связь между его дисперсией и средним значением. А именно, для пуассоновского процесса (и только для него!) справедливо равенство ?=√n',(6)
то есть среднеквадратичное отклонение равно корню из среднего. На практике можно ожидать приближённое равенство для выборочных значений: ??≈√〈?〉. Наконец, поскольку отклонения от среднего для такого процесса
не велики, можно ожидать равенство по порядку величины ??∼√?? , где ?? — результат любого отдельного измерения.
Второе характерное свойство заключается в том, что при достаточно больших n' распределение Пуассона приближается к нормальному распределению (распределению Гаусса). Для последнего же известно следующее: примерно в 2/3 случаев (с вероятностью 68%) отдельное измерение отличается от среднего значения не более, чем на одно средне-квадратичное отклонение (±?), с вероятностью 95% — не более чем на ±2?, и, наконец, вероятность отклонения в пределах ±3? равна 99,7%.
Эти два простых свойства можно использовать для проверки того, насколько хорошо реальный случайный процесс регистрации космических частиц соответствует идеализированной теоретической модели пуассоновского процесса.
Погрешность эксперимента
Рассмотрим опыт, в котором интервал измерения ? разбит на ?=?/? промежутков, длительностью ?. В качестве основного результата опыта нас прежде всего интересует среднее число частиц n'≈〈?〉, регистрируемое за время ?. Подставим основное свойство распределения Пуассона (6) в формулу (3). Получим среднеквадратичную погрешность определения среднего:
Обычно больший интерес представляет не абсолютное, а относительное значение погрешности. Для него находим:
знаменателе (7′) оказывается полное число частиц ?Σ=〈?〉?=Σ??, зарегистрированных за всё время измерений ?. То есть относительная погрешность всего опыта не зависит от интервалов ? разбиения серий, и убывает обратно пропорционально корню из общего числа частиц ?Σ. Этого, конечно, и следовало ожидать, так как все измерения вместе составляют одно более продолжительное измерение, в котором зарегистрировано Σ??=?Σ отсчётов.
Таким образом, единственный способ увеличить точность опыта — увеличивать общее число регистрируемых частиц ?Σ за счёт увеличения совокупного времени измерений ?. Например, для достижения точности измерения интенсивности фона в ?=1% необходимо зарегистрировать в общей сложности не менее 1/(0.012)=104 частиц.
Ход работы эксперимента
Включаем компьютер и счетчик. В программе запускаем измерение для основного
эксперимента.Запускаем симуляцию с настройками по умолчанию (распределение Пуассона, интенсивность —- 1.0, ускорение – 10). Убеждаемся, что в зависимости от количества
N собранных экспериментальных точек:
a) Флуктуации среднего числа зарегистрированных частиц ⟨n⟩ уменьшаются, значение выходит на постоянную величину (рис. 2);
b) Флуктуации среднеквадратичного отклонения σn уменьшаются, значение выходит на постоянную величину (рис. 3);
c) σn и √⟨n⟩ всё больше приближаются друг к другу (рис. 4);
d) Степень совпадения экспериментальной гистрограммы с теоретическими кривыми у распределения Пуассона выше, чем у распределения Гаусса (рис. 4).-
Рассмотрим как изменяются гистограммы для параметра группировки результатов
τ = 10; 20; 80:t=1 c:
t=10 c:
t=20 c:
t=80 c:
При изменении порядка группировки результатов t максимальная доля случаев уменьшается (в силу увеличения количества групп). График распределения Гаусса и Пуассона
принимает более округлый вид.
Рассмотрим как изменяются гистограммы для параметра средней интенсивности
числа частиц μ = 1; 5; 10; 20; 40; 80; 100.
При изменении порядка группировки результатов μ максимальная доля случаев умень-
шается (в силу увеличения количества групп). График распределения Гаусса и Пуассона
принимает более округлый вид.
Обработка результатов.
После получения текстового файла с данными, где на каждой строке написано число, отображающее количество регистрируемых частиц в секунду. Для основного эксперимента сгруппируем данные с различными интервалами группировки τ=10;20;40;80 c.
Для каждого τ вычислим среднее число регистрируемых частиц ⟨n⟩:
⟨n⟩ |
Значение |
⟨n10⟩ |
13.67 |
⟨n20⟩ |
27.34 |
⟨n40⟩ |
54.69 |
⟨n80⟩ |
109.38 |
Для каждого τ вычислим среднеквадратичное отклонение σn:
σn |
Значение |
σn10 |
3.86 |
σn20 |
5.42 |
σn40 |
7.43 |
σn80 |
10.26 |
Для каждого τ вычислим погрешность среднего значения σ⟨n⟩:
Для каждого τ вычислим среднюю интенсивность регистрируемых частиц в секунду
j:
j |
σj |
τ |
1.37 |
0.02 |
10 |
1.37 |
0.02 |
20 |
1.37 |
0.02 |
40 |
1.37 |
0.02 |
80 |
Можно заметить, что средняя интенсивность регистрируемых частиц в секунду не за-
висит от величины интервала τ и числа точек N = t/τ
Наложим поверх экспериментальных гистограмм теоретические распределения Пуассона и Гаусса.
Экспериментальные гистограммы с большой точностью согласуются с распределения-
ми Пуассона и с несколько меньшей точностью с распределением Гаусса.
Определим доли случаев, когда отклонение числа отсчётов n от среднего значения не
превышает (по модулю) одного, двух и трёх стандартных отклонений:
Для t = 10 с:
Эмпирическая доля случаев, когда |n - ⟨n⟩| ≤ 1σ: 0.71 (Теоретическая: 0.68)
Эмпирическая доля случаев, когда |n - ⟨n⟩| ≤ 2σ: 0.96 (Теоретическая: 0.95)
Эмпирическая доля случаев, когда |n - ⟨n⟩| ≤ 3σ: 0.99 (Теоретическая: 1.00)
Для t = 20 с:
Эмпирическая доля случаев, когда |n - ⟨n⟩| ≤ 1σ: 0.74 (Теоретическая: 0.68)
Эмпирическая доля случаев, когда |n - ⟨n⟩| ≤ 2σ: 0.97 (Теоретическая: 0.95)
Эмпирическая доля случаев, когда |n - ⟨n⟩| ≤ 3σ: 0.99 (Теоретическая: 1.00)
Для t = 40 с:
Эмпирическая доля случаев, когда |n - ⟨n⟩| ≤ 1σ: 0.68 (Теоретическая: 0.68)
Эмпирическая доля случаев, когда |n - ⟨n⟩| ≤ 2σ: 0.96 (Теоретическая: 0.95)
Эмпирическая доля случаев, когда |n - ⟨n⟩| ≤ 3σ: 0.99 (Теоретическая: 1.00)
Для t = 80 с:
Эмпирическая доля случаев, когда |n - ⟨n⟩| ≤ 1σ: 0.68 (Теоретическая: 0.68)
Эмпирическая доля случаев, когда |n - ⟨n⟩| ≤ 2σ: 0.94 (Теоретическая: 0.95)
Эмпирическая доля случаев, когда |n - ⟨n⟩| ≤ 3σ: 1.00 (Теоретическая: 1.00)
Можно сделать вывод, что при достаточно больших n' распределение Пуассона прибли-
жается к нормальному распределению (распределению Гаусса)
Код.
Код для создания гистограммы частоты от сумм сгруппированных значений:
import numpy as np
import matplotlib.pyplot as plt
# Шаг 1: Чтение данных из файла
with open('data.txt', 'r') as f:
data = np.array([float(line.strip()) for line in f if line.strip()])
# Интервалы группировки
intervals = [10, 20, 40, 80]
# Гистограммы и частоты
plt.figure(figsize=(12, 8))
width = 1.0 # Ширина столбиков
for t in intervals:
# Шаг 2: Группировка и суммирование
num_groups = len(data) // t
grouped_data = np.array([sum(data[i * t:(i + 1) * t]) for i in range(num_groups)])
# Шаг 3: Вычисление частот
values, counts = np.unique(grouped_data, return_counts=True)
# Построение гистограммы
plt.bar(values + (0.2 * intervals.index(t)), counts, width=0.2, label=f'Interval = {t}s')
# Настройка меток и заголовка
plt.xlabel('Суммы сгруппированных значений')
plt.ylabel('Частота')
plt.title('Гистограммы частот сумм сгруппированных значений')
plt.xticks(rotation=45)
plt.legend()
plt.grid(axis='y')
# Отображение графика
plt.show()
Код, который находит средее число регистрируемых частиц, вычислим среднеквадратичное отклонение, погрешность среднего значения, среднюю интенсивность регистрируемых частиц в секунду и её погрешность:
import numpy as np
import matplotlib.pyplot as plt
# Загрузка данных
data = np.loadtxt('data.txt')
# Определение интервалов группировки
time_intervals = [10, 20, 40, 80] # в секундах
# Функция для группировки и вычисления статистики
def calculate_statistics(data, t):
n_groups = len(data) // t
grouped_data = np.array([np.sum(data[i*t : (i + 1)*t]) for i in range(n_groups)])
# Подсчитываем частоту уникальных значений
unique, counts = np.unique(grouped_data, return_counts=True)
frequencies = dict(zip(unique, counts))
# Вычисляем среднее значение записанных частиц
average_n = np.sum([n * frequencies[n] for n in frequencies]) / np.sum(counts)
# Вычисляем стандартное отклонение
variance = np.sum([(n - average_n) ** 2 * frequencies[n] for n in frequencies]) / np.sum(counts)
stddev_n = np.sqrt(variance)
# Погрешность среднего значения
N = n_groups # число групп
error_mean = stddev_n / np.sqrt(N) if N > 0 else 0
return frequencies, average_n, stddev_n, error_mean
# Создаем фигуру для гистограмм
plt.figure(figsize=(12, 8))
# Обрабатываем каждый интервал
average_values = []
stddev_values = []
error_values = []
intensity_values = []
error_intensity_values = []
for i, t in enumerate(time_intervals):
frequencies, average_n, stddev_n, error_mean = calculate_statistics(data, t)
average_values.append(average_n)
stddev_values.append(stddev_n)
error_values.append(error_mean)
# Вычисляем среднюю интенсивность и её погрешность
average_intensity = average_n / t
error_intensity = error_mean / t
intensity_values.append(average_intensity)
error_intensity_values.append(error_intensity)
# Сортируем по ключам (числам)
n_values = sorted(frequencies.keys())
w_values = [frequencies[n] for n in n_values]
# Строим гистограмму
plt.subplot(2, 2, i + 1) # 2 строки, 2 колонки
plt.bar(n_values, w_values, width=0.8, alpha=0.7)
plt.title(f'Гистограмма (t = {t} с)')
plt.xlabel('Число отсчетов n')
plt.ylabel('Частота w(n)')
plt.ylim(0, max(w_values) + 1)
# Показываем графики
plt.tight_layout()
plt.show()
# Выводим средние значения, стандартные отклонения, погрешности и интенсивность
for i, t in enumerate(time_intervals):
print(f'Среднее число регистрируемых частиц ⟨n⟩ при t = {t} с: {average_values[i]:.2f}')
print(f'Среднеквадратичное отклонение σn при t = {t} с: {stddev_values[i]:.2f}')
print(f'Погрешность среднего значения σ⟨n⟩ при t = {t} с: {error_values[i]:.2f}')
print(f'Средняя интенсивность ⟨I⟩ при t = {t} с: {intensity_values[i]:.2f} частиц/с')
print(f'Погрешность интенсивности σ⟨I⟩ при t = {t} с: {error_intensity_values[i]:.2f} частиц/с')
Код, который определяет доли случаев, когда отклонение числа отсчётов n от среднего значения не превышает (по модулю) одного, двух и трёх стандартных отклонений:
import numpy as np
import matplotlib.pyplot as plt
# Загрузка данных
data = np.loadtxt('data.txt')
# Определение интервалов группировки
time_intervals = [10, 20, 40, 80] # в секундах
# Функция для группировки и вычисления статистики
def calculate_statistics(data, t):
n_groups = len(data) // t
grouped_data = np.array([np.sum(data[i * t: (i + 1) * t]) for i in range(n_groups)])
# Подсчитываем частоту уникальных значений
unique, counts = np.unique(grouped_data, return_counts=True)
frequencies = dict(zip(unique, counts))
# Вычисляем среднее значение и стандартное отклонение
average_n = np.mean(grouped_data)
stddev_n = np.std(grouped_data)
return grouped_data, average_n, stddev_n
# Обрабатываем каждый интервал
for t in time_intervals:
grouped_data, average_n, stddev_n = calculate_statistics(data, t)
# Расчет доли случаев
num_cases = len(grouped_data)
within_1_std = np.sum(np.abs(grouped_data - average_n) <= stddev_n)
within_2_std = np.sum(np.abs(grouped_data - average_n) <= 2 * stddev_n)
within_3_std = np.sum(np.abs(grouped_data - average_n) <= 3 * stddev_n)
fraction_1_std = within_1_std / num_cases
fraction_2_std = within_2_std / num_cases
fraction_3_std = within_3_std / num_cases
# Теоретические доли для гауссовского распределения
theoretical_fraction_1_std = 0.68
theoretical_fraction_2_std = 0.95
theoretical_fraction_3_std = 0.997
# Вывод результатов
print(f'Для t = {t} с:')
print(
f' Эмпирическая доля случаев, когда |n - ⟨n⟩| ≤ 1σ: {fraction_1_std:.2f} (Теоретическая: {theoretical_fraction_1_std:.2f})')
print(
f' Эмпирическая доля случаев, когда |n - ⟨n⟩| ≤ 2σ: {fraction_2_std:.2f} (Теоретическая: {theoretical_fraction_2_std:.2f})')
print(
f' Эмпирическая доля случаев, когда |n - ⟨n⟩| ≤ 3σ: {fraction_3_std:.2f} (Теоретическая: {theoretical_fraction_3_std:.2f})')
Вывод.
В ходе выполнения работы познакомился с основными понятиями статистики. Определено
среднее число регистрируемых космических лучей в секунду и определил погрешность
результата. Выяснил, что средняя интенсивность регистрируемых частиц в секунду не
зависит от величины интервала τ и числа точек N = t/τ . Проверил возможность описания
исследуемого процесса статистическими законами Пуассона и Гаусса.
Комментарии (3)
Nergal2004
03.10.2024 10:19"Стремление выборочного среднего с ростом числа измерений к математическому ожиданию носит название закона больших чисел. "
Полнейшая глупость. Выборочное среднее существует всегда. В отличии от матожидания.
Physmat Автор
03.10.2024 10:19Где в комментированной части, написано о существовании? Приведите правильный аргумент.
Vasilenko_Ilia
лол, завтра лабу сдавать