Продолжаю тему ляпов и загогулин, начатую в статье “Ляпы учебников и курьезы учебы”. Напоминаю определения:
  • Ляп – явная или завуалированная ошибка, не носящая, впрочем, фундаментального характера, так что помучившись можно её исправить.
  • Загогулина – фраза, тема, изложенная так, что для ее понимания требуется поломать голову(обычную, не гения и не таланта).


1. Что такое простота формулы?


Возьмем книгу “Теория вероятностей. Основные понятия. Предельные теоремы. Случайные процессы», Ю.В.Прохоров, Ю.А.Розанов,”Наука”, 1967.
Цитирую текст на стр 14:
“Формула Стирлинга. Во всех приведенных выше формулах встречается выражение $n!=n(n-1)…1$. Непосредственное вычисление такого произведения при больших n весьма трудоемко. Существует сравнительно простая формула, дающая приближенное значение для n!, называемая формулой Стирлинга: при больших n

$n! \backsim \sqrt{2?n}n^n e^{-n}$


Подобная фраза встречается и в других книгах и в интернете.

Я, что-то не пойму, чем формула Стирлинга проще определяющей формулы $n!=n(n-1)…1$. В каком отношении проще? Как упорядочивать формулы по простоте? Так как ключевая фраза была “Непосредственное вычисление такого произведения при больших n весьма трудоемко”, то естественно предполагать большую простоту в смысле меньшего количества вычислений. Хорошо, подойдем с этой стороны. Сравним формулы с позиции числа элементарных операций(с точки зрения компьютера) в той и другой формулах. В формуле $n!=n(n-1)…1$ есть n умножений. В формуле Стирлинга мы имеем операции:
  • $\sqrt{2?n}$ – два умножения и одно извлечение корня. Извлечение корня это не элементарная операция, а ее реализация требует вычислительного цикла и тем длиннее, чем большая требуемая точность вычислений.
  • $n^n$ — n умножений. $n^n=nnn…n$. Ведь не будем же мы лукавить, что это одна операция. В таком случае можно сказать, что и n! одна операция. По крайней мере, ни в одном компьютере ни степень, ни показательная функция не есть элементарные операции.
  • $e^{-n}$ — это также не элементарная операция, а ее реализация требует вычислительного цикла и тем длиннее, чем большая требуемая точность вычислений.

Самое забавное то, что $n^n=nn…n$ объявляется проще $n!=n(n-1)…1$. С любых точек зрения на простоту, после такого уже можно и не рассуждать далее.
Итак, ясно, что с точки трудоемкости вычислений формула Стирлинга никак не проще определяющей формулы.
Так зачем тогда нужна формула Стирлинга? Универсального ответа нет. И он не сводится к простоте вычислений. Все зависит от ситуации. Например, вряд ли для упрощения выражения $N!/(N-1)!$ нужно применять формулу Стирлинга. Определяющая формула сразу дает $N!/(N-1)!=N$.
Вообще, если мы имеем тождество типа формула1?формула2, то иногда формулу1 выгодно заменить формулой2, а иногда наоборот.
В некоторых ситуациях применение формулы Стирлинга приводит к очевидным сокращением членов формулы куда она входит, что трудно увидеть, если применять определяющую формулу. По крайней мере, в статистической физике это так. Там все фундаментальные величины выражаются через статистический вес, формулы для которого так и мельтешат факториалами. А вот, энтропия, например, выражается через натуральный логарифм числа состояний. Вот тут и начинает играть роль формы, в данном случае представление факториала через степень:
$ln?(n!) \backsim nln(n/e)$

А вот пример применения формулы Стирлинга, взятый из Фихтенгольца(т.2):



2. Подвох обозначений


Возьмем учебник “Физика элементарных частиц”, автор Н.Ф.Нелипа, Москва, “Высшая школа”,1977. На странице 19 записана связь импульсного и координатного представлений:

$$display$$?(x)=(1/(2?)^2) ?dpe^{-ipx}?(p) \ \ \ \ (1)$$display$$



Мы видим, что формула содержит и справа ? и слева ?. Если это тождество, то глядя на эту формулу, не сильно искушенный человек может сделать вот какие выводы.
Возьмем ?(x)=1
Тогда из (1) имеем

$1=(1/(2?)^2) ?dpe^{-ipx}1$



Получили “замечательное" разложение единицы. Или, аналогично,

$sin(x) =(1/(2?)^2) ?dpe^{-ipx}sin(p)$



Все это это явно бред. Так в чем же дело?
Или, может быть, соотношение (1) следует трактовать как уравнение типа $x^2=bx$?
Смотрим другие книги. Вот еще одна “Физика элементарных частиц”, автор Газиорович, Москва, “Наука”,1969. На странице 20 имеем формулу

$$display$$?(x)=(1/(2?)^2) ?dpe^{-ipx} ? ?(p) \ \ \ \ (2)$$display$$


Вздыхаю с облегчением. Это же просто связь координатного и импульсного представлений и дается оно с точки зрения математики разложением Фурье. Здесь ? и ? ? разные функции. А как же тогда формула (1) Нелипы? С точки зрения математики она неверна. Если ? функция, то и ?(x) и ?(p) это все одна функция. Я долго мучился (“Не может ведь автор не заметить такого. Значит, дело хитрее”) и потом нашел оправдание с точки зрения физики. Вот оно:
?(x) и ?(p) это не одинаковые функции, это одно и то же поле ?, взятое в разных представлениях. Поле одно, а его представление разное. Вид представления задается буквой в скобках. Мы акцентируемся на том, что поле не меняется. Меняется представление. Вот я и успокоил себя. Но, господа авторы, Вы пишете учебник. объясните простым смертным что к чему. А то читателю приходится подыскивать оправдания автору.

Далее, обращаюсь к советской квантовой классике “Введение в теорию квантованных полей”, авторы Н.Н.Боголюбов и Д.В.Ширков, Наука, Москва, 1973. Страница 28.

$$display$$?(x)=(1/(2?)^{3/2}) ?dke^{-ikx}? ? (k) \ \ \ \ (3)$$display$$


Отлично. И у вышеупомянутого Газиоровича аналогично. Но, смотрим дальше. Цитирую:
« …находим, что функция ? ?(k) удовлетворяет уравнению

$(k^2-m^2 ) ? ? (k)=0$


И, поэтому, может быть представлена в виде

$$display$$? ? (k)=?(k^2-m^2 )?(k)$$display$$


И, далее, говорится, что с учетом этого разложение (3) примет вид

$$display$$?(x)=(1/(2?)^{3/2}) ?dke^{-ikx} ?(k^2-m^2 )?(k) \ \ \ \ (4)$$display$$


Опять вернулись к представлению ? через ?. От понятного Газиоровича пришли к непонятному Нелипе. Как это понимать? Это уравнение? Я думаю, что и здесь нужно дать интерпретацию, похожую для случая Нелипы, приведенную выше.
Вот уж это, действительно, загогулина. Почему-то эта загогулина встретилась мне только в книгах советских авторов.
И еще вернусь к автору Нелипа. Берем его книгу “Физика элементарных частиц. Калибровочные поля”. Книга рекомендована как учебное пособие. Это обязывает учебник как можно меньше делать всякого рода умолчаний. Не нужно заставлять студента долго думать над разгадыванием умолчаний. Ему и так трудно. Однако берем формулу (1.2.14) и предваряющий её текст:
Матрицы $?_k$ удовлетворяют следующим коммутационным соотношениям(алгебра Ли):

$$display$$[?_k,?_j ]_-=2if_{kjn} ?_n, Sp?_i ?j_k=2?_{ij} \ \ \ \ (1.2.14) $$display$$


И ни слова не говорится, что по n подразумевается суммирование. Этого нет ни в предисловии ни в основном тексте. И подобного рода формул в книге очень много.
Более того, в предисловии говорится:
“Скалярное произведение двух четырехмерных векторов записывается в виде $inline$(ab)=a_? b_?=a_0b_0-a_1b_1-a_2b_2-a_3b_3=a_0b_0-(\textbf{a}\textbf{b})$inline$
Применять это правило к (1.2.14) или нет? Там повторяются индексы, но там нет четырехмерных векторов.
А все потому, что Нелипа решил не различать контравариантные и ковариантные векторы и, тем самым, избавиться от верхних индексов. Они отличали контравариантный вектор(обычный вектор) от ковариантного(ковектор, форма). Обычно верхний индекс говорил о контравариантности, а нижний о ковариантности. Тогда, соблюдая правило Эйнштейна и учитывая, что $inline$a_?=g_{??} a^?, g_{??}=diag\{1,-1,-1,-1\} $inline$ имеем $inline$a_? b^?=a_0 b^0+a_1 b^1+a_2 b^2+a_3 b^3=a_0 b_0-a_1 b_1-a_2 b_2-a_3 b_3$inline$

В общем, я перестал читать книги Нелипы.


3. Большая загогулина измерений


$\ \ \ $ 3.1. Дирак


Читаем его «Принципы квантовой механики»:
Когда мы измеряем вещественную динамическую переменную A, то возмущение, вызванное актом измерения, вызывает скачок в состоянии динамической системы. Если мы производим второе измерение той же самой динамической переменной A непосредственно после первого измерения, то вследствие физической непрерывности результат второго измерения должен быть тот же, что и результат первого. Таким образом, после того как произведено первое измерение, в результатах второго нет никакой неопределенности. Поэтому после того, как произведено первое измерение, система находится в собственном состоянии динамической переменной a, а собственное значение, к которому это состояние относится, равно результату первого измерения. Это утверждение остается справедливым и в том случае, если второе измерение фактически не производилось. Таким образом, мы видим, что измерение всегда вызывает скачок системы в собственное состояние той динамической переменной, измерение которой производилось, а собственное значение, к которому относится это собственное состояние, равно результату измерения


$\ \ \ $ 3.2. Ландау


Читаем его «Квантовая механика. Нерелятивистская теория»:
Если электрон находился в состоянии $\Psi_n(q)$, то произведенное измерение величины $f$ обнаружит с достоверностью значение $f_n$. Но после измерения электрон окажется в состоянии $?_n(q)$, отличном от исходного, в котором величина $f$ уже вообще не имеет какого-либо определенного значения. Поэтому, произведя над электроном непосредственно вслед за первым повторное измерение, мы получили бы для $f$ значение, не совпадающее с обнаруженным в результате первого измерения. Для предсказания( в смысле вычисления вероятности) результата повторного измерения при известном результате первого измерения надо от первого измерения взять волновую функцию $?_n(q)$ созданного им состояния, а от второго – волновую функцию $\Psi_n(q)$ того состояния, которое нас интересует. Это означает следующее.
Из уравнений квантовой механики определяем волновую функцию $?_n(q,t)$, которая в момент времени первого измерения равна $?_n(q)$. Вероятность m-го результата второго измерения, произведенного в момент времени t, дается квадратом модуля интеграла $? ?_n(q, t)\Psi^*_m(q)dq$.
Мы видим, что процесс измерения в квантовой механике имеет двуликий характер – его роль по отношению к прошлому и будущему не совпадает. По отношению к прошлому оно верифицирует вероятности различных возможных результатов, предсказываемых по состоянию, созданному предыдущим измерением. По отношению же к будущему, оно создает новое состояние. В самой природе процесса измерения заложена, таким образом, глубокая необратимость. Она вносит в квантовые явления физическую неэквивалентность обоих направлений времени, т.е. приводит к появлению различия между прошлым и будущим.


$\ \ \ $ 3.3. Блохинцев


Читаем его «Основы квантовой механики»:
Измерительные приборы, определяющие различные полные наборы, следует рассматривать как “системы отсчета”, с помощью которых фиксируется состояние квантового ансамбля.
Измерение величины из первоначального ансамбля с неопределенным значением наблюдаемой выбирает подансамбли с определенным значением наблюдаемой, которые характеризуются собственными функциями наблюдаемой.
Первоначальное состояние переходит в одно из собственных состояний измеряемой величины. Это изменение волновой функции называют редукцией(сведением) волнового пакета. Физически редукция означает, что после измерения частица оказывается принадлежащей к новому чистому ансамблю.
Весь ансамбль, возникший в результате измерений характеризуется серией волновых функций с соответствующими вероятностями, т.е. является смешанным.
Это превращение чистого ансамбля в смешанный есть не что иное как практическое осуществление спектрального разложения исходного ансамбля в спектр по чистым ансамблям, которые собирает прибор.
Классический измерительный прибор есть не что иное, как спектральный анализатор квантовых ансамблей, с помощью которых и изучается их природа.


$\ \ \ $ 3.4. Сасскинд


Читаем его “Квантовая механика. Теоретический минимум”.
…экспериментальная физика не имеет дела с измерением векторов состояния. Она имеет дело с измерением наблюдаемых. Даже если точно известен вектор состояния, нельзя знать результат любого заданного измерения. Тем не менее, будет корректно утверждать, что между наблюдениями состояние системы изменяется строго определенным образом согласно зависящему от времени уравнению Шрёдингера. Но когда выполняется измерение происходит нечто иное. Эксперимент по измерению $L$ будет иметь непредсказуемый исход но после того как измерение выполнено система останется в собственном состоянии $L$. В каком из собственных состояний? В том которое соответствует исходу измерения. Но этот исход непредсказуем. Отсюда следует, что во время эксперимента состояние системы непредсказуемо изменяется переходя к одному из собственных состояний наблюдаемой которую подвергают измерению. Это явление называется коллапсом волновой функции.
Это можно выразить иначе. Пусть вектор состояния перед самым измерением $L$ равен

$|\Psi> = ?_i\alpha_i |\lambda_i>$



Случайно с вероятностью $|\alpha_j |^2$ прибор измеряет значение $\lambda_j$ и оставляет систему в одном собственном состоянии $L$, а именно в $|\lambda_j>$. Вся суперпозиция состояний коллапсирует до единственного члена.
Этот странный факт (то что система одним способом эволюционирует между измерениями и другим способом — во время измерения) десятилетиями был источником разногласий и недоразумений. Возникает вопрос не должен ли сам акт измерения описываться законами квантовой механики?
Ответ на этот вопрос утвердительный. Законы квантовой механики не нарушаются во время измерения. Однако для анализа самого процесса измерения как квантовомеханической эволюции мы должны рассматривать экспериментальную установку включая прибор как часть единой квантовой системы.


$\ \ \ $ 3.5. Фейнман


У Фейнмана есть, на мой взгляд, лучший в общем курсе физики учебник по квантовой механике. Это великолепная книга “Квантовая механика”. Однако в ней он нигде не интерпретирует результаты измерения. Но там обнаружились свои загогулины, которые привели меня в тупик. Но об этом в другой раз.

$\ \ \ $ 3.6. Вихман


У него есть книга “Квантовая физика”, которая входит в отличный Берклеевский курс физики. Вот цитата из параграфа “Можно ли в принципе предсказать исход каждого измерения?”
Установление статистического характера всех предсказаний, даже в случае чистого ансамбля, было существенным шагом в развитии физической теории. Возвращаясь к ранней истории квантовой физики, мы замечаем, что идея о вероятностном описании физических явлений была для физиков очень трудной и непривычной. Двойная природа света, который обнаружил свойства волны и частицы, казалась весьма смущающим открытием. Оно получило название «дуализма» волн и частиц. В гл. 4 мы показали, что этот дуализм может быть ясно понят, но на ранней стадии квантовой физики ситуация была иной. Никому не приходило в голову интерпретировать квадрат амплитуды волны в понятиях вероятностей, а без этой идеи, которая представляет собой радикальный отход от классической физики, «дуализм» света не может быть понят.
Существование принципиального предела для нашей возможности предсказать будущие явления было воспринято многими, особенно нефизиками, настроенными философски, как весьма глубокая и революционная идея. По этому поводу неизбежно было написано достаточно нелепостей (как и по поводу соотношения неопределенностей), авторы которых делали далеко идущие выводы о влиянии квантовой механики на человеческие дела вообще.
Нельзя отрицать, что вопрос о предсказуемости и непредсказуемости в принципе может вызывать большой интерес у философов. Следует, однако, заметить, что в настоящее время физики уделяют этой стороне дела очень мало внимания. Не будет ошибкой считать, что большинство из них возвращается к теории измерений в квантовой механике лишь при необходимости прочесть вводный курс на эту тему


$\ \ \ $ 3.7. Обсуждение


Итак, имеем две альтернативные точки зрения:
  1. Если измеряя наблюдаемую $A$ мы получили результат $a_j$, то после измерения система находится в состоянии $|a_j>$. Это, так называемый проекционный постулат. Название происходит вот откуда. До измерения вектор состояния можно представить в виде $|\Psi> = ?_ic_i |a_i>$. А после измерения имеем $|\Psi'> = |a_j>$. Или, выражаясь математически, измерение проецирует исходный вектор $|\Psi>$ на одну из осей(ось j в данном случае), пронумерованных индексом i, в разложении $|\Psi> = ?_ic_i |a_i>$
  2. Если измеряя наблюдаемую $A$ мы получили результат $a_j$, это отнюдь не означает, что то после измерения система находится в состоянии $|a_j>$. Но это состояние можно определить, решая уравнение Шредингера, описывающее взаимодействие прибора и измеряемой системы.

И еще альтернатива:
a) Между измерениями вектор состояния изменяется детерминированно в соответствии с уравнением Шредингера. При измерении вектор состояния коллапсирует недерминированным образом. Это постулат недетерминированной редукции.
b) Между измерениями вектор состояния изменяется детерминированно в соответствии с уравнением Шредингера. И при измерении вектор состояния изменяется дерминированным образом в соответствии с уравнением Шредингера, в которое вводится гамильтониан взаимодействия измеряемой системы и измерительного прибора.

Почему различные интерпретации не мешают применениям квантовой механики?
А потому, что все рассмотренные в учебниках примеры имеют дело с эволюцией от приготовления до измерения. А она описывается уравнением Шредингера.

А теперь кто прав? Я думаю, что прав Ландау, придерживающийся альтернатив 2. и b).
Далее будут применяться такие обозначения: $A$ -наблюдаемая физическая величина, $a$ — результат измерения наблюдаемой $A$, $|a>$ — собственный вектор наблюдаемой $A$, отвечающий собственному значению $a$.
Вот некая аргументация приведенного утверждения о том кто прав.

$\ \ \ \ \ \ $ 3.7.1. Отрицание проекционного постулата


Если измеряя наблюдаемую $A$, мы получили результат $a$, то это больше ничего и не значит, кроме того, что мы получили $a$. Это не значит, что после измерения система находится в состоянии $|a>$. Это ничего не говорит и о том в каком состоянии система была до измерения. Но если при многократном измерении величины $A$ над приготовленным ансамблем статистика дает значение $a_i$ c частотой $c_ic^*_i$ — то ансамбль до измерения описывается волновой функцией
$|\Psi> = ?_ic_i|a_i>$

где $A|a_i> =a_i|a_i>$
После измерения он будет описываться другой волновой функцией, которая находится как решение уравнения Шредингера записанного для взаимодействия прибор+объект.
Если мы решаем задачу взаимодействия микросистемы и классической макросистемы, то естественно прибегнуть к уравнению Шрёдингера и, на каком-то этапе, привлечь свойство классичности макросистемы. И вдруг мы узнаем, что макросистема есть прибор-измеритель характеристики микросистемы и, значит тогда по копенгагенской трактовке уравнение Шрёдингера неприменимо. Это как то нефизично. Возьмем, например, расчёт траектории высокоэнергетического электрона пролетающего через пузырьковую камеру в магнитном поле частицы (визуализатор траектории). Если мы дадим решать физику задачу о движении электрона высокой энергии в переохлажденной жидкости находящейся в магнитном поле, то он начнет думать как применить квантовую механику, чем пренебречь … в общем, начнет решать задачу. И что если ему объявить, что он обсчитывает процесс измерения и он, вспомнив копенгагенскую трактовку вскрикнет, что мол тут все происходит скачком и это не подвластно уравнению Шрёдингера и значит считать нечего … Не поверю…
В общем то, разные интерпретации измерения не мешали развивать квантовую механику, где рассматривались только процессы подчиняющиеся динамическому уравнению квантовой механики. Что получалось после измерения, это было неважно. Но вот в последние годы заговорили о нелокальности квантовой механики. И это как раз связано с интерпретацией измерения. Если измерение создает состояние, то при измерении подсистемы спутанной системы, автоматически измеряется и значение наблюдаемой и второй неизмеряемой подсистемы. А так как измерение создает состояние, то мы получаем мгновенное создание состояния второй подсистемы. Пусть даже вторая подсистема разошлась с первой на световые годы. Вот такой парадокс. Он не возникает, если придерживаться точки зрения, что измерение не создает, а обнаруживает. Как в классике. Но в классике обнаруженное состояние им и останется в ближайшее время – с его начинается старт динамики с обнаруженным начальным условием. В квантовой механике после измерения будет совсем другое состояние, неизвестное в общем случае. Если это измерялась координата и измеряемая система не исчезла, то по специальной теории относительности, координата не изменится сильно за малое время. А если импульс, то после измерения он может быть каким угодно другим. Все зависит от процесса измерения: измерение через комптон-эффект, измерение по кривизне траектории в магнитном поле и т.д. – после каждого из них будет, вообще говоря, разный результат.
Далее, постулат редукции дает легкий способ приготовления вектор-состояния, являющийся собственным вектором наблюдаемой $A$. Достаточно измерить $A$. Не слишком ли просто?
Пусть мы измеряем $A$ и получаем значение $a$. Если придерживаться проекционного постулата, то после измерения система находится в состоянии $|a>$. Значит, если мы проведем повторное измерение $A$, то получим $a$. А по постулату редукции система после измерения будет в $|a>$. И т.д. Это значит, что бесконечная серия измерений $A$ будет нам давать значение $a$ и состояние $|a>$. Не странно ли? Мне кажется, что странно.

$\ \ \ \ \ \ $ 3.7.2. Отрицание недетерминированной редукции


Здесь отрицание носит не столько физическое, сколько гносеологическое. Если акт измерения не подчиняется уравнению Шредингера, это вносит некий дуализм в квантовую механику как теорию. С одной стороны, до измерения вектор состояния изменяется детермининированно, а во время измерения с ним делается неизвестно что и, причем, это неизвестно что является некоей вещью в себе, недоступной для теории. С этой точки зрения даже механика Ньютона более последовательна. Она все объясняло детерминированно.

$\ \ \ $ 3.8. Резюме


Измерение наблюдаемой можно представить в две стадии:
Приготовление. Его выход – измеряемый ансамбль
Измерение. Его выход – значение измеряемой величины и некое новое состояние нового ансамбля

$\ \ \ \ \ \ $ 3.8.1. Приготовление


Приготовительный прибор приготавливает систему в определенном состоянии. То, что это так, проверяется измерительным прибором и проверяется статистически – целой серией измерений над приготовленным ансамблем. Примеры приготовительных приборов: призма, приготовляющая смесь чистых состояний – света, определенной длины; прибор Штерна-Герлаха – это “призма” для частиц со спином; ускоритель элементарных частиц; телескоп. Приготовительный прибор не измеряет. Между входом и выходом система подчиняется уравнению Шредингера, в котором учтено взаимодействие системы и приготовительного прибора. В приборе Штерна-Герлаха это взаимодействие магнитного момента частицы и магнитного поля прибора.

$\ \ \ \ \ \ $ 3.8.2. Измерение


Измерительный прибор выявляет определенное значение измеряемой величины. Примеры измерительных приборов: глаз, вольтметр, амперметр, счетчик Гейгера. После измерения система, если она не уничтожается измерением, переходит в некоторое другое состояние. Между входом и выходом измерения система подчиняется уравнению Шредингера, в котором учтено взаимодействие системы и измерительного прибора. Измерительный прибор наблюдаемой $A$, отнюдь не обязательно приготовляет после измерения состояние $|a>$.
Измерение над ансамблем, в котором обнаруживаются значения наблюдаемой, определяет информацию о состоянии до измерения. Показание прибора создается как интегральная характеристика процесса измерения и приобретает завершенное значение после измерения, как результат некоего физического взаимодействия измерителя и измеряемой системы, измеряемое состояние которого приготовлено до измерения. При измерении происходит какой-то физический процесс. А что конкретно – для этого нужно решать динамическое уравнение взаимодействия измеряемой системы и измерителя(временное уравнение Шрёдингера в нерелятивистском случае). Что реально приготовлено после измерения – это покажет измерение над приготовленным после измерения состоянии. Это может быть новое состояние исходной системы, а может быть и так, что от исходной системы не остается ничего. Последнее может быть, например, при измерении энергии фотона методом его поглощения.

Почти афоризм: приготовление $|a>$ не измеряет $A$, а измерение $A$ не приготовляет $|a>$. Тут как раз напрашивается соотношение неопределенностей для дополнительных процессов приготовления и измерения.