The Ludens Topoï

Um espaço para explorar Game Studies, Física, Matemática e Filosofia

Fundamentos Matemáticos da Mecânica Quântica e Alguns Esclarecimentos

N. CONSIDERAÇÕES INICIAIS

Este texto, primeira parte de uma duologia, tem como intituito fornecer uma base rigorosa — tanto matemática quanto conceitual — da mecânica quântica para, a partir dela, discutir alguns de seus resultados que são frequentemente mal interpretados pelo público geral, sobretudo em razão do tratamento pouco rigoroso, do uso indiscriminado de frases de efeito e das simplificações excessivas características de uma divulgação científica ingênua — afinal, quem nunca se deparou com o célebre “ninguém realmente entende a física quântica!”, atribuído ao físico Richard Feynman, com um “a mecânica quântica comprova que podemos alterar a realidade apenas com a mente!”, ou com qualquer outra baboseira de semelhante natureza?

Além disso, gostaria de infomar, este texto será desenvolvido, via de regra, a partir de um compromisso ontológico e epistemológico típico da formação em física, situado em algum ponto entre a postura pragmática do shut up and calculate e um realismo ingênuo moderado. Essa escolha se justifica, em primeiro lugar, por permitir uma apresentação mais fiel da maneira como a mecânica quântica é efetivamente compreendida e empregada na prática científica, oferecendo uma perspectiva interna sobre o uso e o significado da teoria no contexto da física.

Além disso, este texto servirá como referência para trabalhos posteriores, nos quais serão examinados, dentre outras coisas, alguns aspectos filosóficos da mecânica quântica, com ênfase em suas interpretações em contextos realistas — estrutural (ôntico e epistêmico) e crítico —, fenomenológicos, empiristas e idealistas. Desse modo, a abordagem aqui adotada funcionará como contraponto às interpretações filosóficas da teoria, das mais diversas escolas e autores. Por fim, deve-se considerar que o próprio conteúdo físico-matemático tratado neste texto é, por si só, suficientemente denso. Incluir nele uma reflexão filosófica sistemática, além dos comentários esporádicos e descompromissados sobre realismo e empirismo que farei, sobrecarregaria sua estrutura e demandaria um investimento de tempo além do disponível.

I. FUNDAMENTAÇÃO MATEMÁTICA

§1. Um Prelúdio de Teoria da Medida

Diante da ênfase algébrica que tradicionalmente domina o ensino da disciplina, a teoria da medida pode parecer um ponto de partida excessivamente abstrato para o estudo da mecânica quântica. Essa impressão, contudo, dissipa-se ao reconhecer que a mecânica quântica é intrinsecamente probabilística e que a teoria da medida constitui, em última instância, o alicerce da teoria das probabilidades. Por conseguinte, um tratamento rigoroso da teoria exige a adoção da linguagem, dos objetos e de conceitos próprios a medida e a integração. Essencialmente, seus objetos de maior relevância para a disciplina são as medidas a valores em projeções e os espaços \(L^p(\mathbb{R}^n)\); antes da introdução formal destes objetos, contudo, é preciso estabelecer os fundamentos conceituais da teoria da medida.

Definição 1.1 (Espaço Mensurável): Um par \((X, \Sigma)\) é dito um espaço mensurável se \(X\) é um conjunto não vazio e \(\Sigma\) é uma \(\sigma\)-álgebra sobre \(X\), isto é, uma coleção de subconjuntos de \(X\) tal que:

Nota Técnica 1: A estrutura de \(\sigma\)-álgebra permite definir quais subconjuntos são "mensuráveis", fornecendo o domínio sobre o qual medidas podem ser definidas. A condição de fechamento sob uniões enumeráveis (e, consequentemente, interseções enumeráveis pelo complemento) é essencial para garantir a convergência de limites em teoria da medida, permitindo operações com sequências infinitas de conjuntos.

Definição 1.2 (Espaço de Medida): Uma tripla \((X, \Sigma, \mu)\) é chamada de espaço de medida se \((X, \Sigma)\) é um espaço mensurável e \(\mu : \Sigma \to [0, \infty]\) é uma medida, isto é, uma função que satisfaz:

Exemplos fundamentais de medidas incluem:

  1. A medida de Lebesgue em \(\mathbb{R}^n\), que generaliza as noções intuitivas de comprimento, área e volume. Ela é a medida subjacente à maioria das construções em mecânica quântica não relativística, especialmente na definição do espaço de estados \(L^2(\mathbb{R}^n)\).
  2. A medida de Dirac \(\delta_a\), concentrada em um ponto \(a \in X\), que desempenha papel central na descrição idealizada de estados localizados e na formulação espectral de observáveis.
  3. Uma medida de probabilidade é uma medida \(\mu : \Sigma \to [0,1]\) tal que \(\mu(X) = 1\). Esta estrutura fornece o elo formal entre a teoria da medida e a interpretação probabilística da mecânica quântica.

Em mecânica quântica, a medida desempenha o papel de codificar as probabilidades de resultados de medições físicas. Por exemplo, no caso do operador posição \(\hat{X}\), o estado \(\psi \in L^2(\mathbb{R}^n)\) induz a medida de probabilidade \(|\psi(x)|^2 \, dx\), que define uma distribuição de probabilidade sobre o espaço de configurações, permitindo o cálculo de valores esperados para os observáveis associados ao operador.

Definição 1.3 (Espaço de Probabilidade): Um espaço de medida \((X, \Sigma, \mu)\) é denominado um espaço de probabilidade quando \(\mu\) é uma medida de probabilidade.

Uma classe de funções de particular interesse é a de funções mensuráveis, posto que possuem a notável propriedade de respeitar a estrutura \(\sigma\)-algébrica dos espaços em que são definidas:

Definição (Função Mensurável): Sejam \((X, \Sigma)\) e \((Y, \mathcal{T})\) espaços mensuráveis. Uma função \(f: X \to Y\) é mensurável se para todo conjunto \(T \in \mathcal{T}\), a pré-imagem \(f^{-1}(T) \in \Sigma\). Quando \(Y = \mathbb{R}\) ou \(Y = \mathbb{C}\) com a \(\sigma\)-álgebra de Borel, diz-se que \(f\) é Borel-mensurável.

Proposição: Se \(f: X \to Y\) e \(g: Y \to Z\) são funções mensuráveis, então \(g \circ f: X \to Z\) é mensurável. Além disso, se \((f_n)_{n \in \mathbb{N}}\) é uma sequência de funções mensuráveis de \(X\) em \(\mathbb{R}\), então \(\sup f_n\), \(\inf f_n\), \(\limsup f_n\) e \(\liminf f_n\) são todas mensuráveis.

Além disso, as funções mensuráveis são essenciais para a construção da integral de Lebesgue, a qual generaliza a integral de Riemann:

Definição (Integral de Lebesgue):

  1. Para uma função simples \(s = \sum_{i=1}^n a_i \chi_{A_i}\) onde \(a_i \in \mathbb{R}\) e \(A_i\) são conjuntos mensuráveis disjuntos, definimos: \[\int s \, d\mu = \sum_{i=1}^n a_i \mu(A_i)\]
  2. Para \(f: X \to [0, \infty]\) mensurável não-negativa: \[\int f \, d\mu = \sup\left\{\int s \, d\mu : 0 \leq s \leq f, \, s \text{ simples}\right\}\]
  3. Para \(f: X \to \mathbb{R}\) mensurável, escreve-se \(f = f^+ - f^-\) onde \(f^+ = \max(f, 0)\) e \(f^- = \max(-f, 0)\). Se pelo menos uma das integrais \(\int f^+ \, d\mu\) ou \(\int f^- \, d\mu\) é finita, definimos: \[\int f \, d\mu = \int f^+ \, d\mu - \int f^- \, d\mu\] Diz-se que \(f\) é integrável (\(f \in L^1(\mu)\)) se ambas as integrais são finitas.

A definição de diversos objetos da mecânica quântica, como a função de onda em espaços de dimensão infinita, bem como a caracterização de outros muitos objetos, como as densidades de probabilidade associadas a medições contínuas, apoiam-se integralmente na integral de Lebesgue. Isso garante que estes objetos estejam bem definidos mesmo que sejam problemáticos sob o paradigma rimanniano. Além disso, a integral de Lebesgue possui propriedades de convergência muito mais fortes que a de Riemann:

Teorema da Convergência Monótona: Se \((f_n)\) é uma sequência crescente de funções mensuráveis não-negativas com \(f_n \uparrow f\), então: \[\int f \, d\mu = \lim_{n\to\infty} \int f_n \, d\mu\]

Teorema da Convergência Dominada (Lebesgue): Se \((f_n)\) é uma sequência de funções mensuráveis com \(f_n \to f\) pontualmente, e existe \(g \in L^1 (X) \) tal que \(|f_n| \leq g\) para todo \(n\), então \(f \in L^1 (X)\) e: \[\int f \, d\mu = \lim_{n\to\infty} \int f_n \, d\mu\]

Este último resultado, em particular, permite iterar limites e integrais sob condições muito gerais — operação que recorrente no contexto da mecânica quântica ao lidarmos com aproximações espectrais e limites de sequências de estados, por exemplo. A fim de ilustração deste segundo caso, em particular, considere uma sequência de funções de onda \(\psi_n \in L^2(\mathbb{R}^n)\) que converge pontualmente para um estado \(\psi\in L^2(\mathbb{R}^n)\) e um observável representado por uma função \(a: X \rightarrow \mathbb{R} \). O valor esperado de \(a\) é: \[\langle A\rangle_{\psi_n} = \int_{X} a(x) |\psi(x)|^2 d\mu.\] Assim, sob hipóteses usuais — como a de que \(g(x):= a(x) |\psi_n (x)|^2\) seja integrável à Lebesgue — tem-se, pelo Teorema da Convergencia Dominada, que: \[\lim\limits_{n \rightarrow +\infty} \langle A \rangle_{\psi_n} = \langle A \rangle_\psi.\]

É interessante notar que, além de ilustrar uma aplicação concreta do Teorema da Convergência Dominada, este exemplo também reforça o papel da integral de Lebesgue na caracterização e definição dos objetos formais da mecânica quântica — aqui, em particular, na definição do valor esperado para um observável. Cabe mencionar ainda o teorema de Fubini-Tonelli, resultado particularmente útil que permite o cálculo de integrais múltiplas por meio da iteração de integrais simples:

Teorema de Fubini-Tonelli: Sejam \((X, \Sigma, \mu)\) e \((Y, \mathcal{T}, \nu)\) espaços de medida \(\sigma\)-finitos, e \(f: X \times Y \to \mathbb{R}\) mensurável. Se \(f \geq 0\) ou se \(\int\int |f| \, d(\mu \times \nu) < \infty\), então: \[\int_X \left(\int_Y f(x,y) \, d\nu(y)\right) d\mu(x) = \int_Y \left(\int_X f(x,y) \, d\mu(x)\right) d\nu(y) = \int_{X\times Y} f \, d(\mu \times \nu)\]

Ainda nesse espírito, um resultado de particular relevância, que merece ser mencionado, é a regra de Born: considere um estado representado por uma função de onda \(\psi \in L^2(\mathbb{R}^n)\) e um observável representado por um operador auto-adjunto \(\hat{A}\). A probabilidade de obter um resultado em um conjunto Borel-mensurável \(A \subseteq \mathbb{R}\) é dada por: \[P(A) = \int_A |\langle a|\psi\rangle|^2 \, dx = \int_{f^{-1}(A)} |\psi(x)|^2 \, dx\] onde \(f\) é a função que representa o observável. Nota como fora do contexto da teoria da medida, esse enunciado sequer faria sentido, pois repousa essencialmente na noção de conjuntos mensuráveis.

Com isso posto, estamos finalmente aptos a definir os espaços \(L^p(X)\); não como conjuntos de funções ponto a ponto, mas como conjuntos de classes de equivalência de funções mensuráveis. Considere \((X,\Sigma,\mu)\) um espaço de medida e seja \(1 \le p \le \infty\). Duas funções mensuráveis \(f,g : X \to \mathbb{C}\) são ditas iguais quase em todo ponto (q.t.p.) se o conjunto de pontos em que elas diferem é nulo, i.e. \[ \mu\big(\{x \in X : f(x) \neq g(x)\}\big) = 0. \] Essa relação define uma relação de equivalência no conjunto das funções mensuráveis, e os elementos de \(L^p(X)\) são precisamente essas classes de equivalência.

Definição (Espaços \(L^p\), \(1 \le p < \infty\)): O espaço \(L^p(X)\) é o conjunto das classes \([f]\) de funções mensuráveis \(f : X \to \mathbb{C}\) tais que \[ \int_X |f(x)|^p \, d\mu(x) < \infty. \] A norma \(L^p\) é definida por \[ \|[f]\|_p := \left( \int_X |f(x)|^p \, d\mu(x) \right)^{1/p}. \]

Essa definição é bem posta, pois funções que diferem apenas em conjuntos de medida nula possuem a mesma integral e, portanto, a mesma norma. Um caso particular a ser tratado, no entanto, é quando \(p = \infty\). Neste caso particular, quase patológico, o espaço \(L^\infty(X,\mu)\) consiste nas classes de equivalência de funções mensuráveis essencialmente limitadas, isto é, funções \(f\) para as quais existe \(M < \infty\) tal que

\[ |f(x)| \le M \quad \text{para quase todo } x \in X. \]

A norma é dada pela norma essencial:

\[ \|[f]\|_\infty := \operatorname{ess\,sup}_{x \in X} |f(x)|. \]

Nota Técnica 2: A identificação de funções que diferem apenas em conjuntos de medida nula é fundamental para que os espaços \(L^p\) possuam boas propriedades analíticas. Em particular, \(L^p(X)\) é um espaço de Banach, e \(L^2(X)\) é um espaço de Hilbert, estrutura que, como se verá, é central na formulação matemática da mecânica quântica.

A teoria da medida associa a cada conjunto mensurável um número real não negativo. Entretanto, a estrutura formal da mecânica quântica, subjacente às medições, exige uma generalização dessa ideia: em vez de números, certos conjuntos mensuráveis são associados a projeções, entendidas como operações idempotentes que selecionam componentes mutuamente exclusivas de um sistema físico. Como exercício de apreensão, é produtivo apresentar essa ideia em um nível puramente medida-teorético e algébrico, mesmo antes de introduzir formalmente espaços de Hilbert e operadores lineare. Seja \((X,\Sigma)\) um espaço mensurável. Uma medida espectral sobre \(X\) é uma aplicação \[ E : \Sigma \longrightarrow \mathcal{P}, \] onde \(\mathcal{P}\) denota uma família de projeções abstratas, satisfazendo as seguintes propriedades:

Uma aplicação \(E\) com essas propriedades é chamada de medida a valores em projeções (ou projection-valued measure, PVM). Ela pode ser vista como uma generalização da noção de partição mensurável, tendo em vista que conjuntos disjuntos correspondem a alternativas mutuamente exclusivas, e a aditividade enumerável garante estabilidade sob refinamentos infinitos. Dada uma função mensurável real \(f : X \to \mathbb{R}\), é possível definir formalmente uma integral do tipo \[ \int_X f(x)\, dE(x), \] por aproximação via funções simples, de modo análogo à construção da integral de Lebesgue. No entanto, é essencial entender que essa integral não produz um número, mas sim um objeto que codifica a decomposição espectral induzida por \(f\). Do ponto de vista estrutural, essa construção é particularmente elucidativa, pois rompe com a intuição comum de que observáveis são descritos apenas por operadores auto-adjuntos, evidenciando que eles também podem ser caracterizados, em termos equivalentes, por regras que associam subconjuntos do espectro de valores possíveis a projeções mutuamente compatíveis.

É natural, em um primeiro contato com o conceito de medidas a valores em projeções (PVMs), o surgimento de uma questão no que diz respeito ao papel da medida envolvida nessa construção: em particular, se tal medida substituiria, de algum modo, a medida de Lebesgue com a qual vínhamos trabalhando até então. A resposta é: não. As PVMs não substituem a medida de Lebesgue, mas operam em um nível estrutural distinto. Para esclarecer esse ponto, convém exemplificar: considere o operador auto-adjunto \(\hat{A}\). Existe a ele associado uma PVM \(E_A: \mathcal{B}(\mathbb{R} )\rightarrow\mathcal{P}(\mathcal{H})\) tal que \[A = \int_\mathbb{R} \lambda dE_A (\lambda),\] com \(\lambda \in \mathbb{R}\) auto-valor de \(\hat{A}\).

Considere \(\psi \in \mathcal{H}\). Define-se a medida escalar induzida como: \[\mu^A_\psi (B):= \braket{\psi, E_A(B)\psi}, \; \text{para} \; B \in \mathcal{B}(\mathbb{R}),\] com \(\mu^A_\psi\) se tratando de uma medida de probabilidade usual. Assim sendo, a integral \[\langle A \rangle_\psi = \int_\mathbb{R} \lambda d \mu^A_\psi (\lambda)\] nada mais é do que uma integral de Lebesgue no sentido clássico, mas agora sobre o espaço espectral do observável. Em particular, para o operador posição \(\hat{X}\), tem-se que a medida induzida é: \[\mu_\psi^X(B) = \int_B |\psi(x)|^2 dx, \] o que está em pleno acordo com o discutido no ínicio desta seção.

Nas próximas seções, essas ideias serão concretizadas por meio da álgebra linear e da análise funcional. Mais precisamente, ver-se-á como medidas espectrais são realizadas como aplicações a valores em projeções ortogonais sobre espaços de Hilbert, culminando no teorema espectral para operadores auto-adjuntos.

§2. Linear Algebra Done Wrong!

A teoria da medida forneceu o arcabouço teórico necessário para atribuir probabilidades a eventos e definir a integração de Lebesgue, por meio dos espaços \(L^p\) e das medidas espectrais. Contudo, a mecânica quântica não se limita a associar probabilidades a conjuntos mensuráveis: estados quânticos são vetores em espaços complexos, superposições correspondem a combinações lineares, e a evolução temporal é descrita por transformações unitárias. Assim sendo, ela demanda uma descrição algébrica dos próprios estados físicos e das transformações permitidas entre eles, e a álgebra linear que fornece essa linguagem.

Os espaços vetoriais relevantes, no entanto, não são os \(\mathbb{C}^n\) finito-dimensionais dos cursos elementares de álgebra linear. Uma partícula livre em \(\mathbb{R}^3\), por exemplo, possui infinitos estados possíveis, descritos por funções de onda \(\psi \in L^2(\mathbb{R}^3)\). Nesse contexto, nem toda transformação linear é contínua, nem todo operador possui autovalores no sentido usual e os espaços de Hilbert — espaços vetoriais complexos, completos e munidos de produto interno — constituem o ambiente matemático ideal apra o tratamento dessas questões.

Definição 1 (Espaço Vetorial Complexo): Seja \(V \subset \mathbb{C}^n \) um conjunto não-vazio. \(V\) constitui um espaço vetorial complexo se está munido de duas operações: adição vetorial \(+: V \times V \to V\) e multiplicação escalar \(\cdot: \mathbb{C} \times V \to V\), satisfazendo, para todos \(\alpha, \beta \in \mathbb{C}\) e \(u, v, w \in V\), os seguintes axiomas:

  1. Comutatividade: \(u + v = v + u\)
  2. Associatividade aditiva: \((u + v) + w = u + (v + w)\)
  3. Existência do elemento neutro: \(\exists 0 \in V : 0 + v = v\)
  4. Existência do inverso aditivo: \(\exists (-v) \in V : v + (-v) = 0\)
  5. Elemento identidade escalar: \(\mathbb{I} \cdot v = v\)
  6. Associatividade multiplicativa: \(\alpha(\beta v) = (\alpha\beta)v\)
  7. Distributividade I: \(\alpha(u + v) = \alpha u + \alpha v\)
  8. Distributividade II: \((\alpha + \beta)v = \alpha v + \beta v\).

Para dar estrutura ao espaço — permitindo, por exemplo, medir "comprimento" ou "ângulo" entre vetores — é necessário introduzir a noção de produto interno, uma aplicação sesquilinear que associa a cada par de vetores um número complexo, generalizando a geometria euclidiana ao contexto de espaços vetoriais complexos:

Definição 2.1 (Produto Interno): Seja \(V\) um espaço vetorial sobre \(\mathbb{C}\). Um produto interno em \(V\) é uma aplicação \(\langle \cdot,\cdot\rangle: V \times V \rightarrow \mathbb{C}\) que satisfaz, para todo \(u,v,w \in V\) e \(\alpha, \beta \in \mathbb{C}\):

  1. Conjugação hermitiana: \(\langle v,u\rangle = \overline{\langle u,v\rangle}\)
  2. Linearidade na primeira entrada: \(\langle \alpha u + \beta v, w\rangle = \alpha \langle u,w \rangle + \beta \langle v,w \rangle\)
  3. Positividade: \(\langle v, v \rangle \geq 0\) para todo \(v \in V\)
  4. Não-degenerescência: \(\langle v, v \rangle = 0 \Leftrightarrow v = 0\)

Nota Técnica 3: A convenção adotada aqui é a de linearidade na primeira entrada e antilinearidade na segunda, isto é, \(\langle u, \alpha v + \beta w\rangle = \overline{\alpha} \langle u,v \rangle + \overline{\beta} \langle u,w \rangle\). Esta é a convenção padrão em física, embora matemáticos frequentemente adotem a convenção oposta. A escolha, embora arbitrária, deve ser mantida consistentemente ao longo de todo o formalismo.

O produto interno confere ao espaço subjacente uma estrutura geométrica; não é, portanto, surpreendente que ele codifique informação física fundamental: o produto \(|\langle \psi, \phi \rangle|^2\), por exemplo, fornece a probabilidade de transição entre estados \(\psi\) e \(\phi\), enquanto a condição \(\langle \psi, \phi \rangle = 0\) significa que os estados são perfeitamente distinguíveis — ortogonais no sentido geométrico. Na notação de Dirac, amplamente utilizada em física, escrevem-se vetores como \(\ket{\psi}\) (kets) e funcionais lineares como \(\bra{\psi}\) (bras), de modo que o produto interno torna-se \(\braket{\phi|\psi} = \langle \phi, \psi \rangle\). Ademais, todo produto interno induz naturalmente uma norma, que por sua vez induz uma métrica, dotando o espaço de uma estrutura topológica:

Definição 2.2 (Norma Induzida): Dado um espaço com produto interno \((V, \langle \cdot, \cdot \rangle)\), a norma induzida é definida por: \[ \|v\| := \sqrt{\langle v, v \rangle} \] A métrica correspondente é \(d(u,v) := \|u - v\|\).

Esta norma satisfaz as propriedades usuais: \(\|v\| \geq 0\) com igualdade se e somente se \(v = 0\), \(\|\alpha v\| = |\alpha| \|v\|\), e a desigualdade triangular \(\|u + v\| \leq \|u\| + \|v\|\). A desigualdade triangular segue de um resultado fundamental:

Teorema 2.1 (Desigualdade de Cauchy-Schwarz): Para todo \(u, v \in V\), \[ |\langle u, v \rangle| \leq \|u\| \cdot \|v\| \] com igualdade se e somente se \(u\) e \(v\) são linearmente dependentes.

Esta desigualdade é central em inúmeras demonstrações na mecânica quântica, aparecendo desde a prova do princípio da incerteza até estimativas de convergência espectral. Ela também permite definir rigorosamente o conceito de "ângulo" entre estados quânticos através de \(\cos \theta = |\langle u, v \rangle| / (\|u\| \|v\|)\). A estrutura métrica induzida pelo produto interno permite formular a noção de convergência: uma sequência \((v_n)\) converge para \(v\) se \(\|v_n - v\| \to 0\). Contudo, nem todo espaço com produto interno é adequado para análise — é preciso garantir que sequências de Cauchy convirjam dentro do espaço:

Definição 2.3 (Sequência de Cauchy e Completeza): Uma sequência \((v_n)\) em \(V\) é de Cauchy se para todo \(\varepsilon > 0\), existe \(N \in \mathbb{N}\) tal que \(\|v_n - v_m\| < \varepsilon\) para todos \(n, m > N\). O espaço \(V\) é completo se toda sequência de Cauchy converge para algum elemento de \(V\).

Definição 2.4 (Espaço de Hilbert): Um espaço de Hilbert \(\mathcal{H}\) é um espaço vetorial complexo munido de um produto interno cuja norma induzida torna o espaço completo.

A completeza é essencial para garantir que limites de aproximações sucessivas — procedimento ubíquo na física — resultem em elementos bem definidos do espaço de estados. Sem completeza, processos de limite poderiam "escapar" do espaço, comprometendo a consistência da teoria. Em dimensão finita, todo espaço vetorial possui uma base, e todas as bases têm o mesmo número de elementos. Em dimensão infinita, a situação torna-se substancialmente mais delicada:

Definição 2.5 (Base Ortonormal): Um conjunto \(\{e_i\}_{i \in I}\) em um espaço de Hilbert \(\mathcal{H}\) é uma base ortonormal se:

  1. \(\langle e_i, e_j \rangle = \delta_{ij}\) (ortonormalidade)
  2. O conjunto de combinações lineares finitas de elementos de \(\{e_i\}\) é denso em \(\mathcal{H}\)

A segunda condição merece atenção: em dimensão infinita, não exigimos que todo vetor seja uma combinação linear finita de elementos da base, mas apenas que seja limite de tais combinações. Esta é uma diferença crucial e, portanto, digna de atenção. De fato, a série infinita \[ v = \sum_{i \in I} \langle e_i, v \rangle e_i \] converge na norma de \(\mathcal{H}\), mas não é uma combinação linear no sentido algébrico usual. Por sorte, dispomos de aparato formal adequado para lidar com essa nuança: a igualdade de Parseval, \[ \|v\|^2 = \sum_{i \in I} |\langle e_i, v \rangle|^2, \] caracteriza completamente bases ortonormais em espaços de Hilbert separáveis e fornece um critério prático para verificar se um conjunto é base.

Exemplo Fundamental: No espaço \(L^2([0, 2\pi])\), as funções \(e_n(x) = \frac{1}{\sqrt{2\pi}} e^{inx}\), \(n \in \mathbb{Z}\), formam uma base ortonormal. Qualquer função \(\psi \in L^2([0, 2\pi])\) pode ser expandida como: \[ \psi(x) = \sum_{n=-\infty}^{\infty} c_n e^{inx}, \quad c_n = \frac{1}{2\pi} \int_0^{2\pi} \psi(x) e^{-inx} dx \] Esta é a série de Fourier de \(\psi\), e a convergência é entendida no sentido \(L^2\), não pontual. A distinção entre convergência pontual e convergência na norma é uma das sutilezas centrais da análise em dimensão infinita.

Outro aspecto notável é que, porquanto espaços de Hilbert equidimensionais de dimensão finita são sempre isomorfos, em dimensão infinita surgem distinções essenciais entre os casos separável e não separável. Em particular, todos os espaços de Hilbert separáveis de dimensão infinita são isomorfos a \(\ell^2(\mathbb{N})\), o espaço de sequências quadrado-somáveis, o que simplifica consideravelmente a teoria abstrata, permitindo que muitos resultados sejam provados trabalhando diretamente com \(\ell^2\).

Cumpre notar que até aqui trabalhamos sob a hipótese de que o estado de um sistema quântico é completamente descrito por um vetor \(\ket{\psi} \in \mathcal{H}\) (ou, mais precisamente, por uma classe de equivalência \([\ket{\psi}]\) de vetores no espaço Hilbert associado, já que vetores \(\ket{\psi}\) e \(e^{i\theta}\ket{\psi}\) representam o mesmo estado físico). Estados assim descritos são chamados de estados puros. Esta descrição é adequada quando possuímos informação completa sobre o sistema — quando, por exemplo, preparamos cuidadosamente um fóton em um estado de polarização definido ou isolamos um átomo em um estado energético específico.

Contudo, a realidade frequentemente não permite tal precisão — mesmo a experimental, que compõe o que Bhaskar denotou por sistemas fechados, metodologicamente controlados. Considere um feixe de luz não polarizada: não é possível descrevê-lo como um único estado de polarização \(\ket{\psi}\), pois ele é, na verdade, uma mistura estatística de fótons com diferentes polarizações. Ou, ainda, considere um sistema quântico em equilíbrio térmico com um reservatório: o estado do sistema não é um vetor puro, mas uma superposição estatística de estados com diferentes energias, cada um ocorrendo com probabilidade ditada pela distribuição de Boltzmann. Em ambos os casos, a descrição vetorial torna-se insuficiente — precisamos de um formalismo que acomode nossa ignorância estatística sobre o sistema.

Neste ponto, é crucial distinguir dois tipos de incerteza na mecânica quântica. A primeira é a incerteza quântica imanente, manifestada pelo princípio da incerteza de Heisenberg: mesmo conhecendo perfeitamente o estado \(\ket{\psi}\), não é possível prever com certeza o resultado de medições de observáveis não-comutativos. Ao que tudo indica, esta incerteza é de nível ontológico, sendo inerente à teoria e persistindo mesmo para estados puros. A segunda é a incerteza clássica ou estatística, de origem epistemológica, que surge de nossa falta de informação sobre qual estado puro o sistema efetivamente ocupa. Um estado misto descreve uma situação onde ambos os tipos de incerteza estão presentes.

Para acomodar misturas estatísticas, precisamos generalizar a noção de estado. A ferramenta apropriada é o operador de densidade (ou matriz densidade), que unifica estados puros e mistos em um único formalismo matemático. Enquanto um estado puro é representado por um vetor \(\ket{\psi}\), um estado misto é, de um modo geral, representado por um operador \(\hat{\rho}\) atuando em \(\mathcal{H}\), construído como uma média ponderada de projetores sobre estados puros: \[ \hat{\rho} = \sum_i p_i \ket{\psi_i}\bra{\psi_i} \] onde \(p_i \geq 0\) são probabilidades clássicas satisfazendo \(\sum_i p_i = 1\), e \(\ket{\psi_i}\) são estados puros (não necessariamente ortogonais). Fisicamente, a interpretação é simples: o sistema ocupa o estado \(\ket{\psi_i}\) com probabilidade \(p_i\). Quando existe apenas um único \(i\) com \(p_i = 1\), recuperamos a descrição vetorial usual; quando múltiplos \(p_i\) são não-nulos, tem-se um estado genuinamente misto. Estados puros vivem em um espaço projetivo complexo, enquanto estados mistos vivem em um espaço convexo de operadores positivo definidos com traço unitário. Esta geometria será explorada na próxima subseção, onde formalizar-se-á rigorosamente as propriedades que caracterizam operadores de densidade.

§3. Análise Funcional e Teoria dos Operadores

Estabelecidos os fundamentos da teoria da medida e da álgebra linear em espaços de Hilbert, volta-se agora ao estudo sistemático dos operadores lineares — transformações que levam vetores de um espaço de Hilbert em vetores de outro (ou do mesmo espaço). Se vetores representam estados quânticos, operadores representam duas classes fundamentais de objetos físicos: observáveis (grandezas mensuráveis como posição, momento e energia) e transformações (evoluções temporais, rotações, translações). Meu próximo comentário pode vir de uma postura excessivamente reducionista; de todo modo, não me parece exagerado afirmar que, em última análise, a mecânica quântica trata-se de uma teoria de operadores sobre espaços de Hilbert — ao menos sob o seu formalismo usual.

A distinção crucial entre dimensão finita e infinita, que já se manifestou na discussão sobre bases ortonormais e completeza, torna-se, talvez, ainda mais pronunciada ao estudarmos operadores. Em \(\mathbb{C}^n\), todo operador linear é automaticamente contínuo, possui espectro finito consistindo apenas de autovalores, e pode ser representado por uma matriz. Em espaços de Hilbert de dimensão infinita, nenhuma dessas afirmações permanece verdadeira em geral. Operadores fundamentais da mecânica quântica — como os operadores de posição e momento — são não-limitados e sequer estão definidos em todo o espaço de Hilbert, demandando um tratamento cuidadoso de domínios.

Esta seção desenvolve o aparato técnico necessário para lidar rigorosamente com operadores em dimensão infinita. Passa-se inicialmente à distinção entre operadores limitados e não limitados, introduzindo a noção de operadores auto-adjuntos e suas extensões, o que culminará no teorema espectral — resultado que fundamenta, em certo sentido, toda a interpretação física de observáveis quânticos. Seja \(\mathcal{H}\) um espaço de Hilbert. Um operador linear \(T: \mathcal{D}(T) \to \mathcal{H}\) é uma transformação linear cujo domínio \(\mathcal{D}(T) \subseteq \mathcal{H}\) é um subespaço vetorial (não necessariamente fechado ou denso).

Definição 3.1 (Operador Limitado): Um operador linear \(T: \mathcal{D}(T) \to \mathcal{H}\) é dito limitado se existe uma constante \(C \geq 0\) tal que \[ \|T\psi\| \leq C \|\psi\| \] para todo \(\psi \in \mathcal{D}(T)\). A menor constante \(C\) satisfazendo esta desigualdade é chamada norma do operador, denotada \(\|T\|\): \[ \|T\| := \sup_{\psi \in \mathcal{D}(T), \, \psi \neq 0} \frac{\|T\psi\|}{\|\psi\|} \]

Operadores limitados possuem propriedades notáveis: se \(\mathcal{D}(T)\) é denso em \(\mathcal{H}\), então \(T\) admite extensão contínua e única a todo \(\mathcal{H}\). Além disso, para operadores lineares, a limitação é equivalente à continuidade, e ambas equivalem à continuidade no zero. O conjunto \(\mathcal{B}(\mathcal{H})\) de todos os operadores limitados definidos em todo \(\mathcal{H}\) forma uma álgebra de Banach sob a norma de operadores — estrutura que será central ao discutirmos o formalismo de C*-álgebras em um post futuro.

Exemplo 3.1: Seja \(\mathcal{H} = L^2(\mathbb{R})\). Considere o operador de multiplicação por uma função limitada \(f \in L^\infty(\mathbb{R})\): \[ (M_f \psi)(x) = f(x) \psi(x) \] Este operador é limitado com \(\|M_f\| = \|f\|_\infty\). A prova é imediata: \(\|M_f \psi\|_2^2 = \int |f(x)|^2 |\psi(x)|^2 dx \leq \|f\|_\infty^2 \|\psi\|_2^2\).

Contudo, os observáveis mais fundamentais da mecânica quântica não são limitados:

Exemplo 3.2 (Operador Posição): Em \(L^2(\mathbb{R})\), o operador posição é definido formalmente por \[ (\hat{X}\psi)(x) = x \psi(x) \] Este operador não pode estar definido em todo \(L^2(\mathbb{R})\), pois a função \(x \psi(x)\) pode não ser quadrado-integrável mesmo quando \(\psi \in L^2(\mathbb{R})\). O domínio natural é \[ \mathcal{D}(\hat{X}) = \left\{ \psi \in L^2(\mathbb{R}) : \int_{\mathbb{R}} x^2 |\psi(x)|^2 dx < \infty \right\} \] que é denso mas não fechado em \(L^2(\mathbb{R})\). Ademais, \(\hat{X}\) é não-limitado: para \(\psi_n(x) = \chi_{[n, n+1]}(x)\) (função característica normalizada), tem-se \(\|\psi_n\|_2 = 1\) mas \(\|\hat{X}\psi_n\|_2 \approx n\), mostrando que a razão \(\|\hat{X}\psi\|/\|\psi\|\) é divergente, i.e. ilimitada.

Exemplo 3.3 (Operador Momento): O operador momento em \(L^2(\mathbb{R})\) é dado por \[ \hat{P} = -i\hbar \frac{d}{dx} \] com domínio típico \(\mathcal{D}(\hat{P}) = W^{1,2}(\mathbb{R})\), o espaço de Sobolev de funções em \(L^2\) cuja derivada (no sentido distribucional) também pertence a \(L^2\). Novamente, este domínio é denso mas não fechado, e o operador é não-limitado.

É interessane notar que o princípio da incerteza de Heisenberg, \(\Delta X \Delta P \geq \hbar/2\), pode ser interpretado como consequência da não-comutatividade de operadores não-limitados, a não-limitação de \(\hat{X}\) e \(\hat{P}\). Além disso, a relação de comutação canônica \([\hat{X}, \hat{P}] = i\hbar \mathbb{I}\) implica que pelo menos um dos operadores deve ser não-limitado, pois se ambos fossem limitados, o comutador seria limitado, enquanto o operador identidade claramente não o é.

Teorema 3.1: Não existem operadores limitados \(\hat{X}, \hat{P} \in \mathcal{B}(\mathcal{H})\) definidos em todo um espaço de Hilbert de dimensão infinita satisfazendo \([\hat{X}, \hat{P}] = i\hbar \mathbb{I}\).

Este resultado, conhecido como teorema de Hellinger-Toeplitz adaptado para o contexto da mecânica quântica, mostra que operadores não-limitados não são complicações evitáveis, mas características essenciais e inevitáveis da estrutura matemática da mecânica quântica. A maior parte da análise funcional aplicada à mecânica quântica concentra-se, portanto, no estudo de operadores não-limitados, seus domínios, suas extensões, e especialmente na classe de operadores auto-adjuntos.

Definição 3.2 (Operador Adjunto): Seja \(T: \mathcal{D}(T) \to \mathcal{H}\) um operador linear densamente definido (i.e., \(\overline{\mathcal{D}(T)} = \mathcal{H}\)). O operador adjunto \(T^*\) é definido da seguinte maneira:

Definição 3.3 (Operador Simétrico): \(T\) é simétrico se \(T \subseteq T^*\), isto é, \(\mathcal{D}(T) \subseteq \mathcal{D}(T^)\) e \(T\psi = T^*\psi\) para todo \(\psi \in \mathcal{D}(T)\). Equivalentemente: \[ \langle T\psi, \phi \rangle = \langle \psi, T\phi \rangle \quad \text{para todo } \psi, \phi \in \mathcal{D}(T) \]

Definição 3.4 (Operador Auto-adjunto): \(T\) é auto-adjunto se \(T = T^*\), isto é: \[ \mathcal{D}(T) = \mathcal{D}(T^*) \quad \text{e} \quad T\psi = T^*\psi \; \text{ para todo } \; \psi \in \mathcal{D}(T) \]

Nas ciências físicas, um observável é, por definição, uma grandeza mensurável que deve produzir resultados reais — em um sentido formal — ao ser medida. Massa, energia, posição, momento: todas essas quantidades assumem valores em \(\mathbb{R}\), nunca em \(\mathbb{C}\). A mecânica quântica, contudo, trabalha com espaços de Hilbert complexos e operadores lineares complexos. Como garantir que um operador complexo produza apenas valores reais? A resposta matemática está dada logo acima: está na auto-adjunção.

Considere inicialmente o caso finito-dimensional, onde \(\mathcal{H} = \mathbb{C}^n\) e operadores são representados por matrizes. Uma matriz \(A \in M_n(\mathbb{C})\) é hermitiana (i.e., \(A^* = A\), onde \(A^*\) denota a transposta conjugada) se e somente se todos os seus autovalores são reais. Este é um resultado fundamental da álgebra linear: a condição \(\langle A\psi, \phi \rangle = \langle \psi, A\phi \rangle\) força o espectro a estar contido em \(\mathbb{R}\). Em dimensão infinita, a situação torna-se mais delicada, mas o princípio subsiste: apenas operadores auto-adjuntos (não meramente simétricos) garantem um espectro real e uma estrutura espectral adequada à interpretação física.

Proposição 3.1: Se \(T\) é um operador auto-adjunto e \(\lambda\) é um autovalor de \(T\) (i.e., existe \(\psi \in \mathcal{D}(T)\), \(\psi \neq 0\), tal que \(T\psi = \lambda\psi\)), então \(\lambda \in \mathbb{R}\).

Demonstração: Como \(T = T^*\), tem-se \[ \lambda \|\psi\|^2 = \langle \lambda\psi, \psi \rangle = \langle T\psi, \psi \rangle = \langle \psi, T^*\psi \rangle = \langle \psi, T\psi \rangle = \langle \psi, \lambda\psi \rangle = \overline{\lambda} \|\psi\|^2 \] Logo \(\lambda = \overline{\lambda}\), ou seja, \(\lambda \in \mathbb{R}\). \(\square\)

Noutros termos, auto-adjunção garante que as "medições possíveis" (os autovalores) são quantidades reais. Contudo, há (novamente) uma sutileza crucial que distingue dimensão finita de dimensão infinita. Em \(\mathbb{C}^n\), todo operador hermitiano é automaticamente auto-adjunto — não há distinção entre simetria e auto-adjunção. Em dimensão infinita, como vimos, a distinção é essencial: um operador pode ser simétrico (\(T \subseteq T^*\)) sem ser auto-adjunto (\(T = T^*\)). Por que a auto-adjunção, e não a mera simetria, é exigida fisicamente?

A razão está na evolução temporal de sistemas quânticos. A equação de Schrödinger, \[ i\hbar \frac{\partial}{\partial t} \ket{\psi(t)} = \hat{H} \ket{\psi(t)}, \] possui solução formal \(\ket{\psi(t)} = e^{-i\hat{H}t/\hbar} \ket{\psi(0)}\), onde \(e^{-i\hat{H}t/\hbar}\) é um operador unitário. A unitariedade preserva a norma — essencial para a interpretação probabilística — e é garantida precisamente quando \(\hat{H}\) é auto-adjunto. Se \(\hat{H}\) fosse apenas simétrico, a evolução temporal poderia não estar bem definida ou não preservar probabilidades. Este requisito de consistência dinâmica força a escolha de operadores auto-adjuntos, não meramente simétricos, como representantes de observáveis.

Exemplo 3.4 (O Hamiltoniano da Partícula Livre): Considere uma partícula livre em \(\mathbb{R}^3\) com Hamiltoniano \[ \hat{H} = -\frac{\hbar^2}{2m} \Delta = -\frac{\hbar^2}{2m} \left( \frac{\partial^2}{\partial x^2} + \frac{\partial^2}{\partial y^2} + \frac{\partial^2}{\partial z^2} \right) \] atuando em \(L^2(\mathbb{R}^3)\). O domínio natural é \(\mathcal{D}(\hat{H}) = W^{2,2}(\mathbb{R}^3)\), o espaço de Sobolev de funções cujas derivadas segundas (no sentido distribucional) pertencem a \(L^2\). Com este domínio, \(\hat{H}\) é auto-adjunto, e a evolução temporal \(e^{-i\hat{H}t/\hbar}\) está bem definida como grupo unitário fortemente contínuo. Se se escolhesse um domínio menor, como \(C_0^\infty(\mathbb{R}^3)\), o operador seria apenas simétrico — suas extensões auto-adjuntas poderiam diferir, levando a dinâmicas físicas distintas.

Em dimensão finita, todo operador hermitiano \(A : \mathbb{C}^n \to \mathbb{C}^n\) é diagonalizável: existe base ortonormal \(\{e_1, \ldots, e_n\}\) de autovetores com autovalores reais \(\{\lambda_1, \ldots, \lambda_n\}\). Todo vetor \(\psi \in \mathbb{C}^n\) pode ser expandido como \(\psi = \sum_{i=1}^n c_i e_i\), e a ação de \(A\) reduz-se a \(A\psi = \sum_{i=1}^n \lambda_i c_i e_i\). Esta decomposição espectral é a base da interpretação física: ao medir o observável \(A\) no estado \(\psi\), obtem-se o valor \(\lambda_i\) com probabilidade \(|c_i|^2 = |\langle e_i, \psi \rangle|^2\).

Em dimensão infinita, no entanto, esta imagem simplificada colapsa. Considere novamente o operador posição \(\hat{X}\) em \(L^2(\mathbb{R})\). Intuitivamente, "medir a posição" deveria resultar em algum valor \(x_0 \in \mathbb{R}\). O "autovetor" correspondente seria a "função" \(\delta(x - x_0)\) (delta de Dirac), satisfazendo \(\hat{X}\delta(x - x_0) = x_0 \delta(x - x_0)\). Contudo, \(\delta(x - x_0)\) não pertence a \(L^2(\mathbb{R})\) — não é sequer uma função no sentido usual, mas uma distribuição. Assim, \(\hat{X}\) não possui autovetores em \(L^2(\mathbb{R})\), embora claramente deva representar um observável físico legítimo com "autovalores" correspondendo a todos os pontos de \(\mathbb{R}\).

Este paradoxo aparente força uma generalização do conceito de autovalor. A noção apropriada é a de espectro — um conjunto que contém não apenas autovalores (quando existem), mas também valores que, embora não possuam autovetores genuínos, ainda desempenham papel essencial na decomposição do operador. O espectro de \(\hat{X}\) é todo \(\mathbb{R}\), refletindo que qualquer valor real pode ser resultado de uma medição de posição, mesmo que não corresponda a um autovetor no sentido usual.

Para operadores auto-adjuntos em dimensão infinita, o espectro divide-se em componentes com propriedades matemáticas distintas. O espectro pontual (ou discreto) consiste nos autovalores genuínos — valores \(\lambda\) para os quais existe \(\psi \in \mathcal{D}(T)\), \(\psi \neq 0\), com \(T\psi = \lambda\psi\). O espectro contínuo consiste em valores que não são autovalores, mas podem ser aproximados arbitrariamente por "quase-autovetores". As interpretações físicas destes componentes são também distintas: o espectro discreto tipicamente corresponde a estados ligados (como elétrons em átomos), enquanto espectro contínuo corresponde a estados de espalhamento (como partículas livres), por exemplo.

O teorema espectral é o resultado fundamental que generaliza a diagonalização de dimensão finita ao contexto de operadores auto-adjuntos não-limitados. Ele garante que todo operador auto-adjunto admite uma decomposição espectral em termos de uma medida a valores em projeções — precisamente a estrutura medida-teorética que introduzimos anteriormente ao discutir medidas espectrais. Com o teorema espectral em mãos, torna-se possível conferir significado matemático rigoroso a afirmações como "o operador posição tem espectro contínuo cobrindo todo \(\mathbb{R}\)" e "o Hamiltoniano do átomo de hidrogênio tem espectro discreto negativo (estados ligados) e espectro contínuo positivo (estados de ionização)".

No entanto, a teoria espectral em dimensão infinita exige uma taxonomia mais refinada que a simples distinção entre autovalores. Seja \(T: \mathcal{D}(T) \to \mathcal{H}\) um operador auto-adjunto. O espectro de \(T\), denotado \(\sigma(T)\), é o conjunto de todos os \(\lambda \in \mathbb{C}\) para os quais o operador \(T - \lambda I\) não possui inversa limitada definida em todo \(\mathcal{H}\). Noutros termos, \(\lambda \in \sigma(T)\) se \(T - \lambda I\) falha em ser bijetivo com inversa contínua.

Definição 3.5 (Espectro e Resolvente): O conjunto resolvente de \(T\) é \[ \rho(T) := \{ \lambda \in \mathbb{C} : (T - \lambda I)^{-1} \text{ existe como operador limitado em } \mathcal{H} \} \] O espectro é o complemento: \(\sigma(T) := \mathbb{C} \setminus \rho(T)\).

Para operadores auto-adjuntos, um resultado fundamental que garante que \(\sigma(T) \subseteq \mathbb{R}\) — o espectro é sempre real, generalizando a propriedade de autovalores reais. Ademais, o espectro de um operador auto-adjunto não-limitado é sempre não-vazio e fechado como subconjunto de \(\mathbb{R}\).

O espectro decompõe-se em três partes disjuntas, cada uma com interpretação física distinta:

Definição 3.6 (Decomposição do Espectro):

  1. Espectro Pontual (Discreto): \(\sigma_p(T) := \{ \lambda \in \mathbb{R} : \exists \psi \in \mathcal{D}(T), \psi \neq 0, T\psi = \lambda\psi \}\)
    São os autovalores genuínos de \(T\). Os autovetores correspondentes pertencem a \(\mathcal{H}\).
  2. Espectro Contínuo: \(\sigma_c(T) := \{ \lambda \in \mathbb{R} : T - \lambda I \text{ é injetivo, tem imagem densa, mas não sobrejetor} \}\)
    Valores que podem ser aproximados por "quase-autovetores" mas não possuem autovetores genuínos.
  3. Espectro Residual: \(\sigma_r(T) := \{ \lambda \in \mathbb{R} : T - \lambda I \text{ é injetivo, mas sua imagem não é densa} \}\)
    Para operadores auto-adjuntos em espaços de Hilbert, \(\sigma_r(T) = \emptyset\) sempre — este componente só aparece para operadores não-auto-adjuntos.

Assim, para operadores auto-adjuntos, \(\sigma(T) = \sigma_p(T) \cup \sigma_c(T)\).

Exemplo 3.5 (Espectro do Operador Posição): Para \(\hat{X}\) em \(L^2(\mathbb{R})\), tem-se: \[ \sigma(\hat{X}) = \mathbb{R}, \quad \sigma_p(\hat{X}) = \emptyset, \quad \sigma_c(\hat{X}) = \mathbb{R} \] O operador posição possui espectro puramente contínuo. Para qualquer \(x_0 \in \mathbb{R}\), embora não exista \(\psi \in L^2(\mathbb{R})\) com \(\hat{X}\psi = x_0\psi\), pode-se construir sequências de funções \(\psi_n \in L^2(\mathbb{R})\) cada vez mais concentradas próximo a \(x_0\), de modo que \(\|(\hat{X} - x_0 I)\psi_n\| / \|\psi_n\| \to 0\). Estas são interpretadas como "pacotes de onda" aproximando um estado de posição definida.

Exemplo 3.6 (Hamiltoniano do Oscilador Harmônico): O Hamiltoniano \[ \hat{H} = -\frac{\hbar^2}{2m} \frac{d^2}{dx^2} + \frac{1}{2}m\omega^2 x^2 \] em \(L^2(\mathbb{R})\) possui espectro puramente pontual: \[ \sigma(\hat{H}) = \sigma_p(\hat{H}) = \left\{ \hbar\omega \left(n + \tfrac{1}{2}\right) : n \in \mathbb{N}_0 \right\}, \quad \sigma_c(\hat{H}) = \emptyset \] Os autovetores correspondentes são as funções de Hermite, que formam uma base ortonormal completa em \(L^2(\mathbb{R})\). Fisicamente, estes são os níveis energéticos quantizados do oscilador — estados ligados separados por gaps de energia \(\hbar\omega\).

Exemplo 3.7 (Hamiltoniano da Partícula Livre): Para \(\hat{H} = -\frac{\hbar^2}{2m}\Delta\) em \(L^2(\mathbb{R}^3)\), \[ \sigma(\hat{H}) = [0, \infty), \quad \sigma_p(\hat{H}) = \emptyset, \quad \sigma_c(\hat{H}) = [0, \infty) \] O espectro é puramente contínuo e não-negativo, refletindo que partículas livres possuem energia cinética arbitrariamente pequena ou grande, mas não estados ligados.

Exemplo 3.8 (Átomo de Hidrogênio): O Hamiltoniano \[ \hat{H} = -\frac{\hbar^2}{2m}\Delta - \frac{e^2}{4\pi\epsilon_0 r} \] exibe estrutura mista: \[ \sigma_p(\hat{H}) = \left\{ -\frac{13.6 \text{ eV}}{n^2} : n \in \mathbb{N} \right\}, \quad \sigma_c(\hat{H}) = [0, \infty) \] O espectro negativo discreto corresponde aos estados ligados do elétron (níveis energéticos de Bohr), enquanto o espectro contínuo não-negativo corresponde a estados ionizados onde o elétron escapa do átomo. A transição entre espectro discreto e contínuo em \(E = 0\) marca a energia de ionização.

Esta dualidade discreto-contínuo trata-se da manifestação indúbia, na estrutura formal, da física subjacente — independentemente do sentido que se atribua a essa noção, ontológica e epistemologicamente. Potenciais confinantes — poços quadrados, oscilador harmônico, átomos — produzem estados ligados com energias quantizadas, refletidas matematicamente como espectro pontual discreto. Remoção do confinamento — partículas livres, processos de espalhamento — permite estados com energia arbitrária, refletidos como espectro contínuo. Em um sentido puramente formal, pode-se dizer, portanto, que há uma íntima relação entre a estrutura espectral de um operador e a fenomenologia física observável do sistema.

Para um sistema com Hamiltoniano \(\hat{H}\), o estado no tempo \(t\) relaciona-se ao estado inicial por \[ \ket{\psi(t)} = \hat{U}(t) \ket{\psi(0)}, \quad \hat{U}(t) := e^{-i\hat{H}t/\hbar} \] A interpretação probabilística da mecânica quântica exige que a evolução preserve normas: \(\|\psi(t)\| = \|\psi(0)\|\) para todo \(t\), garantindo que \(\sum_i |c_i(t)|^2 = 1\) se inicialmente \(\sum_i |c_i(0)|^2 = 1\). Operadores que preservam norma são precisamente os operadores unitários: \(\hat{U}^*\hat{U} = \hat{U}\hat{U}^* = I\).

Em dimensão finita, dado um Hamiltoniano hermitiano \(H \in M_n(\mathbb{C})\), o operador \(U(t) = e^{-iHt/\hbar}\) é automaticamente bem definido (a exponencial de matriz converge sempre) e unitário. Em dimensão infinita, surgem questões delicadas: quando a exponencial \(e^{-i\hat{H}t/\hbar}\) está bem definida? Sob que condições ela forma um grupo unitário contínuo? A resposta está no teorema de Stone, que estabelece correspondência biunívoca entre operadores auto-adjuntos e grupos unitários fortemente contínuos.

Definição 3.7 (Grupo Unitário Fortemente Contínuo): Uma família \(\{\hat{U}(t)\}_{t \in \mathbb{R}}\) de operadores unitários em \(\mathcal{H}\) é um grupo unitário fortemente contínuo (ou grupo a um parâmetro) se:

  1. \(\hat{U}(0) = I\)
  2. \(\hat{U}(t + s) = \hat{U}(t)\hat{U}(s)\) para todo \(t, s \in \mathbb{R}\) (propriedade de grupo)
  3. Para todo \(\psi \in \mathcal{H}\), a aplicação \(t \mapsto \hat{U}(t)\psi\) é contínua de \(\mathbb{R}\) em \(\mathcal{H}\) (continuidade forte)

A continuidade forte significa que pequenas variações temporais produzem pequenas variações no estado, uma exigência física natural: a evolução não deve apresentar saltos descontínuos.

Teorema 3.3 (Teorema de Stone): Existe correspondência biunívoca entre:

dada por \(\hat{U}(t) = e^{i\hat{A}t}\). O operador \(\hat{A}\) é chamado gerador infinitesimal de \(\{\hat{U}(t)\}\) e recuperado por \[ \hat{A}\psi = i \lim_{t \to 0} \frac{\hat{U}(t)\psi - \psi}{t} \] para \(\psi\) no domínio apropriado.

Nota Técnica 4: A auto-adjunção de \(\hat{A}\) é crucial — operadores apenas simétricos não garantem grupos unitários. O teorema de Stone justifica matematicamente por que Hamiltonianas devem ser auto-adjuntas: apenas eles geram evoluções temporais unitárias consistentes.

Na mecânica quântica, \(\hat{A} = -\hat{H}/\hbar\), de modo que \[ \hat{U}(t) = e^{-i\hat{H}t/\hbar} \] O Hamiltoniano \(\hat{H}\) atua como gerador das translações temporais. A equação de Schrödinger emerge naturalmente ao diferenciar \(\psi(t) = \hat{U}(t)\psi(0)\): \[ i\hbar \frac{\partial}{\partial t} \ket{\psi(t)} = i\hbar \frac{\partial}{\partial t} \hat{U}(t) \ket{\psi(0)} = \hat{H} \hat{U}(t) \ket{\psi(0)} = \hat{H} \ket{\psi(t)} \]

Exemplo 3.9 (Evolução do Oscilador Harmônico): Para o Hamiltoniano do oscilador harmônico com espectro \(\sigma(\hat{H}) = \{\hbar\omega(n + 1/2)\}_{n=0}^\infty\) e autovetores \(\ket{n}\), a evolução temporal de um estado inicial \(\ket{\psi(0)} = \sum_{n=0}^\infty c_n \ket{n}\) é \[ \ket{\psi(t)} = e^{-i\hat{H}t/\hbar} \ket{\psi(0)} = \sum_{n=0}^\infty c_n e^{-i\omega(n+1/2)t} \ket{n} \] Cada componente espectral oscila com frequência proporcional à sua energia. A fase global \(e^{-i\omega t/2}\) não tem efeito físico (é inobservável), enquanto as diferenças de fase relativas produzem interferência temporal.

Exemplo 3.10 (Partícula Livre e Pacotes de Onda): Para \(\hat{H} = \hat{P}^2/2m\) com espectro contínuo, a evolução temporal em representação de momento é multiplicação: \[ \widetilde{\psi}(p, t) = e^{-ip^2t/2m\hbar} \widetilde{\psi}(p, 0) \] Na representação de posição, isso produz dispersão: pacotes de onda inicialmente localizados espalham-se com o tempo, refletindo que diferentes componentes de momento propagam-se com velocidades distintas. A taxa de dispersão é inversamente proporcional à largura inicial do pacote — uma manifestação dinâmica do princípio da incerteza.

O teorema de Stone revela uma conexão importante: a da estrutura algébrica de grupos de simetria (grupos de Lie) e dos operadores auto-adjuntos em espaços de Hilbert. Conservação de energia, momento e momento angular — pilares da física clássica — emergem na mecânica quântica como consequências da auto-adjunção dos geradores correspondentes. Por conseguinte, o teorema de Stone codifica (ou explicita?) uma relação fundamental entre simetrias, leis de conservação e a estrutura matemática da teoria quântica.

Vale notar que existe uma correspondência direta — a nível formal — entre especificar domínios de operadores e a física adjacente. É notavelmente fácil traçar essa relação: diferentes escolhas de domínio resultam em diferentes condições de contorno e de comportamento assintótico das funções de onda, que correspondem a diferentes extensões auto-adjuntas de um operador simétrico, e essas escolhas têm consequências físicas mensuráveis. Isso implica que o problema das extensões auto-adjuntas tornar-se-á central na formulação rigorosa da mecânica quântica.

O problema se manifesta da seguinte forma: dado um operador simétrico \(T\) (que satisfaz \(\langle T\psi, \phi \rangle = \langle \psi, T\phi \rangle\) em seu domínio), frequentemente existem múltiplas extensões auto-adjuntas — múltiplas maneiras de estender \(T\) a um operador auto-adjunto com domínio maior. Cada extensão corresponde a uma teoria física distinta, com evoluções temporais diferentes e previsões experimentais divergentes. A escolha da extensão "correta" deve ser determinada por considerações físicas, tipicamente codificadas em condições de contorno ou comportamento assintótico das funções de onda.

Exemplo 3.11 (Partícula em um Intervalo): Considere uma partícula confinada ao intervalo \([0, L]\). O Hamiltoniano livre é formalmente \[ \hat{H} = -\frac{\hbar^2}{2m} \frac{d^2}{dx^2} \] Definido inicialmente em \(C_0^\infty(0, L)\) (funções suaves de suporte compacto no interior do intervalo), este operador é simétrico mas não auto-adjunto. Suas extensões auto-adjuntas são parametrizadas por condições de contorno em \(x = 0\) e \(x = L\). Algumas possibilidades:

As três extensões produzem espectros distintos e, portanto, previsões físicas diferentes. A escolha de domínio é um reflexo direto do sistema físico: paredes impenetráveis físicas correspondem a condições de Dirichlet; partículas em anéis (topologia \(S^1\)) exigem periodicidade. Isso significa que não é a matemática que determina qual extensão usar, mas a física do sistema.

Exemplo 3.12 (Defeito Delta de Dirac): Considere o Hamiltoniano em \(\mathbb{R}\) com potencial delta: \[ \hat{H} = -\frac{\hbar^2}{2m} \frac{d^2}{dx^2} + \alpha \delta(x) \] onde \(\alpha \in \mathbb{R}\) é a "intensidade" do defeito. Para \(\alpha \neq 0\), este operador possui extensão auto-adjunta única caracterizada pela condição de descontinuidade na derivada: \[ \psi'(0^+) - \psi'(0^-) = \frac{2m\alpha}{\hbar^2} \psi(0) \] enquanto \(\psi\) permanece contínua em \(x = 0\). Para \(\alpha < 0\) (potencial atrativo), surge um estado ligado com energia \(E = -m\alpha^2/2\hbar^2\). A condição de "salto" na derivada — parte da especificação do domínio — tem efeito físico mensurável: ela determina os coeficientes de transmissão e reflexão em experimentos de espalhamento.

Um resultado fundamental caracteriza quando extensões auto-adjuntas são únicas ou múltiplas:

Teorema 3.4 (Critério de von Neumann): Seja \(T\) um operador simétrico densamente definido. Os índices de deficiência \[ n_\pm := \dim \ker(T^* \mp iI) \] determinam as extensões auto-adjuntas de \(T\):

A essencialidade — caso \(n_+ = n_- = 0\) — é particularmente importante fisicamente. Quando um operador é essencialmente auto-adjunto, não há ambiguidade: existe uma única maneira consistente de completá-lo, e a física está univocamente determinada pelo operador inicial. Operadores em \(\mathbb{R}^n\) completo frequentemente são essencialmente auto-adjuntos, enquanto operadores em domínios com fronteira ou singularidades tipicamente não são.

Exemplo 3.13 (Hamiltoniano da Partícula Livre em \(\mathbb{R}^n\)): O operador \[ \hat{H} = -\frac{\hbar^2}{2m} \Delta \] definido inicialmente em \(C_0^\infty(\mathbb{R}^n)\) (funções suaves de suporte compacto) é essencialmente auto-adjunto. Sua única extensão auto-adjunta tem domínio \(W^{2,2}(\mathbb{R}^n)\) (espaço de Sobolev). Não há ambiguidade, não há condições de contorno a especificar — a ausência de fronteiras elimina escolhas arbitrárias.

Teorema 3.5 (Critério de Weyl): Seja \(\hat{H} = -\Delta + V(x)\) em \(L^2(\mathbb{R}^n)\) com potencial \(V\) localmente integrável. Se \[ \lim_{|x| \to \infty} V(x) = +\infty \] (potencial confinante), então \(\hat{H}\) é essencialmente auto-adjunto em \(C_0^\infty(\mathbb{R}^n)\).

Ou seja, potenciais que crescem ao infinito "prendem" as funções de onda, fazendo-as decair exponencialmente em regiões distantes. Este decaimento é suficientemente forte para remover ambiguidades, uma vez que o comportamento assintótico é automaticamente determinado pela equação de Schrödinger, sem necessidade de imposição externa. Oscilador harmônico, átomos com carga nuclear blindada, poços de potencial profundos: todos são essencialmente auto-adjuntos.

Quando operadores não são essencialmente auto-adjuntos, a escolha de extensão frequentemente codifica física que o operador diferencial sozinho não captura:

Exemplo 3.14 (Átomo de Hidrogênio e Regularização Ultravioleta): O Hamiltoniano do átomo de hidrogênio em três dimensões, \[ \hat{H} = -\frac{\hbar^2}{2m}\Delta - \frac{e^2}{4\pi\epsilon_0 r} \] possui singularidade Coulombiana em \(r = 0\). Surpreendentemente, em \(n = 3\) dimensões, este operador é essencialmente auto-adjunto: a singularidade \(1/r\) é "suficientemente fraca" que funções de onda próximas à origem são automaticamente reguladas pela parte cinética. Em \(n = 2\) dimensões (hipoteticamente), a situação muda: existem extensões auto-adjuntas inequivalentes, correspondendo a diferentes físicas de curta distância — uma manifestação da necessidade de regularização ultravioleta em dimensões baixas.

A lição geral é esta: domínios codificam informação física essencial. Especificar um observável quântico requer não apenas um operador diferencial formal, mas:

  1. Um domínio preciso \(\mathcal{D}(T) \subseteq \mathcal{H}\)
  2. Verificação de que \(T : \mathcal{D}(T) \to \mathcal{H}\) é auto-adjunto (não meramente simétrico)
  3. Se \(T\) não é essencialmente auto-adjunto, escolha física de extensão via condições de contorno ou comportamento assintótico

Esclarecido esse ponto, faz-se possível tratar do resultado central da análise funcional aplicada à mecânica quântica: o teorema espectral. Compreendendo auto-adjunção, espectro e domínios, pode-se abordar a decomposição espectral de operadores auto-adjuntos — a generalização definitiva do teorema de diagonalização que fundamenta toda interpretação física de medições quânticas.

Em dimensão finita todo operador hermitiano \(A : \mathbb{C}^n \to \mathbb{C}^n\) admite decomposição espectral, i.e. existe base ortonormal \(\{e_1, \ldots, e_n\}\) de autovetores com autovalores reais \(\{\lambda_1, \ldots, \lambda_n\}\) tal que \[ A = \sum_{i=1}^n \lambda_i P_i \] onde \(P_i = \ket{e_i}\bra{e_i}\) é o projetor ortogonal sobre o subespaço gerado por \(e_i\). Fisicamente, pode-se interpretar esta decomposição da seguinte maneira: ao medir o observável \(A\) no estado \(\psi = \sum_i c_i e_i\), obtem-se o valor \(\lambda_i\) com probabilidade \(|c_i|^2 = \|\langle e_i, \psi \rangle\|^2\), e o estado colapsa para \(e_i\) (ou, mais precisamente, para \(P_i\psi / \|P_i\psi\|\)).

Em dimensão infinita, esta estrutura deve ser generalizada para acomodar:

  1. Espectro contínuo, onde não existem autovetores genuínos
  2. Bases ortonormais não-enumeráveis (ou inexistentes no sentido usual)
  3. Operadores não-limitados com domínios próprios

O conceito que possibilita essa generalização é justamente o de medida a valores em projeções (PVM, projection-valued measure), que introduzimos anteriormente na seção de teoria da medida. Recorde: uma PVM é uma aplicação \(E : \mathcal{B}(\mathbb{R}) \to \mathcal{P}(\mathcal{H})\) que associa a cada conjunto Borel \(B \subseteq \mathbb{R}\) um projetor ortogonal \(E(B)\), satisfazendo:

O teorema espectral afirma que todo operador auto-adjunto determina uma PVM única, e vice-versa:

Teorema 3.6 (Teorema Espectral - Forma Integral): Seja \(T\) um operador auto-adjunto em \(\mathcal{H}\). Existe uma única medida a valores em projeções \(E_T : \mathcal{B}(\mathbb{R}) \to \mathcal{P}(\mathcal{H})\) tal que \[ T = \int_{\mathbb{R}} \lambda \, dE_T(\lambda) \] onde a integral é entendida no sentido: \[ \langle T\psi, \phi \rangle = \int_{\mathbb{R}} \lambda \, d\mu_{\psi,\phi}(\lambda) \] com \(\mu_{\psi,\phi}(B) := \langle E_T(B)\psi, \phi \rangle\) medida complexa.

Reciprocamente, toda PVM \(E\) determina um operador auto-adjunto único através desta representação integral.

Nota Técnica 5: O domínio de \(T\) é caracterizado espectralmente por \[ \mathcal{D}(T) = \left\{ \psi \in \mathcal{H} : \int_{\mathbb{R}} \lambda^2 \, d\|E_T(\lambda)\psi\|^2 < \infty \right\} \] Esta condição generaliza a exigência de que, em dimensão finita, vetores devem ter componentes finitas na base de autovetores.

Para compreender o significado físico, considere a medida escalar induzida por um estado normalizado \(\psi \in \mathcal{H}\): \[ \mu_\psi^T(B) := \langle E_T(B)\psi, \psi \rangle = \|E_T(B)\psi\|^2 \] Esta é uma medida de probabilidade sobre \(\mathbb{R}\) (pois \(\mu_\psi^T(\mathbb{R}) = \|\psi\|^2 = 1\)). Ela generaliza a regra de Born, no seguinte sentido: medir o observável \(T\) no estado \(\psi\), a probabilidade de obter um resultado no conjunto \(B \subseteq \mathbb{R}\) é \[ P(T \in B) = \mu_\psi^T(B) = \|E_T(B)\psi\|^2 \] Após a medição resultar em \(B\), o estado colapsa para \(E_T(B)\psi / \|E_T(B)\psi\|\).

O valor esperado e a variância de \(T\) no estado \(\psi\) são: \[ \langle T \rangle_\psi = \int_{\mathbb{R}} \lambda \, d\mu_\psi^T(\lambda), \quad (\Delta T)_\psi^2 = \int_{\mathbb{R}} (\lambda - \langle T \rangle_\psi)^2 \, d\mu_\psi^T(\lambda) \] generalizações rigorosas dos cálculos heurísticos usuais de livros-texto introdutórios da disciplina, como o aclamado Introduction to Quantum Mechanics, cuja autoria é creditada ao infame Griffith, de Berserk.

Exemplo 3.15 (Espectro Discreto - Oscilador Harmônico): Para o Hamiltoniano do oscilador harmônico com autovetores \(\ket{n}\) e autovalores \(E_n = \hbar\omega(n + 1/2)\), a PVM é \[ E_{\hat{H}}(B) = \sum_{n : E_n \in B} \ket{n}\bra{n} \] Esta é uma medida puramente atômica, concentrada nos autovalores. A decomposição espectral reduz-se à familiar \[ \hat{H} = \sum_{n=0}^\infty E_n \ket{n}\bra{n} \] Para \(\psi = \sum_n c_n \ket{n}\), a probabilidade de medir energia no intervalo \([E_k, E_{k+m}]\) é \[ P(\hat{H} \in [E_k, E_{k+m}]) = \sum_{i=k}^{k+m} |c_i|^2 \]

Exemplo 3.16 (Espectro Contínuo - Operador Posição): Para o operador posição \(\hat{X}\) em \(L^2(\mathbb{R})\), a PVM é \[ (E_{\hat{X}}(B)\psi)(x) = \chi_B(x) \psi(x) \] onde \(\chi_B\) é a função característica de \(B\). Esta é uma medida difusa, absolutamente contínua em relação à medida de Lebesgue. Para \(\psi \in L^2(\mathbb{R})\) normalizada, a probabilidade de encontrar a partícula no intervalo \([a,b]\) é \[ P(\hat{X} \in [a,b]) = \int_a^b |\psi(x)|^2 \, dx \] exatamente a regra de Born usual. A "autofunção" formal \(\delta(x - x_0)\), embora não pertença a \(L^2(\mathbb{R})\), é recuperada no sentido distribucional via \(E_{\hat{X}}(\{x_0\})\), que é o projetor nulo exceto quando aplicado a distribuições.

Exemplo 3.17 (Espectro Misto - Átomo de Hidrogênio): O Hamiltoniano do hidrogênio possui espectro misto: discreto em \((-\infty, 0)\) e contínuo em \([0, \infty)\). A PVM decompõe-se como \[ E_{\hat{H}}(B) = \sum_{n : E_n \in B} \ket{n,l,m}\bra{n,l,m} + \int_{B \cap [0,\infty)} dE_k \] onde o primeiro termo captura estados ligados e o segundo, estados de espalhamento. Esta decomposição reflete diretamente a física: transições entre níveis discretos (espectroscopia atômica) versus ionização e espalhamento (espectro contínuo).

O teorema espectral possui várias formulações equivalentes, cada uma com utilidades distintas:

Teorema 3.7 (Forma Multiplicativa): Para toda função Borel mensurável \(f : \mathbb{R} \to \mathbb{C}\), existe um operador \(f(T)\) definido por \[ f(T) = \int_{\mathbb{R}} f(\lambda) \, dE_T(\lambda) \] Se \(f\) é limitada, \(f(T) \in \mathcal{B}(\mathcal{H})\); se \(f\) é real, \(f(T)\) é auto-adjunto. Esta construção satisfaz o cálculo funcional espectral:

Esta formulação é particularmente útil para definir funções de operadores: exponenciais \(e^{iT}\), raízes quadradas \(\sqrt{T}\), funções trigonométricas, etc. Por exemplo, a evolução temporal \(e^{-i\hat{H}t/\hbar}\) é rigorosamente definida via \[ e^{-i\hat{H}t/\hbar} = \int_{\mathbb{R}} e^{-i\lambda t/\hbar} \, dE_{\hat{H}}(\lambda) \]

Corolário 3.1 (Princípio da Incerteza Espectral): Se \(T\) é auto-adjunto e \(\psi \in \mathcal{D}(T)\), então \[ (\Delta T)_\psi^2 := \langle T^2\psi, \psi \rangle - \langle T\psi, \psi \rangle^2 = \int_{\mathbb{R}} (\lambda - \langle T \rangle_\psi)^2 \, d\mu_\psi^T(\lambda) \geq 0 \] com igualdade se e somente se \(\psi\) é autovetor de \(T\). A dispersão quantifica "quanto o estado está espalhado" no espectro de \(T\).

A integral espectral \(\int_{\mathbb{R}} \lambda \, dE_T(\lambda)\) é uma integral de Lebesgue em relação a uma medida a valores em operadores. Por conseguinte, todos os teoremas de convergência (convergência monótona, convergência dominada, etc.) possuem análogos para integrais espectrais, permitindo manipulações rigorosas de séries e limites envolvendo operadores.

Teorema 3.8 (Teorema Espectral - Forma Multiplicadora): Seja \(T\) auto-adjunto em \(\mathcal{H}\). Existe espaço de medida \((X, \mu)\) e isomorfismo unitário \(U : \mathcal{H} \to L^2(X, \mu)\) tal que \[ U T U^{-1} = M_f \] onde \(M_f\) é o operador de multiplicação por alguma função mensurável real \(f : X \to \mathbb{R}\). Isto é, \(T\) é unitariamente equivalente a um operador de multiplicação.

Esta formulação revela que, em uma "representação adequada", todo operador auto-adjunto age por multiplicação — a generalização mais direta da diagonalização de matrizes. O espectro de \(T\) é exatamente a imagem essencial de \(f\): \(\sigma(T) = \text{ess-im}(f)\).

À luz do que foi exposto, espero que tenha ficado claro que o teorema espectral constitui um resultado de importância central para a física. Trata-se de um teorema que converte a heurística física em estrutura matemática rigorosa, servindo de alicerce formal para a regra de Born, para o postulado do colapso, para a definição de valores esperados e, de modo mais geral, para toda a fenomenologia das medições na mecânica quântica. Na ausência desse resultado, afirmações como “a medição da posição pode resultar em qualquer valor real” ou “a energia encontra-se quantizada em estados ligados” careceriam de justificação formal.

Com o teorema espectral estabelecido, completa-se o tripé de fundamentos matemáticos da mecânica quântica: teoria da medida fornece o arcabouço probabilístico, álgebra linear em espaços de Hilbert descreve estados e superposições, e teoria de operadores caracteriza observáveis e dinâmica. A próxima seção — a última deste arcabouço matemático — explora como simetrias físicas manifestam-se matematicamente através da teoria de grupos e suas representações em espaços de Hilbert, revelando a profunda conexão entre estrutura geométrica e leis de conservação na mecânica quântica (e da física, de modo mais geral).

§4. Simetrias e Teoria de Grupos (de Mentira)

Nas seções anteriores, introduzimos a estrutura matemática fundamental da mecânica quântica, o arcabouço mínimo requerido para uma compreensão inicial da teoria. Contudo, aquilo que, a meu ver, constitui a estrutura mais profunda da teoria — a que articula geometria, simetrias e leis de conservação — ainda não foi explorado. Esta seção volta-se, portanto, a essas estruturas: ao estudo das simetrias na mecânica quântica e de sua implementação matemática por meio da teoria de grupos e de suas representações.

Uma simetria, em termos gerais, é uma transformação que preserva alguma estrutura relevante do sistema físico. Via de regra, rotações preservam distâncias, translações temporais preservam as leis da física, inversões espaciais trocam esquerda e direita. Na mecânica clássica, simetrias manifestam-se como transformações no espaço de fase que preservam a estrutura simplética. Na mecânica quântica, elas aparecem como transformações no espaço de Hilbert que preservam a estrutura probabilística — essencialmente, as probabilidades de transição entre estados.

Noutros termos, a conexão profunda entre simetrias e leis de conservação, estabelecida na mecânica clássica pelo teorema de Noether, possui análogo quântico: simetrias contínuas correspondem a operadores auto-adjuntos cujos autovalores são quantidades conservadas. Invariância sob translações espaciais implica conservação de momento; invariância rotacional implica conservação de momento angular; invariância temporal implica conservação de energia.

Definição 4.1 (Grupo de Lie): Um grupo de Lie é uma variedade diferenciável \(G\) munida de uma estrutura de grupo tal que as operações de grupo \[ \mu : G \times G \to G, \quad (g, h) \mapsto gh \quad \text{e} \quad \iota : G \to G, \quad g \mapsto g^{-1} \] são aplicações diferenciáveis (suaves).

Grupos de Lie combinam estrutura algébrica (operação de grupo) com estrutura geométrica (variedade diferenciável), permitindo o uso simultâneo de ferramentas algébricas e de cálculo diferencial. Em física, grupos de Lie aparecem naturalmente como grupos de simetria: o grupo de rotações \(\text{SO}(3)\), o grupo de Lorentz \(\text{SO}(1,3)\), o grupo unitário \(\text{U}(n)\), entre outros.

Exemplo 4.1 (Grupos Clássicos de Lie):

A estrutura infinitesimal de um grupo de Lie — seu comportamento próximo à identidade — é capturada pela álgebra de Lie associada:

Definição 4.2 (Álgebra de Lie): A álgebra de Lie \(\mathfrak{g}\) de um grupo de Lie \(G\) é o espaço tangente à identidade \(T_e G\), munido do colchete de Lie \[ [\cdot, \cdot] : \mathfrak{g} \times \mathfrak{g} \to \mathfrak{g} \] que satisfaz anti-simetria \([X, Y] = -[Y, X]\) e a identidade de Jacobi \[ [X, [Y, Z]] + [Y, [Z, X]] + [Z, [X, Y]] = 0 \]

Para grupos de Lie matriciais (subgrupos fechados de \(\text{GL}(n, \mathbb{C})\)), a álgebra de Lie consiste nas matrizes que são derivadas de curvas no grupo passando pela identidade, e o colchete de Lie é simplesmente o comutador de matrizes: \([X, Y] = XY - YX\).

Exemplo 4.2 (Álgebras de Lie Clássicas):

A conexão entre grupo e álgebra é fornecida pela aplicação exponencial:

Proposição 4.1 (Aplicação Exponencial): Para \(X \in \mathfrak{g}\), a série \[ \exp(X) := \sum_{n=0}^\infty \frac{X^n}{n!} \] converge e define um elemento de \(G\). Para grupos de Lie conexos, todo elemento suficientemente próximo da identidade pode ser escrito como \(\exp(X)\) para algum \(X \in \mathfrak{g}\).

Elementos da álgebra de Lie \(\mathfrak{g}\) correspondem a transformações infinitesimais de simetria, enquanto elementos do grupo \(G\) são transformações finitas. Na mecânica quântica, em particular, álgebras de Lie correspondem a observáveis (geradores de simetrias), enquanto grupos correspondem a transformações unitárias implementando essas simetrias. Para que grupos de simetria atuem em espaços de Hilbert, precisamos do conceito de representação:

Definição 4.3 (Representação Unitária): Uma representação unitária de um grupo de Lie \(G\) em um espaço de Hilbert \(\mathcal{H}\) é um homomorfismo de grupos \[ \pi : G \to \mathcal{U}(\mathcal{H}) \] onde \(\mathcal{U}(\mathcal{H})\) denota o grupo de operadores unitários em \(\mathcal{H}\), satisfazendo:

  1. \(\pi(e) = I\)
  2. \(\pi(gh) = \pi(g)\pi(h)\)
  3. \(\pi(g)^* = \pi(g^{-1})\)
  4. A aplicação \(g \mapsto \langle \pi(g)\psi, \phi \rangle\) é contínua para todo \(\psi, \phi \in \mathcal{H}\)

Fisicamente, uma representação unitária descreve como estados quânticos transformam-se sob operações de simetria. A unitariedade garante que probabilidades de transição são preservadas: \[ |\langle \pi(g)\psi, \pi(g)\phi \rangle| = |\langle \psi, \phi \rangle| \] refletindo que simetrias não alteram relações probabilísticas entre estados.

Definição 4.4 (Representação da Álgebra de Lie): A representação "derivada" de \(\pi\) é um homomorfismo de álgebras de Lie \[ d\pi : \mathfrak{g} \to \mathcal{A}(\mathcal{H}) \] onde \(\mathcal{A}(\mathcal{H})\) denota operadores (possivelmente não-limitados) anti-auto-adjuntos, dado por \[ d\pi(X) = \left. \frac{d}{dt} \right|_{t=0} \pi(\exp(tX)) \]

Os elementos \(d\pi(X)\) são geradores infinitesimais das transformações de simetria. Na mecânica quântica, multiplicando por \(i\), obtem-se operadores auto-adjuntos — precisamente os observáveis associados às simetrias. Por exemplo:

Proposição 4.2 (Relação entre Representações): Se \(\pi\) é representação unitária de \(G\), então \[ \pi(\exp(X)) = \exp(id\pi(X)) \] para \(X \in \mathfrak{g}\), onde \(id\pi(X)\) é auto-adjunto (o fator \(i\) converte anti-auto-adjunto em auto-adjunto).

Esta relação conecta diretamente o teorema de Stone (seção anterior) com teoria de representações: grupos unitários fortemente contínuos são precisamente representações unitárias de \(\mathbb{R}\) (grupo aditivo), e seus geradores são operadores auto-adjuntos. Outrossim, o grupo \(\text{SU}(2)\) e sua álgebra \(\mathfrak{su}(2)\) ocupam posição central na mecânica quântica, pois governam o momento angular, tanto orbital quanto intrínseco (spin). A álgebra \(\mathfrak{su}(2)\) possui base canônica dada pelas matrizes de Pauli (a menos de fatores escalares):

\[ \sigma_1 = \begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}, \quad \sigma_2 = \begin{pmatrix} 0 & -i \\ i & 0 \end{pmatrix}, \quad \sigma_3 = \begin{pmatrix} 1 & 0 \\ 0 & -1 \end{pmatrix} \]

Os geradores são \(J_i = \frac{1}{2}\sigma_i\), satisfazendo as relações de comutação \[ [J_i, J_j] = i\varepsilon_{ijk} J_k \] onde \(\varepsilon_{ijk}\) é o símbolo (ou tensor) de Levi-Civita. Na mecânica quântica, operadores de momento angular devem satisfazer estas relações de comutação, independentemente de sua origem física (orbital, spin, ou combinação).

Teorema 4.1 (Classificação de Representações Irredutíveis de \(\mathfrak{su}(2)\)): As representações unitárias irredutíveis de dimensão finita de \(\mathfrak{su}(2)\) são parametrizadas por \(j \in \{0, \frac{1}{2}, 1, \frac{3}{2}, 2, \ldots\}\) (números de spin), com dimensão \(2j + 1\). Existe base \(\{\ket{j, m} : m = -j, -j+1, \ldots, j\}\) tal que: \[ J^2 \ket{j, m} = j(j+1)\hbar^2 \ket{j, m}, \quad J_3 \ket{j, m} = m\hbar \ket{j, m} \] onde \(J^2 = J_1^2 + J_2^2 + J_3^2\) é o operador de Casimir.

Fisicamente, este resultado aparece:

  1. Na quantização do momento angular: Medições de \(J_3\) produzem apenas valores \(m\hbar\) com \(m \in \{-j, \ldots, j\}\)
  2. Na existência de spins semi-inteiros: Valores \(j = \frac{1}{2}, \frac{3}{2}, \ldots\) não têm análogo clássico — são puramente quânticos
  3. Na multiplicidade de estados: Para momento angular total \(j\), existem \(2j+1\) estados independentes

Exemplo 4.3 (Spin \(\frac{1}{2}\)): A representação fundamental de \(\text{SU}(2)\) atua em \(\mathbb{C}^2\) com geradores \(J_i = \frac{\hbar}{2}\sigma_i\). Os autoestados de \(J_3\) são: \[ \ket{\uparrow} = \begin{pmatrix} 1 \\ 0 \end{pmatrix}, \quad \ket{\downarrow} = \begin{pmatrix} 0 \\ 1 \end{pmatrix} \] correspondendo a \(m = \pm\frac{1}{2}\). Todo sistema de spin-\(\frac{1}{2}\) (elétrons, prótons, nêutrons) é descrito por esta representação.

Cabe notar, ainda, que, embora rotações espaciais formem o grupo \(\text{SO}(3)\), suas representações unitárias em mecânica quântica são determinadas por \(\text{SU}(2)\), que é recobrimento duplo de \(\text{SO}(3)\). Isso de dá pois \(\text{SU}(2)\) é simplesmente conexo, enquanto \(\text{SO}(3)\) não é. Rotações de \(2\pi\) em \(\text{SO}(3)\) são homotópicas à identidade, mas em \(\text{SU}(2)\) correspondem a \(-I\), introduzindo possibilidade de representações espinoriais (\(j\) semi-inteiro) que transformam-se com sinal ao completar rotação de \(2\pi\). Na física não-relativística, o grupo relevante associado as simetrias espaço-temporais é o grupo de Galileu:.

Definição 4.5 (Grupo de Galileu): O grupo de Galileu \(\mathcal{G}\) consiste em transformações do espaço-tempo \((t, \mathbf{x}) \mapsto (t', \mathbf{x}')\) da forma: \[ t' = t + s, \quad \mathbf{x}' = R\mathbf{x} + \mathbf{v}t + \mathbf{a} \] onde \(s \in \mathbb{R}\) (translação temporal), \(R \in \text{SO}(3)\) (rotação), \(\mathbf{v} \in \mathbb{R}^3\) (boost galileano), \(\mathbf{a} \in \mathbb{R}^3\) (translação espacial).

A álgebra de Lie do grupo de Galileu possui geradores:

Todos estes, sem surpresa, satisfazem as relações de comutação canônicas, incluindo \([\hat{P}_i, \hat{H}] = 0\) (conservação de momento em Hamiltonianas invariantes) e \([\hat{J}_i, \hat{J}_j] = i\hbar\varepsilon_{ijk}\hat{J}_k\) (álgebra \(\mathfrak{su}(2)\) de rotações). Na física relativística, em contrapartida, o grupo relevante é o de Poincaré:

Definição 4.6 (Grupo de Poincaré): O grupo de Poincaré (grupo de isometrias do espaço-tempo de Minkowski) consiste em transformações \[ x'^\mu = \Lambda^\mu_{\ \nu} x^\nu + a^\mu \] onde \(\Lambda \in \text{SO}(1,3)\) (transformação de Lorentz) e \(a \in \mathbb{R}^{1,3}\) (translação espaço-temporal).

A classificação das representações unitárias irredutíveis do grupo de Poincaré, devida a Wigner (1939), é resultado fundamental da teoria quântica de campos relativística:

Teorema 4.2 (Classificação de Wigner): Representações unitárias irredutíveis do grupo de Poincaré são classificadas por dois invariantes de Casimir:

  1. Massa ao quadrado: \(m^2 = P^\mu P_\mu\) (autovalor do operador de Casimir quadri-momento)
  2. Spin (ou helicidade para partículas sem massa): autovalor do operador de Pauli-Lubanski

Cada representação irredutível corresponde a um tipo de partícula elementar com massa \(m\) e spin \(s\). Elétrons, múons e quarks correspondem a \(m > 0\), \(s = \frac{1}{2}\); fótons e glúons a \(m = 0\), helicidade \(\pm 1\); o bóson de Higgs a \(m > 0\), \(s = 0\). Com o exposto até aqui, permanece a questão: como simetrias físicas implementam-se matematicamente em espaços de Hilbert? Simetrias devem preservar probabilidades de transição, mas isso não determina univocamente a forma das transformações. O teorema de Wigner resolve esta questão:

Teorema 4.3 (Teorema de Wigner): Seja \(\mathcal{H}\) um espaço de Hilbert com \(\dim \mathcal{H} \geq 2\). Toda bijeção \(T : \mathcal{H} \to \mathcal{H}\) que preserva probabilidades de transição, \[ |\langle T\psi, T\phi \rangle| = |\langle \psi, \phi \rangle| \quad \text{para todo } \psi, \phi \in \mathcal{H} \] é implementada, a menos de fase global, por um operador unitário ou anti-unitário.

Nota Técnica 6: Um operador \(U\) é anti-unitário se satisfaz \(\langle U\psi, U\phi \rangle = \overline{\langle \psi, \phi \rangle}\) (conjuga produto interno) e \(U^*U = UU^* = I\).

Este resultado estrutura diversos aspectos das simetrias, no contexto da mecânica quântica:

  1. Linearidade ou anti-linearidade: Simetrias são representadas por operadores lineares (unitários) ou anti-lineares (anti-unitários), nunca transformações não-lineares
  2. Reversão temporal: A única simetria física implementada anti-unitariamente é a inversão temporal \(\mathcal{T}\), que inverte o fluxo do tempo
  3. Estrutura de grupo: Simetrias contínuas (rotações, translações) são sempre unitárias; anti-unitariedade aparece apenas para simetrias discretas envolvendo inversão temporal

Exemplo 4.4 (Inversão Temporal): O operador de inversão temporal \(\mathcal{T}\) age em funções de onda por: \[ (\mathcal{T}\psi)(x) = \psi^*(x) \] Este operador é anti-unitário: \(\langle \mathcal{T}\psi, \mathcal{T}\phi \rangle = \overline{\langle \psi, \phi \rangle}\). Sua anti-unitariedade reflete que \(\mathcal{T}\) inverte o momento (\(\mathcal{T}\hat{P}\mathcal{T}^{-1} = -\hat{P}\)) e o momento angular (\(\mathcal{T}\hat{L}\mathcal{T}^{-1} = -\hat{L}\)), mas preserva energia.

O teorema de Wigner fundamenta o uso de teoria de representações de grupos na mecânica quântica: uma vez que simetrias devem ser unitárias (ou anti-unitárias), elas formam representações dos grupos de simetria em espaços de Hilbert. A estrutura algébrica das simetrias físicas — grupos de Lie — determina assim a estrutura matemática dos observáveis — álgebras de operadores auto-adjuntos.

Corolário 4.1 (Conservação e Simetria): Se o Hamiltoniano \(\hat{H}\) comuta com operadores unitários \(\pi(g)\) para todo \(g\) em um grupo de Lie \(G\), então os geradores \(d\pi(X)\) são constantes de movimento: \[ \frac{d}{dt} \langle d\pi(X) \rangle = 0 \] Este é o análogo quântico do teorema de Noether.

As quatro seções precedentes estabeleceram o arcabouço matemático da mecânica quântica. Com isso, torna-se possível adentrar a segunda parte deste texto, dedicada aos fenômenos. Munido desse aparato matemático, tais fenômenos podem ser caracterizados com precisão e rigor: a superposição deixa de ser uma formulação vaga do tipo “uma partícula estar em dois lugares simultaneamente” e passa a ser entendida como decomposição em subespaços ortogonais de um espaço de Hilbert; o entrelaçamento deixa de ser descrito como uma “conexão misteriosa à distância” e passa a corresponder ao produto tensorial de espaços de Hilbert e a estados não separáveis; por fim, a não localidade deixa de ser associada a uma “ação fantasmagórica” e passa a ser compreendida como a estrutura de correlações quânticas incompatíveis com teorias de variáveis ocultas locais.

II. A FENOMENOLOGIA QUÂNTICA

A estrutura matemática estabelecida na Parte I permite agora uma análise rigorosa dos fenômenos que caracterizam a mecânica quântica. Esta segunda parte examina quatro manifestações centrais da estrutura quântica: superposição, que permite estados coexistirem em combinações lineares impossíveis classicamente; entrelaçamento, que cria correlações entre subsistemas mais fortes que qualquer correlação clássica; interferência, que revela a natureza ondulatória da matéria; e não-localidade, que demonstra incompatibilidade entre mecânica quântica e realismo local. Cada fenômeno será tratado com rigor matemático, mas sempre conectado a consequências físicas observáveis e verificáveis experimentalmente.

§1. A Superposição Quântica

A superposição quântica constitui o princípio estrutural mais fundamental da mecânica quântica, aquele do qual todos os outros fenômenos característicos da teoria derivam. Enquanto o entrelaçamento (Seção §2) emerge da estrutura de produto tensorial de sistemas compostos, e a não-localidade (Seção §4) manifesta-se em correlações específicas de medições, a superposição é logicamente anterior: ela expressa diretamente a linearidade do espaço de Hilbert. A afirmação de que "um sistema pode estar simultaneamente em múltiplos estados clássicos" — heurística comum mas imprecisa — deve ser substituída pela formulação rigorosa de que o espaço de estados possui estrutura de espaço vetorial complexo, onde combinações lineares de vetores geram novos estados fisicamente realizáveis.

Nesta seção, irei desenvolver matematicamente a noção de superposição, conectando-a com o formalismo de espaços de Hilbert estabelecido na Seção §2 da Parte I. Inicialmente, recorde da Seção §2 (Parte I) que estados quânticos puros são representados por vetores (ou classes de equivalências de vetores) em um espaço de Hilbert \(\mathcal{H}\). A estrutura de espaço vetorial impõe que, dados estados \(\ket{\psi}, \ket{\phi} \in \mathcal{H}\) e coeficientes complexos \(\alpha, \beta \in \mathbb{C}\), a combinação linear \[ \ket{\chi} = \alpha\ket{\psi} + \beta\ket{\phi} \] também representa estado fisicamente realizável, desde que normalizado \(\|\chi\| = 1\). Esta propriedade matemática traduz-se no princípio físico da superposição.

Definição 1.1 (Estado de Superposição): Seja \(\mathcal{H}\) espaço de Hilbert de estados e \(\{\ket{\psi_i}\}_{i \in I}\) conjunto de estados ortonormais. Um estado \(\ket{\Psi} \in \mathcal{H}\) encontra-se em superposição relativamente à base \(\{\ket{\psi_i}\}\) se sua expansão \[ \ket{\Psi} = \sum_{i \in I} c_i \ket{\psi_i}, \quad \sum_{i \in I} |c_i|^2 = 1 \] possui mais de um coeficiente \(c_i\) não-nulo. Os coeficientes \(c_i = \langle \psi_i | \Psi \rangle\) são chamados amplitudes de probabilidade.

A relatividade à escolha de base é essencial. Todo estado pode ser escrito trivialmente como superposição em alguma base (aquela que não o contém como elemento), mas também como estado único em outra base (aquela gerada por ele mesmo, estentida a uma base completa). A questão física relevante emerge ao considerar bases determinadas por observáveis específicos.

Proposição 1.1: Seja \(\hat{A}\) observável auto-adjunto com decomposição espectral \(\hat{A} = \sum_i a_i \ket{a_i}\bra{a_i}\) (espectro discreto não-degenerado) e \(\ket{\Psi} = \sum_i c_i \ket{a_i}\) com ao menos dois \(c_i \neq 0\). Então \(\ket{\Psi}\) não é autovetor de \(\hat{A}\), e medições de \(A\) neste estado produzem distribuição de probabilidades genuína \[ P(A = a_i) = |c_i|^2 = |\langle a_i | \Psi \rangle|^2 \] Esta é a regra de Born, generalizada na Seção §3 (Parte I) através do teorema espectral para observáveis com espectro contínuo.

É interessante notar que a interpretação física das amplitudes \(c_i\) distingue fundamentalmente mecânica quântica de teorias clássicas probabilísticas. Em teoria clássica, probabilidades combinam-se aditivamente para eventos mutuamente exclusivos. Em mecânica quântica, apenas seus módulos quadrados fornecem probabilidades e as amplitudes combinam-se linearmente, permitindo interferência:

Proposição 1.2 (Interferência Quântica): Sejam \(\ket{\psi}, \ket{\phi}\) estados ortonormais e \(\ket{\Psi} = \alpha\ket{\psi} + \beta\ket{\phi}\) sua superposição normalizada. A probabilidade de encontrar o sistema em estado \(\ket{\chi}\) satisfaz \[ |\langle \chi | \Psi \rangle|^2 = |\alpha\langle \chi | \psi \rangle + \beta\langle \chi | \phi \rangle|^2 = |\alpha|^2|\langle \chi | \psi \rangle|^2 + |\beta|^2|\langle \chi | \phi \rangle|^2 + 2\text{Re}(\alpha^*\beta\langle \chi | \psi \rangle^*\langle \chi | \phi \rangle) \] O último termo, proporcional a \(2\text{Re}(\alpha^*\beta\langle \chi | \psi \rangle^*\langle \chi | \phi \rangle)\), representa interferência quântica e não possui análogo clássico.

Quando \(\langle \chi | \psi \rangle\) e \(\langle \chi | \phi \rangle\) possuem fases relativas apropriadas, o termo de interferência pode ser positivo (interferência construtiva) ou negativo (interferência destrutiva), produzindo probabilidades maiores ou menores que a soma clássica das probabilidades individuais. A dinâmica dos estados quânticos divide-se em dois regimes distintos: entre medições, a evolução é determinística e unitária, governada pela equação de Schrödinger (Seção §3, Parte I, Teorema de Stone); durante medições, no entanto, ocorre processo estocástico e não-unitário chamado colapso da função de onda ou redução do pacote de ondas.

Postulado de Projeção (von Neumann): Seja \(\hat{A}\) observável com decomposição espectral \(\hat{A} = \sum_i a_i P_i\), onde \(P_i = \ket{a_i}\bra{a_i}\) são projetores ortogonais sobre autoespaços de \(\hat{A}\) (assumindo espectro discreto não-degenerado para simplicidade). Se o sistema está no estado \(\ket{\Psi} = \sum_j c_j \ket{a_j}\) imediatamente antes da medição, então a medição de \(A\) resulta em valor \(a_i\) com probabilidade \(|c_i|^2\), e o estado após a medição colapsa para \[ \ket{\Psi'} = \frac{P_i\ket{\Psi}}{\|P_i\ket{\Psi}\|} = \frac{c_i\ket{a_i}}{|c_i|} = e^{i\theta_i}\ket{a_i} \] onde a fase \(e^{i\theta_i}\) é fisicamente irrelevante (estados diferindo por fase global são indistinguíveis).

Este postulado, embora fenomenologicamente bem sucedido, introduz um novo problema. A evolução unitária preserva superposições: se \(\ket{\Psi}(0)\) é superposição, então \(\ket{\Psi}(t) = e^{-i\hat{H}t/\hbar}\ket{\Psi}(0)\) também o é. O colapso, ao contrário, destrói superposição de forma instantânea e irreversível. Esta dualidade evolutiva — determinística-unitária versus estocástica-projetiva — constitui o problema da medição na mecânica quântica, que — até onde me conta — ainda não foi completamente resolvido, mesmo quase um século após o seu surgimento.

Antes de prosseguirmos, cabe aqui um parêntese: o termo "medição" e sua associação com "observador" não implicam necessariamente participação de consciência humana ou agente subjetivo. Na formulação rigorosa da mecânica quântica, "medição" denota interação física específica entre sistema quântico e aparato macroscópico preparado adequadamente — tipicamente um dispositivo que acopla grau de liberdade microscópico a ponteiro macroscópico. O "observador" pode ser detector de fótons, câmara de bolhas, interferômetro, ou qualquer sistema físico capaz de registrar informação de forma irreversível através de amplificação macroscópica. A confusão histórica entre "observação" (processo físico objetivo) e "consciência" (fenômeno subjetivo) gerou pseudoproblemas filosóficos e toda uma subcategoria de teorias pseudocientíficas New Age. Quando discutimos colapso, referimo-nos a processo físico de correlação irreversível entre sistema e aparato, não a ato cognitivo de um agente consciente "tomar conhecimento" do resultado. Cabe notar também que esta distinção não possui compromisso ontológico algum, tratando-se apenas de uma delimitação metodológica fundada na prática estabelecida da comunidade científica.

Parêntese feito, prossigamos. Usando a estrutura de medidas espectrais (Seção §1, Parte I), pode-se generalizar o postulado, para espectro degenerado ou contínuo:

Postulado Generalizado (Forma Espectral): Seja \(\hat{A}\) observável auto-adjunto com medida espectral \(E_A : \mathcal{B}(\mathbb{R}) \to \mathcal{P}(\mathcal{H})\). Medição de \(A\) no estado \(\ket{\Psi}\) resulta em valor pertencente ao conjunto Borel \(B \subseteq \mathbb{R}\) com probabilidade \[ P(A \in B) = \langle \Psi | E_A(B) | \Psi \rangle = \|E_A(B)\ket{\Psi}\|^2 \] Após obter resultado em \(B\), o estado colapsa para \[ \ket{\Psi'} = \frac{E_A(B)\ket{\Psi}}{\|E_A(B)\ket{\Psi}\|} \]

Esta formulação acomoda observáveis como posição e momento, cujo espectro é puramente contínuo. A "medição perfeita" de posição resultando em valor exato \(x_0\) corresponderia formalmente a \(E_{\hat{X}}(\{x_0\})\), mas este projetor é nulo em \(L^2(\mathbb{R})\) (a "autofunção" \(\delta(x - x_0)\) não pertence ao espaço de Hilbert). Medições reais possuem resolução finita, correspondendo a \(E_{\hat{X}}([x_0 - \epsilon, x_0 + \epsilon])\) para \(\epsilon > 0\) pequeno mas não-nulo.

O experimento da dupla fenda constitui demonstração paradigmática de superposição quântica e interferência. Sua análise quantitativa ilustra como estrutura matemática de combinações lineares manifesta-se em padrões de detecção observáveis: considere uma partícula (elétron, fóton, átomo) emitida por uma fonte \(S\) em direção a uma barreira com duas fendas \(A\) e \(B\), com tela detectora atrás registrando posição de chegada. Na formulação de Feynman (equivalente ao formalismo de Hilbert), o estado da partícula após passar pela barreira é de superposição \[ \ket{\Psi} = \alpha\ket{\psi_A} + \beta\ket{\psi_B} \] onde \(\ket{\psi_A}\) descreve "partícula passou por \(A\)" e \(\ket{\psi_B}\) descreve "partícula passou por \(B\)". Os coeficientes \(\alpha, \beta\) dependem da geometria, distâncias relativas, e propriedades da fonte.

Expandindo em base de autoestados de posição na tela (representação posicional), a amplitude de detectar a partícula na posição \(x\) da tela é \[ \langle x | \Psi \rangle = \alpha\langle x | \psi_A \rangle + \beta\langle x | \psi_B \rangle \] A probabilidade de detecção em \(x\) torna-se \[ P(x) = |\langle x | \Psi \rangle|^2 = |\alpha|^2|\langle x | \psi_A \rangle|^2 + |\beta|^2|\langle x | \psi_B \rangle|^2 + 2\text{Re}(\alpha^*\beta\langle x | \psi_A \rangle^*\langle x | \psi_B \rangle) \]

Os dois primeiros termos corresponderiam às probabilidades clássicas de detectar partícula vinda de \(A\) ou de \(B\) independentemente. O termo cruzado (associado também a interferência quântica) produz oscilações espaciais — as franjas de interferência observadas experimentalmente. A separação entre máximos sucessivos é determinada pela diferença de fase entre \(\langle x | \psi_A \rangle\) e \(\langle x | \psi_B \rangle\), que por sua vez depende da diferença de caminho óptico entre as trajetórias passando por \(A\) e \(B\).

Crucialmente, se colocarmos detectores nas fendas para determinar por qual fenda a partícula passou, destruímos a superposição. O sistema total (partícula + detectores) evolui para estado entrelaçado \[ \ket{\Psi_{\text{total}}} = \alpha\ket{\psi_A}\ket{D_A} + \beta\ket{\psi_B}\ket{D_B} \] onde \(\ket{D_A}\) e \(\ket{D_B}\) são estados ortogonais dos detectores (registrando passagem por \(A\) ou \(B\)). Tirando o traço sobre os graus de liberdade dos detectores (mais precisamente, o traço parcial, que também será devidamente tratada na próxima seção), o estado reduzido da partícula torna-se mistura estatística \[ \rho_{\text{partícula}} = |\alpha|^2\ket{\psi_A}\bra{\psi_A} + |\beta|^2\ket{\psi_B}\bra{\psi_B} \]

Para estados mistos, probabilidades são médias ponderadas de probabilidades condicionais, sem termos de interferência. A distribuição na tela torna-se \[ P(x) = |\alpha|^2|\langle x | \psi_A \rangle|^2 + |\beta|^2|\langle x | \psi_B \rangle|^2 \] As franjas de interferência desaparecem. Este fenômeno exemplifica complementaridade de Bohr: informação sobre "caminho" (qual fenda) e padrão de interferência (evidência de superposição) são mutuamente exclusivas — adquirir uma destrói a outra. Seguindo Sellars, pode-se distinguir entre a "imagem manifesta"(que inclui conceitos como partícula-clássica-com-trajetória-definida, derivados da experiência perceptiva ordinária e do senso comum) e a "imagem científica" (construída a partir dos postulados teóricos e entidades da ciência, como o vetor de estado em um espaço de Hilbert).

Nesse contexto, a tentação de atribuir uma trajetória clássica bem definida a uma partícula quântica antes da medição resulta de uma imposição inadequada da imagem manifesta sobre o domínio da imagem científica. Na imagem científica fornecida pela mecânica quântica padrão (não-relativística), o estado do sistema antes de uma medição de posição é descrito por um vetor de estado (ou uma função de onda) \( \ket{\Psi} \), que evolue de acordo com a equação de Schrödinger. Esse objeto matemático não codifica nem implica uma trajetória clássica única, mas sim uma superposição de possibilidades (ou uma distribuição de amplitude de probabilidade).

O que a teoria descreve como realidade antes da medição é, portanto, o estado quântico \( \ket{\Psi} \) — uma entidade matemática no espaço de Hilbert que permite calcular probabilidades para resultados de medições possíveis. Afirmar que a "realidade" é a superposição é uma interpretação ontológica (realismo do estado quântico) que vai além do formalismo puro, mas é consistente com uma leitura realista da imagem científica. O ponto crucial é que o formalismo não contém a trajetória clássica como elemento descritivo do sistema não mediado; esta emerge apenas no processo de medição ou em certos limites (como o limite clássico).

Outrossim, a "preservação" ao longo do tempo de superposições quânticas exige uma condição física específica: a coerência. Estados mantêm coerência quando as relações de fase entre componentes da superposição permanecem bem definidas. Decoerência é o processo pelo qual interações com ambiente destroem essas relações de fase, transformando superposições puras em misturas estatísticas.

Definição 1.2 (Matriz Densidade e Coerências): Um estado puro \(\ket{\Psi} = \sum_i c_i\ket{i}\) expresso em base ortonormal \(\{\ket{i}\}\) possui operador de densidade \[ \rho = \ket{\Psi}\bra{\Psi} = \sum_{i,j} c_i c_j^* \ket{i}\bra{j} \] Os elementos diagonais \(\rho_{ii} = |c_i|^2\) são as populações (probabilidades de ocupação). Os elementos fora da diagonal \(\rho_{ij} = c_i c_j^*\) (para \(i \neq j\)) são as coerências, codificando as relações de fase entre componentes da superposição.

Para estado misto (mistura estatística sem superposição genuína), o operador de densidade possui forma \[ \rho_{\text{misto}} = \sum_i p_i \ket{i}\bra{i} \] onde \(p_i\) são probabilidades clássicas. Este operador é diagonal na base \(\{\ket{i}\}\), com todas as coerências nulas: \(\rho_{ij} = 0\) para \(i \neq j\).

A transição de estado puro para misto via decoerência modela-se matematicamente considerando acoplamento com ambiente. Seja \(\mathcal{H}_S\) o espaço de Hilbert do sistema de interesse e \(\mathcal{H}_E\) o espaço do ambiente. O estado inicial é produto \[ \ket{\Psi_{\text{inicial}}} = \left(\sum_i c_i\ket{i}_S\right) \otimes \ket{E_0} \] onde \(\ket{E_0}\) é estado inicial do ambiente. Interação sistema-ambiente gera evolução unitária do sistema total, produzindo entrelaçamento \[ \ket{\Psi(t)} = \sum_i c_i\ket{i}_S \otimes \ket{E_i(t)} \] onde \(\ket{E_i(t)}\) são estados do ambiente correlacionados com estados \(\ket{i}_S\) do sistema.

Tomando traço parcial sobre o ambiente (operação que descarta informação contida nos graus de liberdade ambientais), o estado reduzido do sistema torna-se \[ \rho_S(t) = \text{Tr}_E(\ket{\Psi(t)}\bra{\Psi(t)}) = \sum_{i,j} c_i c_j^* \langle E_j(t) | E_i(t) \rangle \ket{i}_S\bra{j}_S \]

Os termos fora da diagonal decaem proporcionalmente aos overlaps \(\langle E_j(t) | E_i(t) \rangle\). Se os estados ambientais tornam-se rapidamente ortogonais ou quase-ortogonais (\(\langle E_j(t) | E_i(t) \rangle \approx 0\) para \(i \neq j\) e \(t > t_{\text{dec}}\)), as coerências desaparecem: \[ \rho_S(t > t_{\text{dec}}) \approx \sum_i |c_i|^2 \ket{i}_S\bra{i}_S \] O estado reduzido torna-se efetivamente diagonal — mistura estatística, não superposição pura.

Proposição 1.3 (Tempo de Decoerência): O tempo característico de decoerência \(t_{\text{dec}}\) depende de:

  1. Força do acoplamento sistema-ambiente (Hamiltoniano de interação \(\hat{H}_{\text{int}}\))
  2. Número de graus de liberdade do ambiente (quanto maior, mais rápida a decoerência)
  3. Temperatura do ambiente (maior temperatura acelera decoerência)
  4. Separação energética entre estados superpostos (diferenças maiores decoerem mais rapidamente)

Para sistemas macroscópicos acoplados a ambientes térmicos, \(t_{\text{dec}}\) pode ser extremamente curto (femtosegundos ou menos), explicando por que superposições quânticas de objetos macroscópicos não são observadas na experiência cotidiana. Estados de gatos simultaneamente vivos e mortos (paradoxo de Schrödinger) decoerem instantaneamente na prática, produzindo mistura estatística indistinguível de distribuição clássica de probabilidades.

A teoria da decoerência, uma vez que (sob a interpretação de Copenhagen) explica por que o aparelho de medição parece clássico, resolve parcialmente o problema da medição, sem invocar colapso ad hoc. O "colapso" emerge efetivamente da perda de coerências via entrelaçamento com ambiente macroscópico. Contudo, uma questão conceitual persiste: decoerência explica por que parece observar-se resultados definidos (mistura diagonal), mas não resolve o problema de por que medições individuais produzem um resultado específico dentre as possibilidades. Esta limitação motiva formulações alternativas da mecânica quântica (teoria de colapso objetivo, interpretação de muitos mundos, mecânica bohemiana), cada uma com compromissos ontológicos distintos.

Abstendo-se desse processo intelectivo, contudo, encontra-se o empirista construtivo, para quem tal investigação seria, ao menos quanto à sua motivação, desnecessária. Demandar explicação para "qual resultado ocorre realmente" ultrapassa os limites da ciência empírica: a teoria prevê corretamente distribuições estatísticas de resultados — sua adequação empírica está assegurada, e é isso o que importa. Questionar "por que este resultado específico" e buscar novos formalismos que o expliquem configura um mero pseudoproblema metafísico, não uma questão científica legítima. Evidentemente, eu discordo da postura desse empirista metafórico, mas essa é uma discussão que fica para outro texto.

Independentemente de compromissos ontológicos, o formalismo matemático de superposição, medição e decoerência fornece estrutura preditiva extraordinariamente bem-sucedida. Tecnologias quânticas emergentes — computação quântica, criptografia quântica, sensoriamento de precisão — dependem crucialmente de preservar e manipular superposições coerentes. Decoerência deixa de ser problema conceitual abstrato e torna-se desafio de engenharia concreto: isolar qubits de ambientes decoerentes, implementar correção de erros quânticos, operar em tempos menores que \(t_{\text{dec}}\). A estrutura matemática desenvolvida nesta seção fundamenta tanto a compreensão conceitual dos fenômenos quanto a prática tecnológica contemporânea.

§2. O Entrelaçamento Quântico

O entrelaçamento quântico constitui, possivelmente, do fenômeno quântico mais difundido na cultura pop. Formalmente, trata-se de um fenômeno — sem análogo clássico genuíno, diga-se de passagem! — que surge naturalmente da estrutura de produto tensorial de sistemas compostos combinada com o princípio de superposição. Qualitativamente, o entrelaçamento estabelece correlações entre observáveis de subsistemas distintos que transcendem qualquer correlação permitida por teorias clássicas, mesmo aquelas incorporando probabilidades ou incertezas.

Para compreender o entrelaçamento quântico, deve-se primeiro estabelecer como sistemas quânticos compostos são descritos, de um ponto de vista matemático. A estrutura apropriada é o produto tensorial de espaços de Hilbert, que generaliza a noção de produto cartesiano para incorporar a estrutura linear complexa necessária à mecânica quântica.

Definição 2.1 (Produto Tensorial de Espaços de Hilbert): Sejam \(\mathcal{H}_A\) e \(\mathcal{H}_B\) espaços de Hilbert. O produto tensorial \(\mathcal{H}_A \otimes \mathcal{H}_B\) é o espaço de Hilbert caracterizado pela propriedade universal: existe aplicação bilinear \[ \otimes : \mathcal{H}_A \times \mathcal{H}_B \to \mathcal{H}_A \otimes \mathcal{H}_B, \quad (\psi_A, \psi_B) \mapsto \psi_A \otimes \psi_B \] tal que:

  1. O conjunto \(\{\psi_A \otimes \psi_B : \psi_A \in \mathcal{H}_A, \psi_B \in \mathcal{H}_B\}\) tem fecho denso em \(\mathcal{H}_A \otimes \mathcal{H}_B\)
  2. O produto interno é dado por \(\langle \psi_A \otimes \psi_B, \phi_A \otimes \phi_B \rangle = \langle \psi_A, \phi_A \rangle_A \langle \psi_B, \phi_B \rangle_B\)
  3. Toda aplicação bilinear de \(\mathcal{H}_A \times \mathcal{H}_B\) em outro espaço vetorial fatora unicamente através de \(\otimes\)

Nota Técnica 7: Se \(\{\ket{e_i^A}\}\) e \(\{\ket{e_j^B}\}\) são bases ortonormais de \(\mathcal{H}_A\) e \(\mathcal{H}_B\), então \(\{\ket{e_i^A} \otimes \ket{e_j^B}\}\) forma base ortonormal de \(\mathcal{H}_A \otimes \mathcal{H}_B\). Em particular, \(\dim(\mathcal{H}_A \otimes \mathcal{H}_B) = \dim(\mathcal{H}_A) \cdot \dim(\mathcal{H}_B)\).

Recorde da Seção §1 que medidas (em um sentido físico, experimental) são descritas por medidas espectrais \(E : \mathcal{B}(\mathbb{R}) \to \mathcal{P}(\mathcal{H})\). Para sistemas compostos, medições independentes nos subsistemas \(A\) e \(B\) devem corresponder a operadores que agem separadamente: um observável \(\hat{O}_A\) atuando apenas em \(A\) deve ser implementado como \(\hat{O}_A \otimes \mathbb{I}_B\) no sistema composto. Esta estrutura força o uso do produto tensorial.

Proposição 2.1 (Observáveis em Sistemas Compostos): Se \(\hat{A}\) é observável em \(\mathcal{H}_A\) com decomposição espectral \(\hat{A} = \int \lambda \, dE_A(\lambda)\) e \(\hat{B}\) é observável em \(\mathcal{H}_B\), então:

  1. \(\hat{A} \otimes \mathbb{I}_B\) é observável em \(\mathcal{H}_A \otimes \mathcal{H}_B\) representando "medição de \(A\) ignorando \(B\)"
  2. Se \([\hat{A}, \hat{B}] = 0\), então \(\hat{A} \otimes \mathbb{I}_B\) e \(\mathbb{I}_A \otimes \hat{B}\) comutam, permitindo medições simultâneas
  3. A medida conjunta é descrita pelo produto tensorial das PVMs: \(E_{AB}(S \times T) = E_A(S) \otimes E_B(T)\)

Do ponto de vista físico, essa estrutura matemática reflete o fato de que sistemas quânticos compostos são descritos por espaços de estados cujas dimensões crescem multiplicativamente com o número de subsistemas. Essa característica é um alicerce estrutural do entrelaçamento quântico, cuja complexidade cresce de forma exponencial em sistemas de muitos corpos, e fundamenta, em particular, o potencial dos computadores quânticos para tratar problemas que se tornam intratáveis no paradigma clássico.

Contudo, nem todo estado em \(\mathcal{H}_A \otimes \mathcal{H}_B\) possui a forma de um produto, já que a vida não é um morango. Em geral, estes estados não admitem uma fatoração simples em estados dos subsistemas individuais, acarretando em uma correlação de medidas (em um sentido experimental, físico) entre os subsistemas de \(AB\). Essa possibilidade, ausente na mecânica clássica, motiva a distinção entre estados separáveis e estados genuinamente compostos:.

Definição 2.2 (Estado Produto ou Separável Puro): Um estado puro \(\ket{\Psi} \in \mathcal{H}_A \otimes \mathcal{H}_B\) é separável (ou produto) se existem \(\ket{\psi_A} \in \mathcal{H}_A\) e \(\ket{\psi_B} \in \mathcal{H}_B\) tais que \[ \ket{\Psi} = \ket{\psi_A} \otimes \ket{\psi_B} \]

Estados separáveis descrevem situações onde os subsistemas possuem estados independentes bem definidos. Se o sistema composto está no estado \(\ket{\psi_A} \otimes \ket{\psi_B}\), então medições realizadas apenas em \(A\) são completamente determinadas por \(\ket{\psi_A}\), independentemente do que ocorre em \(B\), e vice-versa. Não há correlações — as probabilidades fatoram: \[ P(A \in S, B \in T) = P(A \in S) \cdot P(B \in T) \] para quaisquer conjuntos mensuráveis \(S, T \subseteq \mathbb{R}\).

Definição 2.3 (Estado Entrelaçado): Um estado puro \(\ket{\Psi} \in \mathcal{H}_A \otimes \mathcal{H}_B\) é entrelaçado se não é separável, isto é, se não pode ser escrito como \(\ket{\psi_A} \otimes \ket{\psi_B}\) para quaisquer \(\ket{\psi_A} \in \mathcal{H}_A\), \(\ket{\psi_B} \in \mathcal{H}_B\).

Considere o exemplo paradigmático. Sejam \(\ket{0_A}, \ket{1_A}\) base ortonormal de \(\mathcal{H}_A \cong \mathbb{C}^2\) e \(\ket{0_B}, \ket{1_B}\) base de \(\mathcal{H}_B \cong \mathbb{C}^2\). O estado \[ \ket{\Phi^+} = \frac{1}{\sqrt{2}}(\ket{0_A} \otimes \ket{0_B} + \ket{1_A} \otimes \ket{1_B}) \] é entrelaçado. Para verificar, suponha por contradição que \(\ket{\Phi^+} = (\alpha\ket{0_A} + \beta\ket{1_A}) \otimes (\gamma\ket{0_B} + \delta\ket{1_B})\). Expandindo: \[ \alpha\gamma\ket{0_A}\ket{0_B} + \alpha\delta\ket{0_A}\ket{1_B} + \beta\gamma\ket{1_A}\ket{0_B} + \beta\delta\ket{1_A}\ket{1_B} \] Comparando com \(\ket{\Phi^+}\), necessitamos \(\alpha\gamma = \frac{1}{\sqrt{2}}\), \(\alpha\delta = 0\), \(\beta\gamma = 0\), \(\beta\delta = \frac{1}{\sqrt{2}}\). Mas \(\alpha\delta = 0\) implica \(\alpha = 0\) ou \(\delta = 0\); similarmente \(\beta\gamma = 0\) implica \(\beta = 0\) ou \(\gamma = 0\). Qualquer combinação contradiz \(\alpha\gamma = \beta\delta = \frac{1}{\sqrt{2}} \neq 0\). Logo, \(\ket{\Phi^+}\) não pode ser fatorado — é genuinamente entrelaçado.

A impossibilidade de fatoração significa justamente que os subsistemas não possuem estados quânticos independentes bem definidos. Apenas o sistema composto possui estado puro. Perguntas como "qual é o estado de \(A\)?" ou "qual é o estado de \(B\)?" não admitem resposta em termos de estados puros — apenas estados mistos (operadores de densidade) podem ser atribuídos aos subsistemas. Esta indeterminação intrínseca dos subsistemas num estado entrelaçado faz-me recorrer novamente a Sellars: sua distinção entre a "imagem manifesta" e a "imagem científica" serve como alerta que conceitos cotidianos (como "objeto individual com propriedades independentes") podem ser inadequados para descrever a estrutura profunda da realidade, e o entrelaçamento exemplifica precisamente tal inadequação: a "imagem manifesta" de subsistemas independentes colapsa diante da estrutura holística revelada pela "imagem científica" quântica.

A estrutura de estados entrelaçados é formalizada e caracterizada pelo teorema de decomposição de Schmidt, que fornece forma canônica para estados puros bipartidos:

Teorema 2.1 (Decomposição de Schmidt): Seja \(\ket{\Psi} \in \mathcal{H}_A \otimes \mathcal{H}_B\) um estado puro normalizado. Existem bases ortonormais \(\{\ket{i_A}\}\) de \(\mathcal{H}_A\) e \(\{\ket{i_B}\}\) de \(\mathcal{H}_B\) e coeficientes reais não-negativos \(\lambda_i \geq 0\) com \(\sum_i \lambda_i^2 = 1\) tais que \[ \ket{\Psi} = \sum_{i} \lambda_i \ket{i_A} \otimes \ket{i_B} \] Os coeficientes \(\lambda_i\) são chamados coeficientes de Schmidt, e o número de \(\lambda_i\) não-nulos é o rank de Schmidt de \(\ket{\Psi}\).

Demonstração (esboço): Considere o operador de densidade reduzido de \(A\), definido pela traça parcial sobre \(B\): \[ \rho_A := \text{Tr}_B(\ket{\Psi}\bra{\Psi}) \] Este é operador positivo semi-definido em \(\mathcal{H}_A\) com traço 1. Pelo teorema espectral (Seção §3), existe base ortonormal \(\{\ket{i_A}\}\) de autovetores com autovalores \(\lambda_i^2 \geq 0\): \[ \rho_A = \sum_i \lambda_i^2 \ket{i_A}\bra{i_A} \] Define-se então \(\ket{i_B} := \frac{1}{\lambda_i}(\bra{i_A} \otimes \mathbb{I}_B)\ket{\Psi}\) (para \(\lambda_i \neq 0\)). Verifica-se que \(\{\ket{i_B}\}\) forma conjunto ortonormal e \(\ket{\Psi} = \sum_i \lambda_i \ket{i_A} \otimes \ket{i_B}\). \(\square\)

Corolário 2.1: Um estado puro \(\ket{\Psi}\) é separável se e somente se seu rank de Schmidt é 1.

A decomposição de Schmidt revela quantitativamente "quanto entrelaçamento" existe. Estados com rank 2 possuem entrelaçamento mínimo não-trivial; estados com rank máximo (igual a \(\min(\dim \mathcal{H}_A, \dim \mathcal{H}_B)\)) são maximamente entrelaçados.

Exemplo 2.1 (Estados de Bell): Os quatro estados de Bell em \(\mathbb{C}^2 \otimes \mathbb{C}^2\) formam base ortonormal maximamente entrelaçada: \[ \begin{aligned} \ket{\Phi^+} &= \frac{1}{\sqrt{2}}(\ket{00} + \ket{11}) \\ \ket{\Phi^-} &= \frac{1}{\sqrt{2}}(\ket{00} - \ket{11}) \\ \ket{\Psi^+} &= \frac{1}{\sqrt{2}}(\ket{01} + \ket{10}) \\ \ket{\Psi^-} &= \frac{1}{\sqrt{2}}(\ket{01} - \ket{10}) \end{aligned} \] onde usamos notação abreviada \(\ket{ij} := \ket{i_A} \otimes \ket{j_B}\). Todos possuem rank de Schmidt 2 e coeficientes \(\lambda_1 = \lambda_2 = \frac{1}{\sqrt{2}}\).

Em estados de Bell, medir o spin do primeiro sistema na direção \(z\), obtendo resultado \(\ket{0}\) ou \(\ket{1}\), implica que o segundo sistema colapsa instantaneamente para \(\ket{0}\) ou \(\ket{1}\) (em \(\ket{\Phi^+}\)) ou para o estado correspondente com sinal determinado pela regra do estado. Esta correlação perfeita persiste mesmo que os sistemas estejam arbitrariamente distantes, uma manifestação da não-localidade, tópico da Seção §4. Ademais, embora o rank de Schmidt caracterize bem estados entrelaçados, a entropia de von Neumann trata-se de uma generalização, mais refinada e universalmente aplicável:

Definição 2.4 (Entropia de Entrelaçamento): Seja \(\ket{\Psi} \in \mathcal{H}_A \otimes \mathcal{H}_B\) estado puro. A entropia de entrelaçamento é a entropia de von Neumann do operador de densidade reduzido: \[ S(\Psi) := -\text{Tr}(\rho_A \log_2 \rho_A) = -\sum_i \lambda_i^2 \log_2(\lambda_i^2) \] onde \(\rho_A = \text{Tr}_B(\ket{\Psi}\bra{\Psi})\) e \(\lambda_i\) são os coeficientes de Schmidt.

Nota Técnica 8: Pela simetria do traço parcial, \(S(\rho_A) = S(\rho_B)\) sempre — a entropia de entrelaçamento é propriedade do estado bipartido, não de um subsistema específico.

A entropia de entrelaçamento quantifica "quanto cada subsistema é incerto dado conhecimento perfeito do sistema composto". Para estados separáveis \(\ket{\psi_A} \otimes \ket{\psi_B}\), tem-se que \(\rho_A = \ket{\psi_A}\bra{\psi_A}\) (estado puro), logo \(S = 0\) — nenhum entrelaçamento. Para estados maximamente entrelaçados em \(\mathbb{C}^d \otimes \mathbb{C}^d\) (todos \(\lambda_i = 1/\sqrt{d}\)), obtem-se \(S = \log_2 d\) — entrelaçamento máximo.

Proposição 2.2 (Propriedades da Entropia de Entrelaçamento):

  1. \(0 \leq S(\Psi) \leq \log_2(\min(\dim \mathcal{H}_A, \dim \mathcal{H}_B))\)
  2. \(S(\Psi) = 0 \Leftrightarrow \ket{\Psi}\) é separável
  3. \(S\) é invariante sob transformações unitárias locais: \(S(U_A \otimes U_B \ket{\Psi}) = S(\Psi)\)
  4. \(S\) não pode aumentar sob operações locais e comunicação clássica (LOCC)

A última propriedade — monotonicidade sob LOCC — fundamenta matematicamente a ideia de que entrelaçamento é "recurso" em informação quântica, no sentido de não pode ser criado por operações locais, apenas consumido™ (de modo análogo as mídias) ou preservado. Para estados mistos (descritos por operadores de densidade \(\rho_{AB}\)), a caracterização de entrelaçamento torna-se mais sutil:

Definição 2.5 (Estado Separável Misto): Um operador de densidade \(\rho_{AB}\) em \(\mathcal{H}_A \otimes \mathcal{H}_B\) é separável se pode ser escrito como \[ \rho_{AB} = \sum_i p_i \rho_A^{(i)} \otimes \rho_B^{(i)} \] onde \(p_i \geq 0\), \(\sum_i p_i = 1\), e \(\rho_A^{(i)}\), \(\rho_B^{(i)}\) são operadores de densidade em \(\mathcal{H}_A\) e \(\mathcal{H}_B\). Estados não-separáveis são entrelaçados.

Determinar se um estado misto é entrelaçado é problema computacionalmente difícil (NP-difícil em geral). Critérios necessários ou suficientes existem:

Teorema 2.2 (Critério de Peres-Horodecki/PPT): Seja \(\rho_{AB}\) operador de densidade em \(\mathcal{H}_A \otimes \mathcal{H}_B\). Defina a transposição parcial \(\rho_{AB}^{T_B}\) como transposição apenas no subsistema \(B\). Se \(\rho_{AB}\) é separável, então \(\rho_{AB}^{T_B} \geq 0\) (permanece positivo semi-definido).

Para sistemas \(2 \times 2\) ou \(2 \times 3\), o critério PPT é necessário e suficiente: \(\rho_{AB}\) é separável se e somente se \(\rho_{AB}^{T_B} \geq 0\). Para dimensões maiores, existem estados entrelaçados PPT — entrelaçamento "ligado" que não pode ser destilado em estados maximamente entrelaçados por LOCC. Ao meu ver, a variedade de medidas (métricas, quantificações, powerscaling) de entrelaçamento reflete a complexidade estrutural do fenômeno. Além da entropia de von Neumann, outras medidas incluem:

Merece atenção o fato de que o entrelaçamento é prontamente acomodado no contexto do realismo estrutural ôntico, conforme defendido por Ladyman. Nessa perspectiva, aceita-se como real, no sentido usual do termo, a estrutura relacional codificada na formalização matemática do entrelaçamento quântico, sem qualquer compromisso ontológico com objetos ou propriedades intrínsecas dos sistemas e subsistemas envolvidos. O status ontológico primário recai, assim, sobre a própria estrutura de correlações, e não sobre os “objetos” correlacionados (correlata). Em todo caso, a discussão acerca de métricas de entrelaçamento remete a questões epistemológicas que merecem um exame futuro mais aprofundado.

§3. A Interferência Quântica

A interferência quântica constitui a manifestação observacional mais direta do princípio de superposição. Enquanto a Seção §1 estabeleceu a estrutura matemática de estados superpostos e suas propriedades formais, esta seção examina como superposições manifestam-se em padrões experimentais quantitativos através de fenômenos interferométricos. A interferência distingue-se dos demais fenômenos quânticos por sua acessibilidade experimental imediata e sua resistência a interpretações clássicas alternativas. Onde entrelaçamento (Seção §2) exige sistemas compostos e não-localidade (Seção §4) demanda correlações espacialmente separadas, a interferência emerge mesmo para partículas únicas propagando-se isoladamente, revelando de forma inequívoca a natureza ondulatória da matéria codificada na função de onda.

Recorde da Seção §1 que estados quânticos combinam-se linearmente: dados \(\ket{\psi}, \ket{\phi} \in \mathcal{H}\) e coeficientes complexos \(\alpha, \beta \in \mathbb{C}\), a superposição \(\ket{\Psi} = \alpha\ket{\psi} + \beta\ket{\phi}\) representa estado fisicamente realizável. A probabilidade de transição para estado \(\ket{\chi}\) obedece \[ P(\Psi \to \chi) = |\langle \chi | \Psi \rangle|^2 = |\alpha\langle \chi | \psi \rangle + \beta\langle \chi | \phi \rangle|^2 \] Expandindo o módulo quadrado, obtém-se \[ P(\Psi \to \chi) = |\alpha|^2|\langle \chi | \psi \rangle|^2 + |\beta|^2|\langle \chi | \phi \rangle|^2 + 2\text{Re}(\alpha^*\beta\langle \chi | \psi \rangle^*\langle \chi | \phi \rangle) \]

O termo cruzado \(2\text{Re}(\alpha^*\beta\langle \chi | \psi \rangle^*\langle \chi | \phi \rangle)\) representa a interferência propriamente dita. Sua presença viola a aditividade clássica de probabilidades, onde eventos mutuamente exclusivos satisfazem \(P(A \cup B) = P(A) + P(B)\). Como já mencionado, em mecânica quântica, probabilidades de amplitudes superpostas podem ser maiores (interferência construtiva) ou menores (interferência destrutiva) que a soma das probabilidades individuais.

Cabe notar que o termo de interferência depende crucialmente das fases relativas entre \(\alpha\) e \(\beta\), assim como entre \(\langle \chi | \psi \rangle\) e \(\langle \chi | \phi \rangle\). Pode-se escrever \(\alpha = |\alpha|e^{i\theta_\alpha}\) e \(\beta = |\beta|e^{i\theta_\beta}\), obtendo \[ \alpha^*\beta = |\alpha||\beta|e^{i(\theta_\beta - \theta_\alpha)} \] A diferença de fase \(\Delta\theta = \theta_\beta - \theta_\alpha\) determina se a interferência é construtiva (\(\Delta\theta \approx 0\), termo positivo máximo) ou destrutiva (\(\Delta\theta \approx \pi\), termo negativo máximo). Esta dependência de fase é característica distintiva da interferência quântica, sem análogo em teorias clássicas de partículas.

Proposição 3.1 (Visibilidade de Franjas de Interferência). Considere superposição \(\ket{\Psi} = \alpha\ket{\psi} + \beta\ket{\phi}\) com \(\langle \psi | \phi \rangle = 0\) (estados ortogonais) e medição de observável \(\hat{A}\) com autovalores discretos. A visibilidade ou contraste das franjas de interferência define-se por \[ V := \frac{P_{\text{max}} - P_{\text{min}}}{P_{\text{max}} + P_{\text{min}}} \] onde \(P_{\text{max}}\) e \(P_{\text{min}}\) denotam as probabilidades máxima e mínima observadas ao variar a fase relativa entre \(\alpha\) e \(\beta\). Para estados normalizados, tem-se \[ V = 2|\alpha||\beta| \] com máximo \(V = 1\) quando \(|\alpha| = |\beta| = 1/\sqrt{2}\).

Demonstração. A probabilidade de detectar resultado específico varia com a fase relativa \(\Delta\theta\) entre \(\alpha\) e \(\beta\). O termo de interferência oscila entre \(+2|\alpha||\beta||\langle \chi | \psi \rangle||\langle \chi | \phi \rangle|\) e \(-2|\alpha||\beta||\langle \chi | \psi \rangle||\langle \chi | \phi \rangle|\). As probabilidades extremas são \[ P_{\text{max}} = |\alpha|^2|\langle \chi | \psi \rangle|^2 + |\beta|^2|\langle \chi | \phi \rangle|^2 + 2|\alpha||\beta||\langle \chi | \psi \rangle||\langle \chi | \phi \rangle| \] \[ P_{\text{min}} = |\alpha|^2|\langle \chi | \psi \rangle|^2 + |\beta|^2|\langle \chi | \phi \rangle|^2 - 2|\alpha||\beta||\langle \chi | \psi \rangle||\langle \chi | \phi \rangle| \] Substituindo na definição de \(V\) e assumindo \(|\langle \chi | \psi \rangle| = |\langle \chi | \phi \rangle|\) (situação típica em interferômetros simétricos), obtém-se \(V = 2|\alpha||\beta|\). \(\square\)

A visibilidade quantifica quão pronunciadas são as franjas de interferência. Para \(V = 1\), observam-se oscilações completas entre probabilidade zero e probabilidade máxima. Para \(V = 0\), as oscilações desaparecem, indicando ausência de interferência. A relação entre visibilidade e amplitudes de probabilidade conecta-se diretamente ao formalismo de espaços de Hilbert desenvolvido na Seção §2 (Parte I), onde a estrutura de produto interno determina sobreposições e ortogonalidades entre estados.

A formulação de Feynman da mecânica quântica oferece uma perspectiva alternativa sobre interferência. Enquanto a formulação de Schrödinger (baseada em operadores e espaços de Hilbert, e a qual eu me refiro quando emprego termos como "formalismo usual") enfatiza estados e observáveis, a formulação de integrais de caminho enfatiza trajetórias e amplitudes associadas.

Princípio Fundamental de Feynman. A amplitude de transição para que partícula propague-se de ponto \(x_i\) no tempo \(t_i\) até ponto \(x_f\) no tempo \(t_f\) obtém-se somando contribuições de todas as trajetórias possíveis conectando esses pontos. Cada trajetória \(\gamma\) contribui com amplitude complexa \[ A[\gamma] = e^{iS[\gamma]/\hbar} \] onde \(S[\gamma] = \int_{t_i}^{t_f} L(x(t), \dot{x}(t), t) \, dt\) é a ação clássica ao longo da trajetória, com \(L\) denotando a Lagrangiana do sistema — discuti sobre estes conceitos aqui. A amplitude total é a integral funcional \[ \langle x_f, t_f | x_i, t_i \rangle = \int \mathcal{D}[x(t)] \, e^{iS[x(t)]/\hbar} \]

Esta formulação conecta-se à interferência da seguinte forma. Considere uma situação onde existem dois caminhos principais \(\gamma_1\) e \(\gamma_2\) entre pontos inicial e final (como no experimento da dupla fenda, onde \(\gamma_1\) passa pela fenda A e \(\gamma_2\) pela fenda B). Na aproximação semiclássica, pode-se escrever \[ \langle x_f, t_f | x_i, t_i \rangle \approx A_1 e^{iS_1/\hbar} + A_2 e^{iS_2/\hbar} \] onde \(S_1 = S[\gamma_1]\) e \(S_2 = S[\gamma_2]\) são as ações clássicas ao longo dos dois caminhos, e \(A_1, A_2\) são fatores de normalização dependentes da geometria.

A probabilidade de transição torna-se \[ P(x_f, t_f | x_i, t_i) = |\langle x_f, t_f | x_i, t_i \rangle|^2 \approx |A_1|^2 + |A_2|^2 + 2|A_1||A_2|\cos\left(\frac{S_1 - S_2}{\hbar}\right) \] O termo oscilatório \(\cos((S_1 - S_2)/\hbar)\) representa a interferência entre os dois caminhos. A diferença de ação \(\Delta S = S_1 - S_2\) determina se a interferência é construtiva ou destrutiva. Para \(\Delta S = n \cdot 2\pi\hbar\) (com \(n\) inteiro), tem-se interferência construtiva; para \(\Delta S = (n + 1/2) \cdot 2\pi\hbar\), destrutiva.

É instrutivo observar que, no limite clássico \(\hbar \to 0\), a fase \(S/\hbar\) varia rapidamente. Trajetórias com ações ligeiramente diferentes contribuem com fases vastamente distintas, levando a cancelamentos destrutivos massivos. Apenas trajetórias próximas àquela de ação estacionária \(\delta S = 0\) (a trajetória clássica) contribuem coerentemente. Recupera-se assim o princípio de Hamilton da mecânica clássica como limite da soma de Feynman. A interferência quântica, destarte, revela-se fundamental: o comportamento clássico emerge como caso especial onde apenas um caminho (o extremal) contribui efetivamente.

Exemplo 3.1 (Interferômetro de Mach-Zehnder). Considere um fóton propagando-se através de interferômetro com dois braços. No primeiro divisor de feixe (beam splitter), a amplitude divide-se em \(\alpha\ket{\text{braço 1}} + \beta\ket{\text{braço 2}}\). Após percorrer os braços e recombinar no segundo divisor, a amplitude final depende das fases acumuladas. Se o braço 1 introduz fase \(\phi_1\) e o braço 2 introduz \(\phi_2\), a probabilidade de detectar o fóton na saída A é \[ P_A = \frac{1}{2}\left[1 + \cos(\phi_1 - \phi_2)\right] \] A diferença de fase \(\Delta\phi = \phi_1 - \phi_2\) pode ser controlada ajustando-se o comprimento óptico dos braços ou inserindo placas birrefringentes. Variando \(\Delta\phi\), observam-se oscilações completas entre \(P_A = 0\) e \(P_A = 1\), demonstrando interferência com visibilidade máxima.

A relação entre visibilidade de interferência e informação sobre trajetórias percorridas constitui manifestação profunda do princípio de complementaridade de Bohr. Pode-se formalizar esta relação quantitativamente através de desigualdades matemáticas rigorosas. Considere um experimento de dupla fenda onde se possui alguma informação sobre qual fenda a partícula atravessou. Modela-se isto introduzindo detectores nas fendas que deixam o sistema em estado correlacionado \[ \ket{\Psi} = \alpha\ket{\psi_A}\ket{D_A} + \beta\ket{\psi_B}\ket{D_B} \] onde \(\ket{D_A}\) e \(\ket{D_B}\) representam estados dos detectores. A distinguibilidade ou informação de caminho quantifica-se pelo overlap entre estados dos detectores. Define-se \[ D := |\langle D_A | D_B \rangle| \] com \(D = 0\) indicando estados perfeitamente distinguíveis (informação completa sobre o caminho) e \(D = 1\) indicando estados idênticos (nenhuma informação).

Tomando traço parcial sobre os detectores, obtém-se o operador de densidade reduzido da partícula. As coerências deste operador, que determinam a visibilidade das franjas, são suprimidas pelo fator \(D\). Pode-se demonstrar rigorosamente que visibilidade e distinguibilidade satisfazem \[ V^2 + \mathcal{D}^2 \leq 1 \] onde \(\mathcal{D} = \sqrt{1 - D^2}\) mede a distinguibilidade complementar. Esta desigualdade, devida a Greenberger e Yasin, quantifica a complementaridade: quanto mais informação se possui sobre o caminho (\(\mathcal{D}\) próximo de 1), menor a visibilidade das franjas (\(V\) próximo de 0), e vice-versa.

Teorema 3.1 (Relação Complementaridade-Interferência). Seja sistema bipartido com estado \(\ket{\Psi} = \sum_i c_i \ket{\psi_i}\ket{E_i}\) onde \(\{\ket{\psi_i}\}\) são estados ortogonais do sistema de interesse e \(\{\ket{E_i}\}\) são estados (possivelmente não-ortogonais) de marcadores de caminho. A visibilidade das franjas de interferência e a distinguibilidade dos marcadores satisfazem \[ V \leq \sqrt{1 - \mathcal{D}^2} \] com igualdade alcançada quando os coeficientes \(c_i\) possuem módulos iguais.

Demonstração (esboço). A matriz densidade reduzida do sistema é \(\rho_S = \sum_{i,j} c_i c_j^* \langle E_j | E_i \rangle \ket{\psi_i}\bra{\psi_j}\). As coerências \(\rho_{ij}\) (com \(i \neq j\)) são suprimidas pelos overlaps \(\langle E_j | E_i \rangle\). A visibilidade relaciona-se à magnitude das coerências, enquanto a distinguibilidade relaciona-se aos overlaps dos marcadores. Maximizando a visibilidade sujeita às restrições de normalização e ortogonalidade, obtém-se a desigualdade. Detalhes completos encontram-se em Englert (Phys. Rev. Lett. 77, 2154, 1996). \(\square\)

Em interferômetros onde se insere detectores parciais de caminho (que fornecem informação probabilística sobre a trajetória sem determinar completamente), observa-se redução proporcional na visibilidade das franjas, reflexo direto deste resultado. Pode-se variar continuamente a quantidade de informação extraída e verificar a desigualdade quantitativamente. Tais experimentos foram realizados com fótons, átomos e moléculas, confirmando a relação prevista com precisão notável.

Note que esta complementaridade difere fundamentalmente de limitações clássicas de precisão. Classicamente, pode-se em princípio medir posição e velocidade de partícula com precisão arbitrária simultaneamente, limitado apenas por imperfeições instrumentais. Quanticamente, a complementaridade é estrutural: a informação de caminho e o padrão de interferência são mutuamente excludentes por razões fundamentais, codificadas na estrutura do espaço de Hilbert e na não-comutatividade de observáveis. A relação \(V^2 + \mathcal{D}^2 \leq 1\) expressa matematicamente esta exclusão mútua.

A descrição formal de interferômetros emprega operadores de divisão e recombinação de feixes, fornecendo arcabouço geral para analisar arranjos experimentais arbitrários.

Definição 3.1 (Operador de Divisão de Feixe). Um divisor de feixe ideal com transmissividade \(T\) e refletividade \(R = 1 - T\) representa-se pelo operador unitário agindo em espaço \(\mathbb{C}^2\) (dois modos espaciais, correspondendo às direções de entrada e saída). Para divisor simétrico (\(T = R = 1/2\)), o operador é \[ \hat{B} = \frac{1}{\sqrt{2}}\begin{pmatrix} 1 & i \\ i & 1 \end{pmatrix} \] onde o fator \(i\) na matriz reflete a diferença de fase de \(\pi/2\) entre reflexão e transmissão.

A unitariedade de \(\hat{B}\) (\(\hat{B}^\dagger\hat{B} = \mathbb{I}\)) garante conservação de probabilidade: a soma das intensidades nos dois modos de saída iguala a intensidade no modo de entrada. Esta unitariedade conecta-se ao formalismo de operadores em espaços de Hilbert desenvolvido na Seção §3 (Parte I), onde operadores unitários implementam transformações reversíveis de estados.

Exemplo 3.2 (Análise do Interferômetro de Mach-Zehnder). Considere fóton iniciando no modo 1. Após o primeiro divisor, o estado torna-se \[ \ket{\Psi_1} = \hat{B}\ket{1} = \frac{1}{\sqrt{2}}(\ket{1} + i\ket{2}) \] Os braços 1 e 2 introduzem mudanças de fase \(\phi_1\) e \(\phi_2\), implementadas pelos operadores \(\hat{U}_1 = e^{i\phi_1}\mathbb{I}\) e \(\hat{U}_2 = e^{i\phi_2}\mathbb{I}\). Após as mudanças de fase, \[ \ket{\Psi_2} = \frac{1}{\sqrt{2}}(e^{i\phi_1}\ket{1} + ie^{i\phi_2}\ket{2}) \] O segundo divisor recombina os modos. Pode-se demonstrar que as probabilidades de detectar o fóton nas saídas A e B são \[ P_A = \frac{1}{2}[1 + \cos(\phi_1 - \phi_2)], \quad P_B = \frac{1}{2}[1 - \cos(\phi_1 - \phi_2)] \] As probabilidades somam-se a 1 (conservação), e oscilam complementarmente conforme varia-se \(\Delta\phi = \phi_1 - \phi_2\).

Para interferômetros mais complexos (múltiplos braços, loops, configurações aninhadas), emprega-se o formalismo matricial sistemático. Cada elemento óptico é representado por matriz unitária, e a propagação completa é obtida ao multiplicar as matrizes na ordem apropriada. Este método conecta-se à teoria de representações de grupos unitários (Seção §4, Parte I), onde transformações ópticas implementam representações do grupo \(U(n)\) no espaço de modos.

Definição 3.2 (Matriz de Transferência). A evolução através de interferômetro com \(n\) modos descreve-se por matriz unitária \(n \times n\) \[ U = \hat{O}_N \cdots \hat{O}_2 \hat{O}_1 \] onde cada \(\hat{O}_i\) representa operador correspondente a elemento óptico individual (divisor de feixe, mudança de fase, espelho). O estado de saída relaciona-se ao estado de entrada por \[ \ket{\Psi_{\text{out}}} = U\ket{\Psi_{\text{in}}} \]

A interferência se manifesta nos elementos fora da diagonal de \(U\), que acoplam modos diferentes. Para \(U_{ij} \neq 0\) com \(i \neq j\), existe amplitude de transição do modo \(j\) ao modo \(i\), possibilitando interferência quando múltiplos caminhos conectam os mesmos pontos inicial e final.

É interessante considerar o caso especial do neutron interferometer, onde nêutrons passam por regiões com potenciais distintos. A diferença de fase acumulada relaciona-se à diferença de energia potencial via \[ \Delta\phi = \frac{1}{\hbar}\int_{\gamma_1} V(x) \, d\ell - \frac{1}{\hbar}\int_{\gamma_2} V(x) \, d\ell \] Variando \(V\) (por exemplo, aplicando campo magnético em região do interferômetro), pode-se controlar \(\Delta\phi\) e observar oscilações na taxa de contagem. Experimentos deste tipo verificaram quantitativamente a dependência de fase prevista, incluindo contribuições gravitacionais (\(V = mgz\)) e inerciais (efeito Sagnac para interferômetros rotativos).

Ademais, pode-se considerar interferência temporal em adição à interferência espacial. Experimentos de echo de spin e interferência de Ramsey envolvem superposições de estados internos de átomos evoluindo em tempos diferentes. A análise matemática é análoga: amplitudes associadas a diferentes histórias temporais interferem, produzindo oscilações observáveis como função do tempo de espera entre pulsos de manipulação.

Proposição 3.2 (Interferência de Ramsey). Considere átomo de dois níveis com splitting energético \(\omega_0\) entre estados \(\ket{0}\) e \(\ket{1}\). Aplica-se pulso de \(\pi/2\) no tempo \(t = 0\), criando superposição \(\ket{\Psi(0^+)} = (\ket{0} + \ket{1})/\sqrt{2}\). Após tempo livre \(T\), aplica-se segundo pulso de \(\pi/2\). A probabilidade de encontrar o átomo no estado \(\ket{1}\) após o segundo pulso é \[ P_1(T) = \frac{1}{2}[1 + \cos(\omega_0 T)] \] As oscilações de Ramsey fornecem método preciso para medir \(\omega_0\), formando base de relógios atômicos de alta precisão.

Por conseguinte, a interferometria quântica não se limita a fenômenos espaciais. Qualquer situação onde múltiplas amplitudes contribuem para transição entre estados inicial e final produz interferência, desde que coerência seja mantida. A universalidade do fenômeno reflete a universalidade do princípio de superposição: a estrutura linear do espaço de Hilbert implica que amplitudes sempre se somam antes do cálculo de probabilidades (módulo quadrado). Destarte, a interferência quântica se apresenta como uma consequência inexorável da estrutura matemática da teoria.

§4. Não-localidade

A não-localidade representa, possivelmente, o fenômeno mais filosoficamente provocativo da mecânica quântica, uma vez que desafia os consensos filósifico do corpo social que o produz (os cientistas naturais). Enquanto superposição (Seção §1) desafia intuições sobre estados individuais e interferência (Seção §3) revela propriedades ondulatórias da matéria — i.e., força reinterpretações de ou adições à conceitos menos fundamentais, em um âmbito intra-téorico —, a não-localidade impõe um revisão a nível meta-teórico: ela questiona pressupostos ontológicos, como o realismo local, que precedem e fundamentam a investigação do cientista natural. Estados entrelaçados (Seção §2) exibem correlações entre medições espacialmente separadas que transcendem qualquer explicação possível via teorias clássicas de variáveis ocultas locais. Esta seção desenvolve rigorosamente o argumento de Einstein-Podolsky-Rosen (EPR), deriva as desigualdades de Bell que testam realismo local, examina verificações experimentais que violam essas desigualdades, e analisa as implicações para nossa compreensão da estrutura causal do espaço-tempo.

Em 1935, Einstein, Podolsky e Rosen publicaram artigo argumentando que a mecânica quântica, embora empiricamente adequada, não poderia constituir teoria completa da realidade física. O argumento repousa em três pressupostos considerados razoáveis por seus autores, dentro no formalismo usual da teoria.

Pressupostos do Argumento EPR.

  1. Realismo: Elementos de realidade física existem independentemente de observação. Se uma grandeza pode ser prevista com certeza absoluta sem perturbar o sistema, existe elemento de realidade correspondente.
  2. Localidade: Operações realizadas em sistema A não podem afetar instantaneamente estado físico de sistema B espacialmente separado.
  3. Completude: Uma teoria completa (uma teoria de tudo) deve fornecer elemento teórico correspondente a cada elemento de realidade física.

A formulação original de EPR considerava medições de posição e momento de partículas correlacionadas. Bohm posteriormente simplificou o argumento usando medições de spin, versão que apresentamos aqui por fins pedagógicos, uma vez que apresenta uma clareza formal e conceitual que facilitam sua apreensão.

Cenário de Bohm-EPR. Considere sistema de dois spins-\(\frac{1}{2}\) preparado no estado singleto (estado de Bell antisimétrico) \[ \ket{\Psi^-} = \frac{1}{\sqrt{2}}(\ket{\uparrow}_A\ket{\downarrow}_B - \ket{\downarrow}_A\ket{\uparrow}_B) \] onde \(\ket{\uparrow}\) e \(\ket{\downarrow}\) denotam autoestados de \(\hat{\sigma}_z\) com autovalores \(+1\) e \(-1\) respectivamente. As partículas propagam-se para regiões espacialmente separadas, mantendo entrelaçamento.

Se o observador em A mede \(\hat{\sigma}_z\) e obtém resultado \(+1\), o estado colapsa instantaneamente (segundo o postulado de projeção, Seção §1) para \(\ket{\uparrow}_A\ket{\downarrow}_B\). Uma medição subsequente de \(\hat{\sigma}_z\) em B resultará certamente em \(-1\). Analogamente, medindo \(\hat{\sigma}_x\) em A e obtendo \(+1\), pode-se prever com certeza o resultado \(-1\) para medição de \(\hat{\sigma}_x\) em B.

O argumento de EPR prossegue assim. Pelo pressuposto de localidade, a escolha de medição em A (se medir \(\hat{\sigma}_z\) ou \(\hat{\sigma}_x\)) não pode afetar o estado físico real em B. Contudo, dependendo desta escolha, pode-se prever com certeza diferentes quantidades em B (\(\hat{\sigma}_z^B\) ou \(\hat{\sigma}_x^B\)). Pelo critério de realidade, ambas as quantidades devem possuir valores definidos simultaneamente em B, independentemente do que se mede. A mecânica quântica, porém, não atribui valores simultâneos a \(\hat{\sigma}_z^B\) e \(\hat{\sigma}_x^B\) (operadores não-comutativos). Conclui-se que a teoria é incompleta: existem elementos de realidade (valores simultâneos de observáveis não-comutativos) não descritos pela função de onda.

Einstein esperava que teoria mais completa, incorporando variáveis ocultas adicionais, restaurasse determinismo local e completude. A resposta definitiva veio três décadas depois com o trabalho de Bell, demonstrando matematicamente que nenhuma teoria de variáveis ocultas locais pode reproduzir todas as previsões da mecânica quântica.

Antes de derivar as desigualdades de Bell, convém formalizar precisamente o que constitui teoria de variáveis ocultas local:

Definição 4.1 (Teoria de Variáveis Ocultas Local). Uma teoria de variáveis ocultas local para sistemas bipartidos consiste em:

  1. Um espaço de variáveis ocultas \(\Lambda\) com uma medida de probabilidade \(\rho(\lambda)\) satisfazendo \(\rho(\lambda) \geq 0\) e \(\int_{\Lambda} \rho(\lambda) \, d\lambda = 1\).
  2. Para cada escolha de configurações experimentais (direções de medição \(\mathbf{a}\) para o subsistema A e \(\mathbf{b}\) para o subsistema B), funções de resposta determinísticas \[ A(\mathbf{a}, \lambda) \in \{-1, +1\}, \quad B(\mathbf{b}, \lambda) \in \{-1, +1\} \] que fornecem os resultados das medições dado o estado oculto \(\lambda\).
  3. Localidade (Fatorabilidade): \(A(\\mathbf{a}, \lambda)\) é independente de \(\mathbf{b}\), e \(B(\mathbf{b}, \lambda)\) é independente de \(\mathbf{a}\).
  4. Independência do Medidor (Liberdade de Escolha): A distribuição de probabilidade \(\rho(\lambda)\) é independente das escolhas experimentais, ou seja, \(\rho(\lambda | \mathbf{a}, \mathbf{b}) = \rho(\lambda)\).

A probabilidade conjunta de obter resultados \(a\) (em A) e \(b\) (em B) ao medir nas direções \(\mathbf{a}\) e \(\mathbf{b}\) obtém-se pela média sobre as variáveis ocultas: \[ P(a, b | \mathbf{a}, \mathbf{b}) = \int_{\Lambda} \rho(\lambda) \, \delta_{a, A(\mathbf{a}, \lambda)} \, \delta_{b, B(\mathbf{b}, \lambda)} \, d\lambda, \] onde \(\delta\) é o delta de Kronecker. O valor esperado da correlação é \[ E(\mathbf{a}, \mathbf{b}) = \int_{\Lambda} A(\mathbf{a}, \lambda) \, B(\mathbf{b}, \lambda) \, \rho(\lambda) \, d\lambda. \]

A condição de localidade (item 3) codifica matematicamente a separabilidade einsteiniana: o resultado em A depende apenas da configuração local em A (direção \(\mathbf{a}\)) e das variáveis ocultas \(\lambda\), mas não da escolha remota \(\mathbf{b}\). Esta condição implementa causalidade relativística: eventos tipo-espaço separados não podem influenciar-se mutuamente.

Note que variáveis ocultas não-locais (onde \(A\) depende de \(\mathbf{b}\)) são logicamente consistentes e podem reproduzir previsões quânticas (teoria de de Broglie-Bohm exemplifica isto). O teorema de Bell refere-se especificamente a variáveis ocultas locais, mostrando sua incompatibilidade com mecânica quântica. Com isso, podemos enunciar o Teorema de Bell:

Teorema 4.1 (Desigualdade de Bell Original). Seja teoria de variáveis ocultas local conforme Definição 4.1, com resultados \(A(\mathbf{a}, \lambda), B(\mathbf{b}, \lambda) \in \{-1, +1\}\). Considere três direções de medição \(\mathbf{a}\), \(\mathbf{b}\), \(\mathbf{c}\). Defina as correlações \[ E(\mathbf{a}, \mathbf{b}) := \int \rho(\lambda) A(\mathbf{a}, \lambda) B(\mathbf{b}, \lambda) \, d\lambda \] Então vale a desigualdade \[ |E(\mathbf{a}, \mathbf{b}) - E(\mathbf{a}, \mathbf{c})| \leq 1 + E(\mathbf{b}, \mathbf{c}) \]

Demonstração. Por hipótese, \(A(\mathbf{a}, \lambda) \in \{-1, +1\}\) e \(B(\mathbf{b}, \lambda) \in \{-1, +1\}\) para todo \(\lambda\). Tem-se a identidade algébrica \[ A(\mathbf{a}, \lambda)B(\mathbf{b}, \lambda) - A(\mathbf{a}, \lambda)B(\mathbf{c}, \lambda) = A(\mathbf{a}, \lambda)B(\mathbf{b}, \lambda)[1 - B(\mathbf{b}, \lambda)B(\mathbf{c}, \lambda)] \] pois \(B(\mathbf{b}, \lambda)^2 = 1\). Tomando valor absoluto e usando \(|A| = |B| = 1\), \[ |A(\mathbf{a}, \lambda)B(\mathbf{b}, \lambda) - A(\mathbf{a}, \lambda)B(\mathbf{c}, \lambda)| = |1 - B(\mathbf{b}, \lambda)B(\mathbf{c}, \lambda)| \] Note que \(1 - B(\mathbf{b}, \lambda)B(\mathbf{c}, \lambda) \in \{0, 2\}\) (iguala 0 quando \(B(\mathbf{b}, \lambda) = B(\mathbf{c}, \lambda)\) e 2 caso contrário). Logo \[ |A(\mathbf{a}, \lambda)B(\mathbf{b}, \lambda) - A(\mathbf{a}, \lambda)B(\mathbf{c}, \lambda)| \leq 1 + B(\mathbf{b}, \lambda)B(\mathbf{c}, \lambda) \] Integrando sobre \(\lambda\) com peso \(\rho(\lambda)\), \[ \left|\int \rho(\lambda)[A(\mathbf{a}, \lambda)B(\mathbf{b}, \lambda) - A(\mathbf{a}, \lambda)B(\mathbf{c}, \lambda)] d\lambda\right| \leq \int \rho(\lambda)[1 + B(\mathbf{b}, \lambda)B(\mathbf{c}, \lambda)] d\lambda \] Reconhecendo as definições de \(E(\mathbf{a}, \mathbf{b})\), obtém-se o resultado. \(\square\)

Para demonstrar violação quântica, considere estado singleto \(\ket{\Psi^-}\) e medições de spin ao longo de direções unitárias \(\mathbf{a}\), \(\mathbf{b}\), \(\mathbf{c}\). A mecânica quântica prevê \[ E_{\text{QM}}(\mathbf{a}, \mathbf{b}) = \langle \Psi^- | (\mathbf{\sigma}_A \cdot \mathbf{a}) \otimes (\mathbf{\sigma}_B \cdot \mathbf{b}) | \Psi^- \rangle = -\mathbf{a} \cdot \mathbf{b} \] onde \(\mathbf{\sigma} = (\sigma_x, \sigma_y, \sigma_z)\) denota vetor de matrizes de Pauli. Escolhendo direções coplanares com ângulos específicos (\(\mathbf{a}\) e \(\mathbf{c}\) formando ângulo de \(120°\), \(\mathbf{b}\) bissetando), pode-se violar a desigualdade de Bell. Contudo, formulação mais robusta e experimentalmente conveniente é a desigualdade CHSH.

Outro resultado de relevância no contexto da desigualdade de Bell e que vale ser mencionado, é o de Clauser, Horne, Shimony e Holt. Em 1969, este quarteto (nada fantástico para os realistas locais) derivou uma versão da desigualdade de Bell particularmente adequada para verificação experimental:

Teorema 4.2 (Desigualdade CHSH). Seja teoria de variáveis ocultas local com quatro configurações de medição: direções \(\mathbf{a}_1, \mathbf{a}_2\) para A e \(\mathbf{b}_1, \mathbf{b}_2\) para B. Defina a quantidade CHSH \[ S := E(\mathbf{a}_1, \mathbf{b}_1) + E(\mathbf{a}_1, \mathbf{b}_2) + E(\mathbf{a}_2, \mathbf{b}_1) - E(\mathbf{a}_2, \mathbf{b}_2) \] Então \[ |S| \leq 2 \] para qualquer teoria de variáveis ocultas local.

Demonstração. Para cada \(\lambda\), defina \(A_i := A(\mathbf{a}_i, \lambda)\) e \(B_j := B(\mathbf{b}_j, \lambda)\) com \(A_i, B_j \in \{-1, +1\}\). Considere a quantidade \[ S(\lambda) := A_1 B_1 + A_1 B_2 + A_2 B_1 - A_2 B_2 = A_1(B_1 + B_2) + A_2(B_1 - B_2) \] Como \(B_1, B_2 \in \{-1, +1\}\), exatamente uma das quantidades \((B_1 + B_2)\) ou \((B_1 - B_2)\) anula-se. Logo \(|S(\lambda)| = 2\) para todo \(\lambda\). Por conseguinte, \[ |S| = \left|\int \rho(\lambda) S(\lambda) d\lambda\right| \leq \int \rho(\lambda) |S(\lambda)| d\lambda = 2 \] \(\square\)

A mecânica quântica viola esta desigualdade. Para o estado singleto e escolha otimizada de direções (configuração de 45°), obtém-se \[ S_{\text{QM}} = 2\sqrt{2} \approx 2.828 \] violando claramente o limite clássico de 2. Este valor representa o máximo de Tsirelson, limite superior para correlações quânticas.

Proposição 4.1 (Configuração Ótima para CHSH). Seja estado singleto \(\ket{\Psi^-}\). Escolhendo direções de medição no plano \(xy\) com \[ \mathbf{a}_1 = (1, 0, 0), \quad \mathbf{a}_2 = (0, 1, 0), \quad \mathbf{b}_1 = \frac{1}{\sqrt{2}}(1, 1, 0), \quad \mathbf{b}_2 = \frac{1}{\sqrt{2}}(1, -1, 0) \] obtém-se \(S_{\text{QM}} = 2\sqrt{2}\).

Demonstração. Calculando as correlações usando \(E_{\text{QM}}(\mathbf{a}, \mathbf{b}) = -\mathbf{a} \cdot \mathbf{b}\), \[ \begin{aligned} E(\mathbf{a}_1, \mathbf{b}_1) &= -\frac{1}{\sqrt{2}} \\ E(\mathbf{a}_1, \mathbf{b}_2) &= -\frac{1}{\sqrt{2}} \\ E(\mathbf{a}_2, \mathbf{b}_1) &= -\frac{1}{\sqrt{2}} \\ E(\mathbf{a}_2, \mathbf{b}_2) &= +\frac{1}{\sqrt{2}} \end{aligned} \] Substituindo em \(S\), \[ S = -\frac{1}{\sqrt{2}} - \frac{1}{\sqrt{2}} - \frac{1}{\sqrt{2}} - \frac{1}{\sqrt{2}} = -\frac{4}{\sqrt{2}} = -2\sqrt{2} \] Logo \(|S| = 2\sqrt{2}\). \(\square\)

Testes experimentais da desigualdade CHSH foram realizados com diversas implementações físicas: pares de fótons entrelaçados (experimentos de Aspect et al., 1982), íons aprisionados, átomos neutros, supercondutores, entre outros. Os resultados consistentemente confirmam violações quânticas, descartando teorias de variáveis ocultas locais.

Experimentos de Aspect (1982). Aspect, Dalibard e Roger realizaram experimentos cruciais usando pares de fótons entrelaçados gerados por cascata atômica em cálcio. Inovações incluíram:

  1. Comutação rápida e aleatória das direções de medição enquanto fótons estavam em voo, fechando loophole de localidade
  2. Separação espacial de detectores garantindo independência causal relativística
  3. Eficiência de detecção suficientemente alta para resultados estatisticamente significativos

Os resultados mediram \(S_{\text{exp}} = 2.697 \pm 0.015\), violando novamente o limite clássico. Experimentos subsequentes (Weihs et al. 1998, com separação de 400 metros; Giustina et al. 2015 e Shalm et al. 2015, fechando simultaneamente loopholes de localidade e detecção) confirmaram violações com significância crescente.

Note que estes experimentos não apenas verificam previsões da mecânica quântica, mas testam hipótese ontológica fundamental sobre estrutura causal da natureza. A violação de desigualdades de Bell implica que pelo menos uma das seguintes suposições deve ser abandonada:

  1. Realismo: Propriedades físicas existem independentemente de medição
  2. Localidade: Eventos tipo-espaço separados não se influenciam instantaneamente
  3. Liberdade de escolha: Configurações de medição podem ser escolhidas independentemente de variáveis ocultas

A mecânica quântica "ortodoxa" preserva localidade relativística (nenhuma sinalização superluminal possível) mas abandona realismo local: propriedades mensuráveis não possuem valores definidos antes de medição. Interpretações alternativas fazem escolhas diferentes (teoria de Bohm preserva realismo mas abandona localidade; superdeterminismo nega liberdade de escolha). Dito isso, a distinção formal entre correlações quânticas e clássicas dá-se através de politopos de correlações:

Definição 4.2 (Politopo Clássico de Correlações). O conjunto de correlações \(\{E(\mathbf{a}_i, \mathbf{b}_j)\}\) realizáveis por teorias de variáveis ocultas locais forma politopo convexo \(\mathcal{L}\) em espaço de dimensão \(n \times m\) (para \(n\) configurações em A e \(m\) em B). Os vértices deste politopo correspondem a funções determinísticas \(A(\mathbf{a}_i) \in \{-1, +1\}\), \(B(\mathbf{b}_j) \in \{-1, +1\}\).

Para o caso CHSH (duas configurações em cada lado), o politopo \(\mathcal{L}\) é caracterizado por \(|S| \leq 2\). O conjunto de correlações quânticas \(\mathcal{Q}\) estende-se além de \(\mathcal{L}\), atingindo \(|S| = 2\sqrt{2}\). Contudo, nem todas as correlações imagináveis são permitidas:

Teorema 4.3 (Limite de Tsirelson). Para qualquer estado quântico e quaisquer observáveis dicotômicos em sistemas bipartidos, a quantidade CHSH satisfaz \[ |S_{\text{QM}}| \leq 2\sqrt{2} \] Este limite é atingível (por estado singleto com configuração ótima) e não pode ser ultrapassado.

Demonstração (esboço). Os observáveis \(\hat{A}_i\) e \(\hat{B}_j\) são operadores hermitianos com autovalores em \(\{-1, +1\}\), logo \(\hat{A}_i^2 = \hat{B}_j^2 = \mathbb{I}\). Pode-se demonstrar que o operador \[ \hat{S} := \hat{A}_1 \otimes (\hat{B}_1 + \hat{B}_2) + \hat{A}_2 \otimes (\hat{B}_1 - \hat{B}_2) \] satisfaz \(\hat{S}^2 \leq 8\mathbb{I}\). Logo o valor esperado \(\langle \Psi | \hat{S} | \Psi \rangle\) não pode exceder \(2\sqrt{2}\) em magnitude. Detalhes completos encontram-se em Tsirelson, Lett. Math. Phys. 4, 93 (1980). \(\square\)

Destarte, existe uma hierarquia de correlações: clássicas \(\subset\) quânticas \(\subset\) não-sinalização. Teorias supra-quânticas respeitando causalidade relativística (não-sinalização) mas violando limite de Tsirelson são logicamente consistentes, embora não correspondentes à natureza observada. A questão de por que a natureza "escolhe" correlações quânticas, não maximalmente não-locais, permanece tema de investigação (princípios de informação, teoria de decisão quântica, etc.).

Definição 4.3 (Correlações Não-Sinalizadoras). Correlações \(P(a, b | \mathbf{a}, \mathbf{b})\) são não-sinalizadoras se \[ \sum_b P(a, b | \mathbf{a}, \mathbf{b}) = \sum_b P(a, b | \mathbf{a}, \mathbf{b}') \] para todo \(\mathbf{a}, \mathbf{a}', \mathbf{b}, \mathbf{b}'\) (probabilidade marginal em A independe de configuração em B), e simetricamente para B. Esta condição implementa a não simultâneidade da relatividade especial: resultados em A não fornecem informação sobre a escolha de medição em B, se sua separação for do tipo-espaço.

Teorias de caixa-PR (Popescu-Rohrlich) exemplificam correlações maximalmente não-locais respeitando não-sinalização. Para configuração CHSH, caixa-PR fornece \(S = 4\), violando tanto limite clássico quanto quântico. Tais correlações permitiriam comunicação superluminal se combinadas com colapso instantâneo da função de onda, mas respeitam causalidade quando consideradas isoladamente. A não-localidade pode, outrossim, ser quantificada através de medidas de entrelaçamento discutidas na Seção §2. Contudo, entrelaçamento não é suficiente para não-localidade: existem estados entrelaçados (Estados PPT ligados) que não violam desigualdades de Bell. A relação entre entrelaçamento e não-localidade é sutil.

Ademais, foi dito — e demonstrado — que a não-localidade desafia o realismo local. Por conta disso, acredito que convém esboçar como esse problema é tratato por diferentes preponentes do debate entre realismo e antirrealismo científicos. Para um realista crítico, a não-localidade desafia a estratificação ontológica, no seguinte sentido: correlações não-locais pertencem ao domínio empírico (são observáveis), mas os mecanismos generativos subjacentes resistem a localização no domínio atual. Não há evento causal propagando-se de A a B; as correlações emergem holisticamente da estrutura entrelaçada. Poder-se-ia argumentar que o estado entrelaçado habita o domínio real como estrutura generativa não-local, manifestando-se empiricamente em correlações estatísticas, mas essa interpretação força revisão da noção de mecanismo causal local.

Para um realista estrutural, contudo, a situação é mais tênue: ele veria estas correlações não-locais como constituintes de uma estrutura relacional objetiva, mais fundamental que propriedades intrínsecas de subsistemas. O que é real é o padrão de correlações codificado no estado entrelaçado, não valores definidos de spin em A e B antes de medição. Esta perspectiva dissolve o paradoxo EPR: Einstein buscava elementos de realidade (valores de propriedades) que não existem; o que existe é estrutura relacional. A não-localidade não implica ação à distância entre objetos separados, mas reflete estrutura não-separável do estado quântico em espaço de Hilbert. A ontologia adequada para mecânica quântica seria estrutural, não substancialista.

Um empirista construtivo com sua preguiça intelectiva, por outro lado, questionaria se debates sobre realismo local versus não-local não ultrapassaria os limites da ciência empírica. A mecânica quântica é empiricamente adequada: prevê corretamente distribuições de resultados experimentais, incluindo violações de desigualdades de Bell. Questionar "o que realmente acontece" entre preparação e medição, ou "como correlações não-locais são implementadas", pode ser demandar mais que ciência pode oferecer. A adequação empírica esgota o conteúdo científico da teoria; metafísica adicional é opcional, mas sem sentido empírico: um pseudoproblema filosófico.

Contudo, a distinção de Sellars entre imagem manifesta e iamgem científica é, a meu ver, dentre as filosofias citadas aqui, aquela que oferece a abordagem mais adequada ao problema. A não-localidade expõe a inadequação da primeira para captar a estrutura última da realidade. Conceitos do senso comum — objetos separados com propriedades definidas — devem ceder lugar aos da imagem científica (espaços de Hilbert, operadores, emaranhamento). Esta não é uma substituição eliminativa: a imagem manifesta permanece válida na escala macroscópica, onde a decoerência restaura a aparência clássica, mas a ontologia fundamental reside na imagem científica, para a qual a não-localidade é um traço genuíno.

De todo modo, a não-localidade quântica constitui fenômeno empiricamente verificado que força uma séria revisão de pressupostos ontológicos. As violações sistemáticas de desigualdades de Bell não deixam espaço para acomodação confortável dentro de ontologias clássicas: seja abandonando realismo local (interpretação ortodoxa de Copenhague), seja aceitando não-localidade causal explícita (teoria de Bohm), seja revisando radicalmente noções de causalidade e separabilidade (realismo estrutural, superdeterminismo), a física contemporânea exige reconceitualização profunda de categorias metafísicas. A física necessita da filosofia. Estas questões — interpretações da função de onda, ontologia de observáveis, emergência de classicalidade — merecem tratamento mais extenso que será desenvolvido em trabalhos futuros. Por ora, nossa rigorosa jornada através dos fundamentos matemáticos e fenômenos quânticos paradigmáticos estabelece base sólida para apreciação tanto da profundidade técnica quanto das implicações conceituais uma das teorias mais bem-sucedidas da história da ciência.

Conclusão

Este texto percorreu caminho extenso através dos fundamentos matemáticos e fenomenológicos da mecânica quântica, desde estruturas abstratas até manifestações experimentais e implementação técnicas concretas. A Parte I estabeleceu infraestrutura matemática necessária para formulação rigorosa da teoria. A teoria da medida forneceu arcabouço probabilístico essencial, permitindo atribuir probabilidades a eventos físicamente mensuráveis e tratar observáveis com espectro contínuo por meio de medidas projetivas. Espaços de Hilbert serviram de palco para a caracterização de estados quânticos como vetores em espaços vetoriais complexos completos. A teoria de operadores desenvolveu linguagem de observáveis através de operadores auto-adjuntos, com decomposição espectral generalizando diagonalização ao contexto de dimensão infinita e espectro contínuo. Finalmente, teoria de grupos revelou conexões profundas entre simetrias físicas e leis de conservação.

Cada estrutura matemática introduzida respondia a necessidades físicas específicas. Medidas espectrais tornaram-se necessárias para observáveis cujo espectro contínuo não admite autovetores genuínos em espaços de Hilbert. Operadores não-limitados com domínios cuidadosamente especificados emergiram como única maneira de representar quantidades fundamentais satisfazendo relações de comutação canônicas. O teorema de Stone conectou evolução temporal unitária a operadores auto-adjuntos, justificando por que Hamiltonianas devem satisfazer esta condição. Representações de grupos de Lie classificaram possibilidades para momento angular, explicando quantização de spin e multiplicidade de níveis energéticos. A matemática não foi imposta arbitrariamente sobre a física, mas emergiu como a linguagem natural da disciplina.

A Parte II aplicou o formalismo matemático à análise de fenômenos quânticos paradigmáticos. A superposição emergiu como decomposição precisa de estados em combinações lineares com amplitudes de probabilidade complexas, enquanto o colapso recebeu formulação através de projeções espectrais conectadas à regra de Born. A decoerência, modelada via entrelaçamento com ambiente e traço parcial, explicou a emergência de comportamento clássico sem invocar colapso ad hoc. O entrelaçamento revelou-se propriedade estrutural de produtos tensoriais, quantificado pela decomposição de Schmidt e entropia de von Neumann, com estados de Bell exemplificando entrelaçamento máximo. A impossibilidade de fatoração possui significado ontológico profundo: subsistemas entrelaçados não possuem estados puros independentes.

A interferência quântica demonstrou universalidade do princípio de superposição, com a formulação de integrais de caminho de Feynman oferecendo perspectiva onde partículas "exploram todos os caminhos" com pesos dados por fases de ação clássica. A complementaridade entre visibilidade de interferência e informação de caminho recebeu expressão matemática rigorosa, verificada por experimentos de dupla fenda e interferômetros. A não-localidade quântica recebeu tratamento definitivo através de desigualdades de Bell: o argumento EPR foi refutado por violações experimentais consistentes de desigualdades CHSH, demonstrando que estados entrelaçados exibem correlações incompatíveis com teorias que combinam realismo e localidade, forçando revisões de pressupostos ontológicos sobre a natureza da realidade física.

Além disso, este texto explicita a simbiose extraordinária entre matemática e física fundamental. Estruturas matemáticas desenvolvidas por motivações puramente abstratas revelaram-se a linguagem natural, possivelmente única, para a descrição consistente dos fenômenos quânticos. Reciprocamente, problemas oriundos da física estimularam desenvolvimentos matemáticos profundos: a necessidade de tratar operadores não limitados com rigor motivou refinamentos substanciais na teoria espectral, enquanto a quantização de sistemas dotados de simetrias conduziu a conexões estruturais entre geometria diferencial, análise funcional e física matemática. Esse quadro evidencia que a compreensão efetiva de uma teoria física exige o domínio de sua estrutura matemática subjacente. Uma abordagem meramente conceitual ou intuitiva é insuficiente para apreender o conteúdo da teoria em sua plenitude, bem como para discutir de maneira informada suas consequências interpretativas e filosóficas. A reflexão filosófica sobre a física, quando dissociada de familiaridade técnica mínima com os formalismos envolvidos, tende a perder substância explicativa e rigor crítico.

No mais, cabe o aviso: apesar do sucesso extraordinário da mecânica quântica em descrever fenômenos atômicos e subatômicos, questões fundamentais permanecem abertas. O problema da medição ainda carece de resolução consensual. Interpretações competem: teoria de colapso objetivo, interpretação de muitos mundos, mecânica bohemiana, etc. Cada uma resolve certos aspectos conceituais mas gera outros. Paralelamente, a reconciliação entre mecânica quântica e relatividade geral constitui um dos grandes desafios da física teórica contemporânea. A gravitação quântica exige estruturas matemáticas além daquelas desenvolvidas nas Partes I e II deste texto — teoria de cordas, gravidade quântica em loop, correspondência holográfica AdS/CFT e teorias de gravidade emergente exploram um aparato matemático extremamente sofisticado, que não cabe neste texto.

Por conta disso, estes formalismos avançados — C*-álgebras, teoria quântica de campos topológica, teoria quântica de campos algébrica e suas conexões com gravidade quântica e holografia — serão objeto de estudo na segunda parte deste trabalho. Nela, continuaremos esta jornada explorando estruturas matemáticas cada vez mais abstratas, que pavimentarão os caminhos para compreender sistemas cada vez mais complexos, conectar mecânica quântica com geometria e topologia, vislumbrar possíveis estruturas de teorias de gravitação quântica, e muito mais — tudo por meio de generalizações do arcabouço padrão, aqui desenvolvido. Mas, por hora, é isso. Adieu!

Bibliografia

A amplitude de tópicos cobertos neste texto inevitavelmente sacrifica profundidade em áreas específicas — o que significa que, sim, ainda pretendo tratar assuntos cobertos aqui de modo isolado, focando em rigor e granularidade. Todavia, leitores interessados em aprofundar conhecimento encontrarão vasta literatura técnica e expositória. Cabe notar, no entanto, que muito do que foi escrito aqui é uma colagem de notas de aula, por mim redigidas ao longo da minha tragetória acadêmica. Ainda hei de digitalizá-las e disponizá-las online.

Fundamentos Matemáticos (Parte I).

Fenômenos Quânticos (Parte II).

Perspectivas Filosóficas.

« Voltar ao Início