Sei \(A\in\mathbb{C}^{n\times n}\) eine invertierbare Matrix. Und sei \(p\in\mathbb{N}=\lbrace 1, 2, 3, \dots\rbrace\), so dass \(A^p\) diagonalisierbar ist.
Seien \(\lambda_1, \dots, \lambda_m\in\mathbb{C}\setminus\lbrace 0\rbrace\) die (paarweise verschiedenen) Eigenwerte von \(A^p\). [Da \(A\) invertierbar ist, ist auch \(A^p\) invertierbar, so dass \(0\) kein Eigenwert von \(A^p\) sein kann.]
Da \(A^p\) diagonalisierbar ist, zerfällt das Minimalpolynom \(\mu_{A^p}\) folgendermaßen in paarweise verschiedene Linearfaktoren:
\(\mu_{A^p}(X) = (X- \lambda_1)\cdot\ldots\cdot (X-\lambda_m)\)
Betrachte nun das folgende Polynom \(f(X)\in\mathbb{C}[X]\):
\(f(X) = \mu_{A_p}(X^p) = (X^p- \lambda_1)\cdot\ldots\cdot (X^p-\lambda_m)\)
Dann ist \(f(A) = \mu_{A^p}(A^p) = 0\), weshalb das Minimalpolynom \(\mu_{A}\) von \(A\) ein Teiler von \(f\) ist.
Für jedes \(k\in\lbrace 1, \dots, m\rbrace\) gibt es nun \(p\) paarweise verschiedene \(p\)-te Wurzeln \(\lambda_{k, 1}, \dots, \lambda_{k, p}\in\mathbb{C}\setminus\lbrace 0\rbrace\) von \(\lambda_{k}\in\mathbb{C}\setminus\lbrace 0\rbrace\). Damit ist dann \[X^p - \lambda_{k} = (X-\lambda_{k, 1})\cdot \ldots \cdot (X-\lambda_{k, p})\] für jedes \(k \in \lbrace 1, \dots, m\rbrace\).
Nun sind \(\lambda_{1, 1}, \dots, \lambda_{1, p}, \dots, \lambda_{m, 1}, \dots, \lambda_{m, p}\) paarweise verschieden.
[spoiler]
Angenommen es gäbe \(k, l, \tilde{k}, \tilde{l}\) mit \(\lambda_{k, l} = \lambda_{\tilde{k}, \tilde{l}}\) und \((k, l)\ne (\tilde{k}, \tilde{l})\).
1. Fall: \(k = \tilde{k}\)
Dann wäre \(\lambda_{k, l}, \dots, \lambda_{k, \tilde{l}}\) im Widerspruch dazu, dass \(\lambda_{k, 1}, \dots, \lambda_{k, p}\) paarweise verschieden sind.
2. Fall: \(k \ne \tilde{k}\)
Aus \(\lambda_{k, l} = \lambda_{\tilde{k}, \tilde{l}}\) würde man dann \(\lambda_{k} = \lambda_{k, l}^p = \lambda_{\tilde{k}, \tilde{l}}^p = \lambda_{\tilde{k}}\) erhalten. Dies wäre im Widerspruch dazu, dass \(\lambda_1, \dots, \lambda_{m}\) paarweise verschieden sind.
[/spoiler]
Damit zerfällt dann \(f\) folgendermaßen in paarweise verschiedene Linearfaktoren:
\(f(X) = (X^p- \lambda_1)\cdot\ldots\cdot (X^p-\lambda_m) = (X - \lambda_{1, 1})\cdot \ldots\cdot (X - \lambda_{1, p}) \cdot \ldots \cdot (X - \lambda_{m, 1})\cdot \ldots\cdot (X - \lambda_{m, p})\)
Damit zerfällt auch jeder Teiler von \(f\) in paarweise verschiedene Linearfaktoren. Insbesondere zerfällt \(\mu_{A}\) in paarweise verschiedene Linearfaktoren, weshalb \(A\) diagonalisierbar ist.