Zuerst wissen wir bereits, dass jedes Polynom \(f\in K[X]\setminus\{0\}\) eine "Primfaktorzerlegung" \(f=c\prod\limits_{i=1}^{k}p_i^{e_i}\) besitzt, wobei \(p_i\in K[X]\) irreduzibel, \(e_i\in \mathbb{N}\) und \(c\in K\setminus\{0\}\). Jetzt können wir immer den Leitkoeffizienten \(l_i\) jedes \(p_i\) in \(c\) ziehen, also \(f=\left(c\prod\limits_{i=1}^{k}l_i^{e_i}\right)\prod\limits_{i=1}^{k}(l_i^{-1}p_i)^{e_i}\), das ist eine Zerlegung in irreduzible normierte Faktoren. Wir nennen jetzt zur Vereinfachung von Notation diese normierten Faktoren einfach \(p_i\).
Durch die Gradformel gilt erst einmal: \(\deg f = \sum\limits_{i=1}^{k}e_i\cdot \deg p_i\). Da alle \(\deg p_i\geq 1\), muss also gelten \(k\leq\deg f\). Es folgt, da alle normierten irreduziblen Faktoren von \(f\) in dieser Liste vorkommen (*), dass \(f\) höchstens \(\deg f\) verschiedene irreduzible normierte Faktoren haben kann.
Falls (*) noch einmal kurz begründet werden müsste: Zwei verschiedene irreduzible normierte Polynome können nicht zueinander assoziiert sein (assoziiert = \(K^\ast\)-Vielfache voneinander), da die Skalierung eines normierten Polynoms mit einer Einheit \(\neq 1\) ein nicht-normiertes Polynom ergeben muss. Wäre jetzt also \(g\) ein normierter irreduzibler Teiler von \(f\), mit \(g\neq p_i\) für alle \(1\leq i\leq k\), dann wäre \(g\) zusammen mit einer Primfaktorzerlegung von \(f/g\) eine echt verschiedene Primfaktorzerlegung von \(f\), was nach der "Eindeutigkeit der Primfaktorzerlegung bis auf Assoziiertheit" nicht geht.
Wenn jetzt \(f\) eine Nullstelle besitzt, sagen wir \(a\in K\), dann ist \(g=(X-a)\) ein irreduzibler normierter Teiler von \(f\). Dass \(g\) irreduzibel und normiert ist, ist klar. Dazu gilt durch die Existenz von Division mit Rest, dass du schreiben kannst: \(f=h\cdot g+r\), wobei \(\deg(r)<\deg g = 1\) gelten muss. Folglich muss also gelten, dass der Rest ein konstantes Polynom \(r\in K\) sein muss. Evaluieren dieser Gleichung in \(X=a\) ergibt: \(f(a)=0=h(a)\cdot (a-a)+r=r\), also gilt: \(f=h\cdot (x-a)\), wir sehen also dass \(g\) ein Teiler von \(f\) ist.
Hätte jetzt also \(f\) mehr als \(n\) verschiedene Nullstellen, dann hätte \(f\) auch mehr als \(n\) verschiedene solche irreduziblen normierten Teiler, was nicht möglich ist, s.o.