0 Daumen
128 Aufrufe

Wir hatten in der Vorlesung folgende Situation:

-----------------------------------------------------------------------------------------
Seien \( \varepsilon \sim N\left(0, \sigma^{2}\right), X \sim N(0, \Sigma) \) und \( \Sigma_{j j}=1(j=1, \ldots, d) \). Wir definieren \( s:=\# S\left(\beta^{*}\right)=\left\{j: \beta_{j}^{*} \neq 0\right\} \). Dann existieren Konstanten \( c_{1}, c_{2}>0 \), sodass die Bedingung
\( n \geq c_{1} \frac{\|\Sigma\|}{\Lambda_{\min }(\Sigma)^{2}} s \log (e d / s) \)
für alle \( t \geq 0 \) und
\( \lambda \geq \frac{6 \sqrt{2} \sigma}{\sqrt{n}} \sqrt{\log (d)+t} \)
impliziert, dass folgender Ausdruck gilt:
\( \mathbb{P}\left(R\left(\hat{\beta}_{\lambda}\right)-R\left(\beta^{*}\right)>16 \lambda^{2} \frac{s}{\Lambda_{\min }(\Sigma)}\right) \leq e^{-t}+2 d e^{-c_{2} n} . \)
-----------------------------------------------------------------------------------------
Nun soll laut Skript folgender Fall für Lambda besonders wichtig sein:

Für \( \lambda \approx \frac{\sigma}{\sqrt{n}} \sqrt{\log (d)} \) gilt:
\( 16 \lambda^{2} \frac{s}{\Lambda_{\min }(\Sigma)} \approx \frac{1}{\Lambda_{\min }(\Sigma)} \cdot \frac{\sigma^{2} s}{n} \cdot \log (d) . \)

Meine Frage ist jetzt warum ausgerechnet dieser Term so wichtig sein soll? Im Skript wird das nicht näher erläutert. Das wird einfach so stehen gelassen.

Mein erster Gedanke war, dass dieser Ausdruck für Lambda die Wichtigkeit der Anzahl der Features in einem Datensatz im Verhältnis zu der Anzahl der Beobachtungen deutlich macht. Jedoch bin ich mir da nicht sicher, weil auch keine Herleitung für genau diesen Ausdruck von Lambda im Skript gegeben ist.

Fällt einem von euch ein warum dieser Ausdruck so wichtig sein soll?



Avatar von

Ein anderes Problem?

Stell deine Frage

Willkommen bei der Mathelounge! Stell deine Frage einfach und kostenlos

x
Made by a lovely community