Details

Multivariate Datenanalyse


Multivariate Datenanalyse

für die Pharma, Bio- und Prozessanalytik
1. Aufl.

von: Waltraud Kessler

133,99 €

Verlag: Wiley-VCH
Format: PDF
Veröffentl.: 27.02.2007
ISBN/EAN: 9783527609666
Sprache: deutsch
Anzahl Seiten: 340

DRM-geschütztes eBook, Sie benötigen z.B. Adobe Digital Editions und eine Adobe ID zum Lesen.

Beschreibungen

Die Multivariate Datenanalyse bietet neue Möglichkeiten für eine effiziente und umfangreiche Datenauswertung. Sämtliche Methoden und Verfahren werden anhand von praktischen Beispielen mit einer beigefügten Demoversion des Programms "The Unscrambler" von der Firma Camo erklärt.
<p>Vorwort xi</p> <p><b>1 Einführung in die multivariate Datenanalyse 1</b></p> <p>1.1 Was ist multivariate Datenanalyse? 1</p> <p>1.2 Datensätze in der multivariaten Datenanalyse 4</p> <p>1.3 Ziele der multivariaten Datenanalyse 5</p> <p>1.3.1 Einordnen, Klassifizierung der Daten 5</p> <p>1.3.2 Multivariate Regressionsverfahren 6</p> <p>1.3.3 Möglichkeiten der multivariaten Verfahren 7</p> <p>1.4 Prüfen auf Normalverteilung 8</p> <p>1.4.1 Wahrscheinlichkeitsplots 10</p> <p>1.4.2 Box-Plots 12</p> <p>1.5 Finden von Zusammenhängen 16</p> <p>1.5.1 Korrelationsanalyse 16</p> <p>1.5.2 Bivariate Datendarstellung – Streudiagramme 18</p> <p>Literatur 20</p> <p><b>2 Hauptkomponentenanalyse 21</b></p> <p>2.1 Geschichte der Hauptkomponentenanalyse 21</p> <p>2.2 Bestimmen der Hauptkomponenten 22</p> <p>2.2.1 Prinzip der Hauptkomponentenanalyse 22</p> <p>2.2.2 Was macht die Hauptkomponentenanalyse? 24</p> <p>2.2.3 Grafische Erklärung der Hauptkomponenten 25</p> <p>2.2.4 Bedeutung der Faktorenwerte und Faktorenladungen (Scores und Loadings) 29</p> <p>2.2.5 Erklärte Varianz pro Hauptkomponente 35</p> <p>2.3 Mathematisches Modell der Hauptkomponentenanalyse 36</p> <p>2.3.1 Mittenzentrierung 37</p> <p>2.3.2 PCA-Gleichung 38</p> <p>2.3.3 Eigenwert- und Eigenvektorenberechnung 38</p> <p>2.3.4 Berechnung der Hauptkomponenten mit dem NIPALSAlgorithmus 40</p> <p>2.3.5 Rechnen mit Scores und Loadings 42</p> <p>2.4 PCA für drei Dimensionen 46</p> <p>2.4.1 Bedeutung von Bi-Plots 48</p> <p>2.4.2 Grafische Darstellung der Variablenkorrelationen zu den Hauptkomponenten (Korrelation-Loadings-Plots) 52</p> <p>2.5 PCA für viele Dimensionen: Gaschromatographische Daten 56</p> <p>2.6 Standardisierung der Messdaten 65</p> <p>2.7 PCA für viele Dimensionen: Spektren 72</p> <p>2.7.1 Auswertung des VIS-Bereichs (500–800 nm) 74</p> <p>2.7.2 Auswertung des NIR-Bereichs (1100–2100 nm) 81</p> <p>2.8 Wegweiser zur PCA bei der explorativen Datenanalyse 86</p> <p>Literatur 88</p> <p><b>3 Multivariate Regressionsmethoden 89</b></p> <p>3.1 Klassische und inverse Kalibration 90</p> <p>3.2 Univariate lineare Regression 92</p> <p>3.3 Maßzahlen zur Überprüfung des Kalibriermodells (Fehlergrößen bei der Kalibrierung) 93</p> <p>3.3.1 Standardfehler der Kalibration 93</p> <p>3.3.2 Mittlerer Fehler – RMSE 94</p> <p>3.3.3 Standardabweichung der Residuen – SE 95</p> <p>3.3.4 Korrelation und Bestimmtheitsmaß 96</p> <p>3.4 Signifikanz und Interpretation der Regressionskoeffizienten 97</p> <p>3.5 Grafische Überprüfung des Kalibriermodells 97</p> <p>3.6 Multiple lineare Regression (MLR) 99</p> <p>3.7 Beispiel für MLR – Auswertung eines Versuchsplans 100</p> <p>3.8 Hauptkomponentenregression (Principal Component Regression – PCR) 103</p> <p>3.8.1 Beispiel zur PCR – Kalibrierung mit NIR-Spektren 105</p> <p>3.8.2 Bestimmen des optimalen PCR-Modells 106</p> <p>3.8.3 Validierung mit unabhängigem Testset 110</p> <p>3.9 Partial Least Square Regression (PLS-Regression) 111</p> <p>3.9.1 Geschichte der PLS 112</p> <p>3.10 PLS-Regression für eine Y-Variable (PLS1) 113</p> <p>3.10.1 Berechnung der PLS1-Komponenten 114</p> <p>3.10.2 Interpretation der P-Loadings und W-Loadings bei der PLS-Regression 117</p> <p>3.10.3 Beispiel zur PLS1 – Kalibrierung von NIR-Spektren 117</p> <p>3.10.4 Finden des optimalen PLS-Modells 118</p> <p>3.10.5 Validierung des PLS-Modells mit unabhängigem Testset 121</p> <p>3.10.6 Variablenselektion – Finden der optimalen X-Variablen 122</p> <p>3.11 PLS-Regression für mehrere Y-Variablen (PLS2) 127</p> <p>3.11.1 Berechnung der PLS2-Komponenten 127</p> <p>3.11.2 Wahl des Modells: PLS1 oder PLS2? 129</p> <p>3.11.3 Beispiel PLS2: Bestimmung von Gaskonzentrationen in der Verfahrenstechnik 130</p> <p>3.11.4 Beispiel 2 zur PLS2: Berechnung der Konzentrationen von Einzelkomponenten aus Mischungsspektren 141</p> <p>Literatur 151</p> <p><b>4 Kalibrieren, Validieren, Vorhersagen 153</b></p> <p>4.1 Zusammenfassung der Kalibrierschritte – Kalibrierfehler 154</p> <p>4.2 Möglichkeiten der Validierung 155</p> <p>4.2.1 Kreuzvalidierung (Cross Validation) 156</p> <p>4.2.2 Fehlerabschätzung aufgrund des Einflusses der Datenpunkte (Leverage Korrektur) 157</p> <p>4.2.3 Externe Validierung mit separatem Testset 159</p> <p>4.3 Bestimmen des Kalibrier- und Validierdatensets 162</p> <p>4.3.1 Kalibrierdatenset repräsentativ für Y-Datenraum 164</p> <p>4.3.2 Kalibrierdatenset repräsentativ für X-Datenraum 164</p> <p>4.3.3 Vergleich der Kalibriermodelle 165</p> <p>4.4 Ausreißer 168</p> <p>4.4.1 Finden von Ausreißern in den X-Kalibrierdaten 169</p> <p>4.4.2 Grafische Darstellung der Einflüsse auf die Kalibrierung 172</p> <p>4.4.2.1 Einfluss-Grafik: Influence Plot mit Leverage und Restvarianz 172</p> <p>4.4.2.2 Residuenplots 174</p> <p>4.5 Vorhersagebereich der vorhergesagten Y-Daten 175</p> <p>4.5.1 Grafische Darstellung des Vorhersageintervalls 177</p> <p>Literatur 181</p> <p><b>5 Datenvorverarbeitung bei Spektren 183</b></p> <p>5.1 Spektroskopische Transformationen 183</p> <p>5.2 Spektrennormierung 185</p> <p>5.2.1 Normierung auf den Mittelwert 186</p> <p>5.2.2 Vektornormierung auf die Länge eins (Betrag-1-Norm) 186</p> <p>5.3 Glättung 187</p> <p>5.3.1 Glättung mit gleitendem Mittelwert 187</p> <p>5.3.2 Polynomglättung (Savitzky-Golay-Glättung) 187</p> <p>5.4 Basislinienkorrektur 190</p> <p>5.5 Ableitungen 193</p> <p>5.5.1 Ableitung nach der Differenzenquotienten-Methode (Punkt-Punkt-Ableitung) 193</p> <p>5.5.2 Ableitung über Polynomfit (Savitzky-Golay-Ableitung) 195</p> <p>5.6 Korrektur von Streueffekten 198</p> <p>5.6.1 MSC (Multiplicative Signal Correction) 198</p> <p>5.6.2 EMSC (Extended Multiplicative Signal Correction) 199</p> <p>5.6.3 Standardisierung der Spektren (Standard Normal Variate (SNV) Transformation) 202</p> <p>5.7 Vergleich der Vorbehandlungsmethoden 203</p> <p>Literatur 210</p> <p><b>6 Eine Anwendung in der Produktionsüberwachung –von den Vorversuchen zum Einsatz des Modells 211</b></p> <p>6.1 Vorversuche 211</p> <p>6.2 Erstes Kalibriermodell 217</p> <p>6.3 Einsatz des Kalibriermodells – Validierphase 220</p> <p>6.4 Offset in den Vorhersagewerten der zweiten Testphase 224</p> <p>6.5 Zusammenfassung der Schritte bei der Erstellung eines Online-Vorhersagemodells 227</p> <p><b>7 Tutorial zum Umgang mit dem Programm „The Unscrambler“ der Demo-CD 229</b></p> <p>7.1 Durchführung einer Hauptkomponentenanalyse (PCA) 229</p> <p>7.1.1 Beschreibung der Daten 229</p> <p>7.1.2 Aufgabenstellung 230</p> <p>7.1.3 Datendatei einlesen 230</p> <p>7.1.4 Definieren von Variablen- und Objektbereichen 231</p> <p>7.1.5 Speichern der Datentabelle 232</p> <p>7.1.6 Plot der Rohdaten 233</p> <p>7.1.7 Verwendung von qualitativen Variablen (kategoriale Variable) 235</p> <p>7.1.8 Berechnen eines PCA-Modells 238</p> <p>7.1.9 Interpretation der PCA-Ergebnisse 241</p> <p>7.1.9.1 Erklärte Varianz (Explained Variance) 241</p> <p>7.1.9.2 Scoreplot 242</p> <p>7.1.9.3 Loadingsplot 247</p> <p>7.1.9.4 Einfluss-Plot (Influence Plot) 250</p> <p>7.2 Datenvorverarbeitung 253</p> <p>7.2.1 Berechnung der zweiten Ableitung 253</p> <p>7.2.2 Glättung der Spektren 256</p> <p>7.2.3 Berechnen der Streukorrektur mit EMSC 257</p> <p>7.3 Durchführung einer PLS-Regression mit einer Y-Variablen 261</p> <p>7.3.1 Aufgabenstellung 261</p> <p>7.3.2 Interpretation der PLS-Ergebnisse 266</p> <p>7.3.2.1 PLS-Scoreplot 266</p> <p>7.3.2.2 Darstellung der Validierungsrestvarianzen (Residual Validation Variance) 269</p> <p>7.3.2.3 Darstellung der Regressionskoeffizienten 270</p> <p>7.3.2.4 Darstellung der vorhergesagten und der gemessenen Theophyllinkonzentrationen (Predicted versus Measured Plot) 271</p> <p>7.3.2.5 Residuenplot 273</p> <p>7.4 Verwenden des Regressionsmodells –Vorhersage des Theophyllingehalts für Testdaten 276</p> <p>7.5 Export der Unscrambler-Modelle zur Verwendung in beliebigen Anwendungen 278</p> <p>7.5.1 Kalibriermodell für Feuchte erstellen 279</p> <p>7.5.2 Export des PLS-Regressionsmodells für die Feuchte 283</p> <p>7.5.2.1 Umwandeln der Grafikanzeige in numerische Daten 283</p> <p>7.5.2.2 Export des Regressionsmodells als Text-Datei (ASCII Model) 285</p> <p>7.5.2.3 Berechnung der Feuchte in Excel 286</p> <p>7.6 Checkliste für spektroskopische Kalibrierungen mit dem Unscrambler 287</p> <p>Literatur 290</p> <p><b>Anhänge A–D 291</b></p> <p>Anhang A 292</p> <p>Anhang B 302</p> <p>Anhang C 304</p> <p>Anhang D 310</p> <p>Stichwortverzeichnis 313</p>
"...Dem Leser wird ein ausreichender mathematischer Hintergrund der multivariaten Verfahren vermittelt, dabei legen die Autoren gleichzeitig viel Wert auf Anschaulichkeit und Interpretation. Beispiele aus der insustriellen Praxis verdeutlichen die Theorie, und es gibt viele Hinweise und Tipps fur die Anwendung der Verfahren beim Auswerten gro?er Datenmengen."<br> PharmaTec, 06/2007
Professor Waltraud Kessler<br> <br> Bis 1980 Studium der Physik an der Universitat Reutlingen,<br> <br> Industrietatigkeit mit Schwerpunkt Software-Entwicklung auf dem Gebiet der Optoelektronik zur Datenerfassung und Datenkommunikation,<br> <br> Wissenschaftlicher Mitarbeiter am Institut fur Angewandte Forschung (IAF) der Fachhochschule Reutlingen,<br> <br> seit 2002 Honorarprofessur an der FH Reutlingen,<br> <br> seit 2002 Leitung des Steinbeis Transferzentrums fur Prozesskontrolle und Datenanalyse<br> <br> enge Kooperationen mit der Firma Camo aus Norwegen, die mit dem Programmpaket "The Umscramble" Marktfuhrer auf dem Gebiet der multivariaten Datenanalyse ist (www.camo.com).<br> <br> <br> <br>

Diese Produkte könnten Sie auch interessieren:

Hot-Melt Extrusion
Hot-Melt Extrusion
von: Dennis Douroumis
PDF ebook
136,99 €
Hot-Melt Extrusion
Hot-Melt Extrusion
von: Dennis Douroumis
EPUB ebook
136,99 €
Kunststoffe
Kunststoffe
von: Wilhelm Keim
PDF ebook
99,99 €