Details

Bioinformatik


Bioinformatik

Grundlagen, Algorithmen, Anwendungen
4. Auflage

von: Rainer Merkl

70,99 €

Verlag: Wiley-VCH
Format: PDF
Veröffentl.: 02.08.2022
ISBN/EAN: 9783527833900
Sprache: deutsch
Anzahl Seiten: 752

DRM-geschütztes eBook, Sie benötigen z.B. Adobe Digital Editions und eine Adobe ID zum Lesen.

Beschreibungen

<b>Bioinformatik</b> <p><b>Der Marktführer bei den Bioinformatiklehrbüchern in neuer Auflage und mit dem neuen Thema Molekulardynamik</b> <p> Bioinformatik ist eine Kerndisziplin in den modernen Biowssenschaften, von der Biotechnologie über die Biochemie und Molekularbiologie bis zur Molekulargenetik und Molekularmedizin. Sie ist eine essenzielle Grundlage für alle “omics”-Technologien, für die Strukturbiologie, die Systembiologie sowie die synthetische Biologie. <p><i>Bioinformatik. Grundlagen, Algorithmen, Anwendungen</i> bietet eine umfassende Einführung in die wichtigsten Methoden der Bioinformatik. Der Autor erklärt dabei sowohl die mathematischen und biologischen Grundlagen als auch die wichtigsten Software-Tools und deren Anwendungsbereiche. Schwerpunkte sind Methoden zum Sequenzvergleich, Verfahren zur Charakterisierung von Proteinfamilien, Algorithmen zur Vorhersage von Protein- und RNA-Strukturen, Methoden des maschinellen Lernens und das Proteindesign. <p>Für die 4. Auflage wurde der Text durchgehend aktualisiert und um ein Kapitel zur Molekulardynamik erweitert. Neu aufgenommene Exkurse zu Meilensteinen der Bioinformatik und aktuellen Anwendungsgebieten lockern den Text auf. Auf der ebenfalls komplett überarbeiteten Begleit-Webseite werden interaktive Lernmodule bereitgestellt, einschließlich mehr als 120 Übungsaufgaben, zum Teil mit Lösungen. <p> Eine perfekte Einführung für alle Studenten der Lebenswissenschaften oder Informatik, die einen Einblick in die gängigen Methoden der Bioinformatik benötigen, sowie ein wertvoller Begleiter für alle, die bereits bioinformatische Werkzeuge nutzen und die zugrundeliegenden Konzepte verstehen möchten.
<p>vorwort V</p> <p><b>Teil I Grundlagen – Biologie und Datenbanken 1</b></p> <p><b>1 Biologische Grundlagen 5</b></p> <p>1.1 DNA 6</p> <p>1.2 Genetischer Code und Genomkomposition 8</p> <p>1.3 Transkription 12</p> <p>1.4 RNA 13</p> <p>1.5 Proteine 14</p> <p>1.6 Peptidbindung 16</p> <p>1.7 Konformation von Aminosäureseitenketten 16</p> <p>1.8 Ramachandran-Plot 17</p> <p>1.9 Hierarchische Beschreibung von Proteinstrukturen 18</p> <p>1.10 Sekundärstrukturelemente 19</p> <p>1.11 α-Helix 20</p> <p>1.12 β-Faltblätter 20</p> <p>1.13 Supersekundärstrukturelemente 21</p> <p>1.14 Proteindomänen 22</p> <p>1.15 Proteinfamilien 23</p> <p>1.16 Enzyme 26</p> <p>1.17 Proteinkomplexe 27</p> <p>1.18 Evolutionäre Prozesse 28</p> <p>1.19 Fachbegriffe 30</p> <p>Literatur 33</p> <p><b>2 Sequenzen und ihre Funktion 37</b></p> <p>2.1 Definitionen und Operatoren 38</p> <p>2.2 DNA-Sequenzen 39</p> <p>2.3 Proteinsequenzen 39</p> <p>2.4 Vergleich der Sequenzkomposition 41</p> <p>2.5 Ontologien 45</p> <p>2.6 Analyse der Anreicherung von GO-Termen 48</p> <p>2.7 Semantische Ähnlichkeit von GO-Termen 48</p> <p>2.7.1 Bewertung mit informationstheoretischen Ansätzen 48</p> <p>2.7.2 Vergleich mit einer graphentheoretischen Methode 50</p> <p>Literatur 54</p> <p><b>3 Datenbanken 57</b></p> <p>3.1 Nukleotidsequenzdatenbanken 58</p> <p>3.2 RNA-Sequenz-Datenbanken 59</p> <p>3.3 Proteinsequenzdatenbanken 60</p> <p>3.4 3-D-Struktur-Datenbanken 60</p> <p>3.5 SMART: Analyse der Domänenarchitektur 62</p> <p>3.6 STRING: Proteine und ihre Interaktionen 62</p> <p>3.7 SCOP: Strukturelle Klassifikation von Proteinen 63</p> <p>3.8 Pfam: Kompilation von Proteinfamilien 66</p> <p>3.9 COG und eggNOG: Gruppen orthologer Gene 68</p> <p>3.10 KEGG: Gene, Genome und Krankheiten 68</p> <p>3.11 NCBI-Datenbanken: Literatur und biologisches Wissen 69</p> <p>3.12 Weitere Datenbanken 70</p> <p>Literatur 74</p> <p><b>Teil II Lernen, Optimieren und Entscheiden 77</b></p> <p><b>4 Grundbegriffe der Stochastik 81</b></p> <p>4.1 Grundbegriffe der beschreibenden Statistik 82</p> <p>4.2 Zufallsvariable, Wahrscheinlichkeitsmaß 84</p> <p>4.3 Urnenexperimente und diskrete Verteilungen 86</p> <p>4.4 Die kolmogoroffschen Axiome 89</p> <p>4.5 Bedingte Wahrscheinlichkeit, Unabhängigkeit, Satz von Bayes 89</p> <p>4.6 Markov-Ketten 91</p> <p>4.7 Erwartungswert, Varianz 91</p> <p>4.8 Wichtige Wahrscheinlichkeitsverteilungen 92</p> <p>4.8.1 Diskrete Verteilungen 92</p> <p>4.8.2 Totalstetige Verteilungen 93</p> <p>4.9 Schätzer 96</p> <p>4.10 Grundlagen statistischer Tests 98</p> <p>4.11 Eine optimale Entscheidungstheorie: die Neyman-Pearson-Methode 100</p> <p>Literatur 101</p> <p><b>5 Bayessche Entscheidungstheorie und Klassifikatoren 103</b></p> <p>5.1 Bayessche Entscheidungstheorie 103</p> <p>5.1.1 Ein Beispiel: Klassifikation der Proteinoberfläche 104</p> <p>5.1.2 Übergang zu bedingten Wahrscheinlichkeiten 105</p> <p>5.1.3 Erweitern auf m Eigenschaften 107</p> <p>5.2 Marginalisieren 109</p> <p>5.3 Boosting 110</p> <p>5.4 ROC-Kurven 112</p> <p>5.4.1 Bewerten von Fehlklassifikationen 112</p> <p>5.4.2 Aufnehmen einer ROC-Kurve 112</p> <p>5.5 Testmethoden für kleine Trainingsmengen 115</p> <p>Literatur 117</p> <p><b>6 Klassische Cluster- und Klassifikationsverfahren 119</b></p> <p>6.1 Metriken und Clusteranalyse 120</p> <p>6.2 Das mittlere Fehlerquadrat als Gütemaß 120</p> <p>6.3 Ein einfaches iteratives Clusterverfahren 121</p> <p>6.4 <i>k</i>-Means-Clusterverfahren 123</p> <p>6.5 Hierarchische Clusterverfahren 126</p> <p>6.6 Affinity propagation 127</p> <p>6.7 Bewertung der Clusterverfahren 129</p> <p>6.8 Überlappende Cluster 130</p> <p>6.9 Nächster-Nachbar-Klassifikation 130</p> <p>6.10 <i>k</i>-nächste-Nachbarn-Klassifikation 132</p> <p>Literatur 133</p> <p><b>7 Neuronale Netze 135</b></p> <p>7.1 Architektur von neuronalen Netzen 136</p> <p>7.2 Das Perzeptron 136</p> <p>7.3 Modellieren boolscher Funktionen 138</p> <p>7.4 Lösbarkeit von Klassifikationsaufgaben 139</p> <p>7.5 Universelle Approximation 141</p> <p>7.6 Lernen in neuronalen Netzen 143</p> <p>7.7 Der Backpropagation-Algorithmus 144</p> <p>7.8 Codieren der Eingabe 147</p> <p>7.9 Selbstorganisierende Karten 148</p> <p>7.10 Tiefe Architekturen 150</p> <p>7.11 Ein einfaches Neuron, die <i>rectified linear unit</i> 151</p> <p>7.12 Das Neocognitron als alternatives Modellierparadigma 152</p> <p>7.13 Faltung mithilfe von CNNs 153</p> <p>7.14 Längerfristiges Speichern von Eingabedaten 157</p> <p>7.15 Attention-basierte Netze 161</p> <p>Literatur 168</p> <p><b>8 Genetische Algorithmen 171</b></p> <p>8.1 Objekte und Funktionen 173</p> <p>8.2 Ablauf des Verfahrens 174</p> <p>8.3 Codieren der Problemstellung 176</p> <p>8.4 Der Begriff des Schemas 176</p> <p>8.5 Dynamik der Anzahl von Schemata 177</p> <p>8.6 Limitationen genetischer Algorithmen 179</p> <p>8.7 Genetisches Programmieren 180</p> <p>Literatur 183</p> <p><b>Teil III Algorithmen und Modelle der Bioinformatik 185</b></p> <p><b>9 Paarweiser Sequenzvergleich 189</b></p> <p>9.1 Dotplots 191</p> <p>9.1.1 Definition 191</p> <p>9.1.2 Beispiel 192</p> <p>9.1.3 Implementierung 193</p> <p>9.1.4 Abschätzen der Laufzeit 194</p> <p>9.1.5 Anwendungen 195</p> <p>9.1.6 Einschränkungen und Ausblick 196</p> <p>9.2 Entwickeln eines optimalen Alignment-Verfahrens 198</p> <p>9.2.1 Paarweise und multiple Sequenzalignments 200</p> <p>9.2.2 Dynamisches Programmieren 200</p> <p>9.2.3 Distanzen und Metriken 202</p> <p>9.2.4 Die Minkowski-Metrik 203</p> <p>9.2.5 Die Hamming-Distanz 203</p> <p>9.3 Levenshtein-Distanz 204</p> <p>9.3.1 Berechnungsverfahren 206</p> <p>9.3.2 Ableiten des Alignments 210</p> <p>9.4 Bestimmen der Ähnlichkeit von Sequenzen 210</p> <p>9.4.1 Globales Alignment 210</p> <p>9.4.2 Lokales Sequenzalignment 211</p> <p>9.5 Optimales Bewerten von Lücken 212</p> <p>9.5.1 Eigenschaften affiner Kostenfunktionen 213</p> <p>9.5.2 Integration in Algorithmen 213</p> <p>9.6 Einordnung der Algorithmen 215</p> <p>Literatur 216</p> <p><b>10 Sequenzmotive 219</b></p> <p>10.1 Signaturen 220</p> <p>10.2 Die PROSITE-Datenbank 221</p> <p>10.3 Die BLOCKS-Datenbank 221</p> <p>10.4 Sequenzprofile 222</p> <p>10.5 Scores für Promotorsequenzen 224</p> <p>10.6 Möglichkeiten und Grenzen profilbasierter Klassifikation 224</p> <p>10.7 Sequenzlogos 225</p> <p>10.8 Konsensussequenzen 226</p> <p>10.9 Sequenzen niedriger Komplexität 227</p> <p>10.10 Der SEG-Algorithmus 228</p> <p>Literatur 231</p> <p><b>11 Scoring-Schemata 233</b></p> <p>11.1 Theorie von Scoring-Matrizen 234</p> <p>11.2 Algorithmenbedingte Anforderungen 237</p> <p>11.3 Identitätsmatrizen 237</p> <p>11.4 PAM-Einheit 238</p> <p>11.5 PAM-Matrizen 238</p> <p>11.6 Ein moderner PAM-Ersatz: die JTT-Matrix 240</p> <p>11.7 BLOSUM-Matrizen 241</p> <p>11.8 Matrixentropie 243</p> <p>11.9 Scoring-Schemata und Anwendungen 244</p> <p>11.10 Flexible Erweiterung: Scoring-Funktionen 245</p> <p>Literatur 247</p> <p><b>12 FASTA und die BLAST-Suite 249</b></p> <p>12.1 FASTA 250</p> <p>12.1.1 Programmablauf 250</p> <p>12.1.2 Statistische Bewertung der Treffer 252</p> <p>12.2 BLAST 255</p> <p>12.2.1 Konzepte und Umsetzung 256</p> <p>12.2.2 Statistik von Alignments 259</p> <p>12.2.3 Ausgabe der Treffer 264</p> <p>12.3 Vergleich der Empfindlichkeit von FASTA und BLAST 264</p> <p>12.4 Ansätze zur Performanzsteigerung 265</p> <p>12.5 Profilbasierter Sequenzvergleich 266</p> <p>12.6 PSI-BLAST 267</p> <p>12.7 Sensitivität verschiedener Sequenzvergleichsmethoden 269</p> <p>12.8 Vergleich von Profilen und Konsensussequenzen 270</p> <p>12.9 DELTA-BLAST 271</p> <p>12.10 Alternative Ansätze 275</p> <p>Literatur 276</p> <p><b>13 Multiple Sequenzalignments und Anwendungen 279</b></p> <p>13.1 Berechnen von Scores für multiple Sequenzalignments 281</p> <p>13.2 Iteratives Berechnen eines Alignments 282</p> <p>13.3 ClustalW: Ein klassischer Algorithmus 283</p> <p>13.3.1 Grundlegende Konzepte 283</p> <p>13.3.2 Algorithmus 283</p> <p>13.3.3 Ein Beispiel: MSA für Trypsininhibitoren 284</p> <p>13.4 T-Coffee 286</p> <p>13.5 M-Coffee und 3D-Coffee 289</p> <p>13.6 Alternative Ansätze 291</p> <p>13.7 Alignieren großer Datensätze mit Clustal Omega 292</p> <p>13.8 Alignieren großer Proteinsequenzdatensätze mit DECIPHER 293</p> <p>13.9 Charakterisierung von Residuen mithilfe von Alignments 296</p> <p>13.9.1 Entwickeln der Scoring-Funktion 297</p> <p>13.9.2 FRpred: Vorhersage funktionell wichtiger Residuen 297</p> <p>13.9.3 SDPpred: Vergleich homologer Proteine mit unterschiedlicher Spezifität 298</p> <p>13.10 Alignment von DNA- und RNA-Sequenzen 300</p> <p>Literatur 301</p> <p><b>14 Grundlagen phylogenetischer Analysen 303</b></p> <p>14.1 Einteilung phylogenetischer Ansätze 307</p> <p>14.2 Distanzbasierte Verfahren 307</p> <p>14.2.1 Ultrametrische Matrizen 308</p> <p>14.2.2 Additive Matrizen 309</p> <p>14.3 Linkage-Algorithmen 311</p> <p>14.4 Der Neighbour-Joining-Algorithmus 313</p> <p>14.5 Parsimony-Methoden 314</p> <p>14.6 Maximum-Likelihood-Ansätze 317</p> <p>14.6.1 Übergangswahrscheinlichkeiten für DNA-Sequenzen 318</p> <p>14.6.2 Empirische Modelle der Proteinevolution 319</p> <p>14.6.3 Berechnen der Likelihood eines Baumes 321</p> <p>14.6.4 Quartett-Puzzle: Heuristik zum Finden einer Topologie 323</p> <p>14.7 Grundannahmen phylogenetischer Algorithmen 325</p> <p>14.8 Statistische Bewertung phylogenetischer Bäume 326</p> <p>14.8.1 Validierung durch Outgroups 327</p> <p>14.8.2 Bootstrap-Verfahren und A-posteriori-Wahrscheinlichkeiten 327</p> <p>14.8.3 Alternativen und Ergebnisse 329</p> <p>Literatur 332</p> <p><b>15 Markov-Ketten und Hidden-Markov-Modelle 335</b></p> <p>15.1 Ein epigenetisches Signal: CpG-Inseln 335</p> <p>15.2 Finite Markov-Ketten 336</p> <p>15.3 Kombination zweier Ketten zu einem Klassifikator 337</p> <p>15.4 Genvorhersage mithilfe inhomogener Ketten 340</p> <p>15.5 Hidden-Markov-Modelle 343</p> <p>15.6 Der Viterbi-Pfad 346</p> <p>15.7 Ein HMM zur Erkennung von CpG-Inseln 348</p> <p>15.8 Der Vorwärts- und der Rückwärtsalgorithmus 349</p> <p>15.9 Schätzen von Parametern 351</p> <p>15.10 Der Baum-Welch-Algorithmus 352</p> <p>15.11 Entwurf von HMMs 354</p> <p>15.12 Verwendung und Grenzen von HMMs 356</p> <p>15.13 Wichtige Eigenschaften von Markov-Ketten 357</p> <p>15.14 Markov-Ketten-Monte-Carlo-Verfahren 359</p> <p>15.14.1 Monte-Carlo-Integration 359</p> <p>15.14.2 Metropolis-Hastings-Algorithmus 360</p> <p>15.14.3 Simulated annealing 361</p> <p>15.14.4 Gibbs-Sampler 362</p> <p>15.15 Weitere Anwendungen von Markov-Ketten 362</p> <p>Literatur 366</p> <p><b>16 Profil-HMMs 369</b></p> <p>16.1 HMM-Struktur zur Beschreibung von Proteinfamilien 370</p> <p>16.2 Suche nach homologen Sequenzen 373</p> <p>16.3 Modellbau für Profil-HMMs 376</p> <p>16.4 Approximieren von Wahrscheinlichkeitsdichten 380</p> <p>16.5 HHsearch: Vergleich zweier Profil-HMMs 386</p> <p>16.5.1 Grundlagen des Alignments von zwei Hidden-Markov-Ketten 387</p> <p>16.5.2 Paarweises Alignment von HMMs 390</p> <p>16.5.3 Performanz von HHsearch 391</p> <p>16.5.4 Strukturvorhersage mit HHsearch 393</p> <p>Literatur 395</p> <p><b>17 Support-Vektor-Maschinen 397</b></p> <p>17.1 Beschreibung des Klassifikationsproblems 398</p> <p>17.2 Lineare Klassifikatoren 399</p> <p>17.3 Klassifizieren mit großer Margin 403</p> <p>17.4 Kernel-Funktionen und Merkmalsräume 405</p> <p>17.5 Implizite Abbildung in den Merkmalsraum 407</p> <p>17.6 Eigenschaften von Kernel-Funktionen 408</p> <p>17.7 Häufig verwendete Kernel-Funktionen 409</p> <p>17.8 Aus Merkmalen abgeleitete Kernel-Funktionen 410</p> <p>17.9 Support-Vektor-Maschinen in der Anwendung 416</p> <p>17.10 Multiklassen-SVM 419</p> <p>17.11 Theoretischer Hintergrund 420</p> <p>Literatur 424</p> <p><b>18 Vorhersage der Sekundärstruktur 427</b></p> <p>18.1 Vorhersage der Proteinsekundärstruktur 427</p> <p>18.1.1 Ein früher Ansatz: Chou-Fasman-Verfahren 428</p> <p>18.1.2 PHD: profilbasierte Vorhersage 429</p> <p>18.2 Vorhersage der RNA-Sekundärstruktur 436</p> <p>18.2.1 RNA-Sequenzen und -Strukturen 438</p> <p>18.2.2 Freie Energie und Strukturen 439</p> <p>18.2.3 Sekundärstrukturvorhersage durch Energieminimierung 440</p> <p>18.2.4 Strukturen mit Schleifen 442</p> <p>18.2.5 MEA-Verfahren zur Vorhersage von Strukturen mit Pseudoknoten 444</p> <p>18.2.6 Strukturvorhersage mithilfe von multiplen Sequenzalignments 447</p> <p>Literatur 449</p> <p><b>19 Vergleich von Protein-3-D-Strukturen 451</b></p> <p>19.1 Grundlagen des Strukturvergleichs 453</p> <p>19.2 Simulated annealing 455</p> <p>19.3 DALI: fragmentbasierte Superposition 458</p> <p>19.3.1 Scores für Substrukturen 459</p> <p>19.3.2 Alignieren von Substrukturen 459</p> <p>19.4 Fr-TM-align: Alignieren von Fragmenten 461</p> <p>19.5 SPalignNS: optimales Kombinieren von Residuenpaaren 462</p> <p>19.6 FAST: Vergleich der lokalen Geometrie 463</p> <p>19.7 DeepAlign: Verwenden eines Strukturalphabets 466</p> <p>19.8 Multiple Superpositionen 471</p> <p>Literatur 474</p> <p><b>20 Vorhersage der Protein-3-D-Struktur, Proteindesign und Moleküldynamik 477</b></p> <p>20.1 Threading-Verfahren 482</p> <p>20.2 <i>3D-1D-Profile</i>: profilbasiertes Threading 484</p> <p>20.2.1 Bestimmen der lokalen Umgebung 484</p> <p>20.2.2 Erzeugen eines 3-D-1-D-Profils 486</p> <p>20.3 Wissensbasierte Kraftfelder 489</p> <p>20.3.1 Theoretische Grundlagen 490</p> <p>20.3.2 Ableiten der Potenziale 493</p> <p>20.4 Rotamerbibliotheken 494</p> <p>20.5 MODELLER 499</p> <p>20.6 Bewerten der Modellqualität 504</p> <p>20.7 Alternative Modellieransätze 504</p> <p>20.8 ROSETTA/ROBETTA 505</p> <p>20.8.1 De-novo-Strukturvorhersage mit ROSETTA 506</p> <p>20.8.2 Verfeinerung der Fragmentinsertion 508</p> <p>20.8.3 Modellieren strukturell variabler Regionen 508</p> <p>20.8.4 Proteindesign mithilfe von ROSETTA 510</p> <p>20.9 Moleküldynamiksimulationen 517</p> <p>20.9.1 Physikalische Grundlagen von MD-Simulationen 518</p> <p>20.9.2 Berechnungsverfahren 519</p> <p>20.9.3 Berechnen der Interaktionen mithilfe von Kraftfeldern 521</p> <p>20.9.4 Spezielle Hardware beschleunigt die Simulationen 522</p> <p>Literatur 523</p> <p><b>21 Analyse integraler Membranproteine 527</b></p> <p>21.1 Architektur integraler Membranproteine 528</p> <p>21.2 Spezifische Probleme beim Sequenzvergleich 530</p> <p>21.3 Vorhersage der Topologie von α-helikalen IMPs 530</p> <p>21.3.1 HMMTOP 531</p> <p>21.3.2 MEMSAT-SVM 532</p> <p>21.3.3 Ein Metaansatz: TOPCONS 2 534</p> <p>21.4 Vorhersage der Struktur von β-Fässern 535</p> <p>21.4.1 TMBpro 535</p> <p>21.4.2 PRED-TMBB 2 537</p> <p>21.4.3 BOCTOPUS 2 539</p> <p>21.4.4 Alternative Ansätze und Homologiemodellierung 541</p> <p>Literatur 541</p> <p><b>22 Entschlüsselung von Genomen 545</b></p> <p>22.1 Shotgun-Sequenzierung 549</p> <p>22.2 Erwartete Anzahl von Contigs beim Shotgun-Ansatz 550</p> <p>22.3 Basecalling und Sequenzqualität 551</p> <p>22.4 Der klassische Assemblieransatz 553</p> <p>22.4.1 Phase eins: Bestimmen überlappender Präfix-Suffix-Regionen 554</p> <p>22.4.2 Phase zwei: Erzeugen von Contigs 556</p> <p>22.4.3 Phase drei: Generieren der Konsensussequenz 556</p> <p>22.5 Assemblieren kurzer Fragmente 558</p> <p>22.6 Assemblieren langer und fehlerbehafteter Reads 561</p> <p>22.7 Annotation kompletter Genome 565</p> <p>22.8 Metagenomik 570</p> <p>22.8.1 Spezielle Anforderungen an die Bioinformatik 571</p> <p>22.8.2 Minimalanforderungen für die Metagenomannotation 573</p> <p>Literatur 574</p> <p><b>23 Auswertung von Transkriptomdaten 579</b></p> <p>23.1 DNA-Chip-Technologie 579</p> <p>23.1.1 Datenbanken für Transkriptomdaten 581</p> <p>23.1.2 Grenzen der Technologie 582</p> <p>23.2 Analyse von DNA-Chip-Signalen 583</p> <p>23.2.1 Quantifizierung von Expressionswerten 583</p> <p>23.2.2 Normalisieren und Datenreduktion 584</p> <p>23.3 Identifizieren differenziell exprimierter Gene 586</p> <p>23.4 RNA-Sequenzierung 587</p> <p>23.5 Analyse der RNA-Sequenzen 588</p> <p>23.6 Einzelzell-RNA-Sequenzierung 591</p> <p>23.7 Metriken zum Vergleich von Expressionsdaten 591</p> <p>23.8 Analyse kompletter Expressionsdatensätze 593</p> <p>23.8.1 Anwenden von Clusterverfahren 593</p> <p>23.8.2 Validierung und Alternativen 593</p> <p>23.9 Hauptkomponentenanalyse 594</p> <p>23.10 Biclusterverfahren 597</p> <p>23.10.1 ISA: ein performantes Biclusterverfahren 597</p> <p>23.10.2 Der Signaturalgorithmus 598</p> <p>23.10.3 Iterative Optimierung 601</p> <p>23.10.4 QUBIC2: Ein graphenbasiertes Biclusterverfahren 602</p> <p>23.11 Grenzen und Alternativen bei der Expressionsanalyse 604</p> <p>23.12 Genexpressions-Profiling 605</p> <p>23.13 Visualisieren mithilfe von Wärmekarten 606</p> <p>23.13.1 Der klassische Ansatz 607</p> <p>23.14 Datenaufbereitung für systembiologische Fragestellungen 607</p> <p>23.14.1 Bündelung von Datenbankinformation 608</p> <p>23.14.2 Statistische Analyse der Termverteilung 609</p> <p>23.14.3 Verwendbarkeit der Verfahren 610</p> <p>Literatur 612</p> <p><b>24 Analyse von Protein-Protein-Interaktionen 615</b></p> <p>24.1 Biologische Bedeutung des Interaktoms 615</p> <p>24.2 Methoden zum Bestimmen des Interaktoms 616</p> <p>24.3 Vergleich von Codonhäufigkeiten 618</p> <p>24.4 Analyse des Genominhaltes 619</p> <p>24.4.1 Genfusion 619</p> <p>24.4.2 Phyletische Profile 620</p> <p>24.4.3 Analyse von Genfolgen 622</p> <p>24.4.4 Performanz sequenzbasierter Methoden 623</p> <p>24.5 Suche nach korrelierten Mutationen 624</p> <p>24.5.1 Erzeugen sortierter MSA-Paare 624</p> <p>24.5.2 Identifizieren korrelierter Mutationen 625</p> <p>24.6 Vergleich phylogenetischer Bäume 627</p> <p>24.6.1 Die <i>Mirror-Tree</i>-Methode 627</p> <p>24.6.2 Korrektur des Hintergrundsignals 629</p> <p>24.6.3 Ein alternativer Ansatz, der auf einem Nullmodell basiert 630</p> <p>24.7 Vorhersage des Interaktoms der Hefe 631</p> <p>24.8 Strukturbasierte Protein-Protein-Interaktionsvorhersagen 634</p> <p>24.8.1 Vorhersagen basierend auf Strukturinformation 635</p> <p>24.8.2 PrePPI: Integration zusätzlicher Merkmale 637</p> <p>24.9 Netzwerkbasierte Protein-Protein-Interaktionsvorhersagen 640</p> <p>Literatur 642</p> <p><b>25 Big Data und Deep Learning: neue Herausforderungen und Möglichkeiten 645</b></p> <p>25.1 Klassifikation mit Random Forests 647</p> <p>25.1.1 Entscheidungsbäume 647</p> <p>25.1.2 Berechnen der Topologie 649</p> <p>25.1.3 RF-Algorithmus 652</p> <p>25.1.4 Theoretische Klassifikationsleistung eines RFs 653</p> <p>25.1.5 Problemlösungen für konkrete Anwendungen 654</p> <p>25.1.6 Auswahl informativer Eigenschaften 655</p> <p>25.1.7 Bioinformatische Anwendungen 657</p> <p>25.2 Sequenzbasierte Vorhersage der Protein-3-D-Struktur 658</p> <p>25.2.1 Experimentelle Proteinstrukturaufklärung 659</p> <p>25.2.2 Berechnen von Co-Variationssignalen 660</p> <p>25.2.3 PSICOV: Vorhersage räumlich benachbarter Residuenpaare 663</p> <p>25.2.4 Vorhersage der 3-D-Struktur mithilfe von Kontaktinformation 665</p> <p>25.2.5 Alternative Nutzung von Kopplungssignalen 665</p> <p>25.3 Berechnen einer Feinstruktur großer Proteinfamilien 666</p> <p>25.3.1 MCL: Clustern mithilfe stochastischer Matrizen 667</p> <p>25.3.2 Cytoscape: Visualisierung von Netzwerkclustern 669</p> <p>25.4 Positionierung von Nukleosomen 670</p> <p>25.4.1 Chromatin und Nukleosomen 671</p> <p>25.4.2 <i>NucleoFinder</i>: ein statistischer Ansatz zur Vorhersage von Nukleosomenpositionen 672</p> <p>25.5 Auswertung großer Datensätze mit tiefen Lernverfahren 676</p> <p>25.5.1 DL-basierte Vorhersage der Proteinstruktur 677</p> <p>25.5.2 AlphaFold2 und RoseTTAFold 680</p> <p>25.5.3 Erkennen von Translationsinitiationsstellen 683</p> <p>25.5.4 DeepCpG bestimmt den Methylierungsstatus in einzelnen Zellen 684</p> <p>25.6 Analyse des menschlichen Genoms mithilfe von ENCODE-Daten 686</p> <p>25.6.1 Datentypen 687</p> <p>25.6.2 Genome Browser 689</p> <p>Literatur 692</p> <p><b>26 Zum Schluss 699</b></p> <p>26.1 Informatik in schwierigem Umfeld 699</p> <p>26.2 Ungelöste Probleme und Herausforderungen 701</p> <p>Literatur 704</p> <p>Stichwortverzeichnis 705</p>
<p><b> <i> Rainer Merkl</b> war von 2012 bis zu seiner Pensionierung im Jahr 2020 Professor für Bioinformatik am Lehrstuhl Biochemie II der Universität Regensburg. Er hat biomedizinische Technik und Informatik studiert und war am Max-Planck-Institut für Biochemie in Martinsried und der Universität Göttingen tätig, wo er 1996 im Fach Genetik promoviert wurde. Im Jahre 2005 habilitierte er sich an der Universität Regensburg in Bioinformatik. Neben seiner Lehrtätigkeit für Biologen und Biochemiker bildete er an der Fernuniversität Hagen mehr als zehn Jahre lang Informatiker im Fach Bioinformatik aus. </i> </p>
<p><b>Der Marktführer bei den Bioinformatiklehrbüchern in neuer Auflage und mit dem neuen Thema Molekulardynamik</b></p> <p> Bioinformatik ist eine Kerndisziplin in den modernen Biowssenschaften, von der Biotechnologie über die Biochemie und Molekularbiologie bis zur Molekulargenetik und Molekularmedizin. Sie ist eine essenzielle Grundlage für alle “omics”-Technologien, für die Strukturbiologie, die Systembiologie sowie die synthetische Biologie. <p><i>Bioinformatik. Grundlagen, Algorithmen, Anwendungen</i> bietet eine umfassende Einführung in die wichtigsten Methoden der Bioinformatik. Der Autor erklärt dabei sowohl die mathematischen und biologischen Grundlagen als auch die wichtigsten Software-Tools und deren Anwendungsbereiche. Schwerpunkte sind Methoden zum Sequenzvergleich, Verfahren zur Charakterisierung von Proteinfamilien, Algorithmen zur Vorhersage von Protein- und RNA-Strukturen, Methoden des maschinellen Lernens und das Proteindesign. <p>Für die 4. Auflage wurde der Text durchgehend aktualisiert und um ein Kapitel zur Molekulardynamik erweitert. Neu aufgenommene Exkurse zu Meilensteinen der Bioinformatik und aktuellen Anwendungsgebieten lockern den Text auf. Auf der ebenfalls komplett überarbeiteten Begleit-Webseite werden interaktive Lernmodule bereitgestellt, einschließlich mehr als 120 Übungsaufgaben, zum Teil mit Lösungen. <p> Eine perfekte Einführung für alle Studenten der Lebenswissenschaften oder Informatik, die einen Einblick in die gängigen Methoden der Bioinformatik benötigen, sowie ein wertvoller Begleiter für alle, die bereits bioinformatische Werkzeuge nutzen und die zugrundeliegenden Konzepte verstehen möchten.

Diese Produkte könnten Sie auch interessieren:

Arbeitsbuch zu Atkins, de Paula, Keeler Physikalische Chemie
Arbeitsbuch zu Atkins, de Paula, Keeler Physikalische Chemie
von: Peter Bolgar, Haydn Lloyd, Aimee North, Vladimiras Oleinikovas, Stephanie Smith, James J. Keeler
PDF ebook
43,99 €
Verpacktes Leben - Verpackte Technik
Verpacktes Leben - Verpackte Technik
von: Udo Küppers, Helmut Tributsch
PDF ebook
97,99 €
Neuroendocrinology
Neuroendocrinology
von: David A. Lovejoy
PDF ebook
73,99 €