Information

18.3: Vorhersage regelmäßiger Ziele - Biologie

18.3: Vorhersage regelmäßiger Ziele - Biologie


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Identifizierung der Motivinstanzen

Sobald potenzielle Motive entdeckt wurden, besteht der nächste Schritt darin, herauszufinden, welche Motivübereinstimmungen echt sind. Dies kann sowohl durch experimentelle als auch durch rechnerische Methoden erfolgen.

  • Experimentell - Instanzen können experimentell mit ChIP-Chip- und ChIP-Deq-Methoden identifiziert werden. Beides sind In-vivo-Verfahren. Dies geschieht durch die Vernetzung von Zellen. Die DNA wird zunächst in Abschnitte zerlegt. Dann wird das Protein und sein Antikörper oder markiertes Protein hinzugefügt, das an verschiedene Sequenzen bindet. Diese gebundenen Sequenzen werden nun herausgezogen und die Vernetzung wird rückgängig gemacht. Dadurch können wir feststellen, wo im Genom der Faktor gebunden wurde. Dies hat eine hohe False-Positive-Rate, da es viele Fälle gibt, in denen ein Faktor bindet, aber nicht funktionsfähig ist. Dies ist eine sehr beliebte experimentelle Methode, die jedoch durch die Verfügbarkeit von Antikörpern begrenzt ist, die aufgrund vieler Faktoren schwer zu bekommen sind.
  • Computational- Computational Ansätze. Es gibt auch viele rechnerische Ansätze, um Instanzen zu identifizieren. Einzelgenom-Ansätze verwenden Motivclustering. Sie suchen nach vielen Übereinstimmungen, um die Macht zu erhöhen, und sind in der Lage, regulatorische Regionen (CRMs) zu finden. Sie übersehen jedoch Motive, die alleine auftreten und eine Reihe spezifischer Faktoren erfordern, die zusammenwirken. Multigenom-Ansätze, bekannt als phylogenetisches Footprinting, stehen vor vielen Herausforderungen. Sie beginnen damit, viele Sequenzen auszurichten, aber selbst in funktionellen Motiven können sich Sequenzen verschieben, mutieren oder fehlen. Der von Kheradpour gewählte Ansatz handhabt dies, indem er keine perfekte Konservierung (durch Verwendung eines Astlängen-Scores) und keine exakte Ausrichtung (durch Suchen innerhalb eines Fensters) erfordert.

Branch Length Scores (BLS) werden berechnet, indem eine Motivübereinstimmung genommen und in anderen Arten danach gesucht wird. Dann wird der kleinste Unterbaum gefunden, der alle Arten mit einer Motivübereinstimmung enthält. Der Prozentsatz des Gesamtbaums ist der BLS. Die Berechnung der BLS auf diese Weise ermöglicht Mutationen, die durch Motivdegeneration, Fehlausrichtung und Bewegung innerhalb eines Fensters sowie fehlende Motive in dichten Artenbäumen zugelassen werden.

Diese BLS wird dann in einen Konfidenzwert übersetzt. Dies ermöglicht es uns, die Wahrscheinlichkeit einer bestimmten Punktzahl zu bewerten und Unterschiede in der Motivzusammensetzung und -länge zu berücksichtigen. Wir berechnen diesen Konfidenzwert, indem wir alle Motivinstanzen und Kontrollmotive bei jedem BLS zählen. Wir wollen dann sehen, welcher Anteil der Motivinstanzen real zu sein scheint. Der Konfidenzwert ist dann Signal/(Signal+Rauschen). Die bei dieser Berechnung verwendeten Kontrollmotive werden erzeugt, indem 100 Shuffles des Originalmotivs erzeugt werden und die Ergebnisse gefiltert werden, indem gefordert wird, dass sie mit dem Genom mit +/- 20% des Originalmotivs übereinstimmen. Diese werden dann nach ihrer Ähnlichkeit zu bekannten Motiven sortiert und geclustert. Aus jedem Cluster wird höchstens ein Motiv in aufsteigender Ähnlichkeitsreihenfolge entnommen, um unsere Kontrollmotive zu erzeugen.

Validieren von Zielen

Ähnlich wie bei der Motiverkennung können wir Ziele validieren, indem wir sehen, wo sie im Genom liegen. Confidence selektiert nach TF-Motivinstanzen in Promotoren und miRNA-Motiven in 3’-UTRs, was wir erwarten. TFs können auf beiden Strängen vorkommen, während miRNA nur auf einen Strang fallen muss. Obwohl keine TFs bevorzugt werden, findet man miRNA bevorzugt auf dem Plusstrang.

Eine andere Methode zur Validierung von Zielen ist die Berechnung von Anreicherungen. Dies erfordert einen Hintergrund- und Vordergrundsatz von Regionen. Diese könnten ein Promotor von koregulierten Genen gegenüber allen Genen oder Regionen sein, die durch einen Faktor gegenüber anderen intergenischen Regionen gebunden sind. Die Anreicherung wird berechnet, indem der Anteil der Motivinstanzen innerhalb des Vordergrunds gegenüber dem Anteil der Basen im Vordergrund genommen wird. Zusammensetzung und Konservierungsgrad werden mit Kontrollmotiven korrigiert. Diese Brüche können unter Verwendung eines binomialen Konfidenzintervalls konservativer gemacht werden.

Ziele können dann durch Vergleich mit experimentellen Instanzen validiert werden, die mit ChIP-Seq gefunden wurden. Dies zeigt, dass die konservierten CTCF-Motivinstanzen in ChIP-Seq-Stellen stark angereichert sind. Zunehmendes Vertrauen erhöht auch die Bereicherung. Damit werden viele Motivinstanzen verifiziert. ChIP-Seq findet nicht immer funktionelle Motive, daher können diese Ergebnisse durch Vergleich mit konservierten gebundenen Regionen weiter verifiziert werden. Dabei wird festgestellt, dass die Anreicherung in Kreuzungen dramatisch höher ist. Dies zeigt, wo Faktoren binden, die sich in der Evolution konservierenswert auswirken. Diese beiden Ansätze ergänzen sich und sind noch effektiver, wenn sie zusammen verwendet werden.


Schau das Video: Was ist Amyloidose? Medizin Biologie (Kann 2022).