Information

Genabstand und Rekombinationsfrequenz: Mechanismus

Genabstand und Rekombinationsfrequenz: Mechanismus



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Warum ist die Rekombinationsfrequenz höher, wenn die Gene weiter auseinander liegen?


Das als Rekombination bezeichnete genetische Phänomen spiegelt den Prozess der Kreuzung wider, der während der Meiose auftritt. Cross-Over führt zu einem Austausch genetischer Informationen zwischen homologen Chromosomen. In erster Näherung finden die Ereignisse an zufälligen Positionen entlang der ausgerichteten Chromosomen statt. Je weiter zwei Loci voneinander entfernt sind, desto wahrscheinlicher ist es, dass es zwischen ihnen zu einem Cross-Over-Ereignis kommt. Somit kann die Rekombinationsfrequenz verwendet werden, um den Abstand zwischen zwei genetischen Loci (oder Genen) zu messen.

Ergänzung als Antwort auf Kommentar von OP hinzugefügt

Eine Analogie

Stellen Sie sich ein Stück Schnur vor. Es hat 6 Markierungen (1-6 auf dem Diagramm), die es in 7 Intervalle (A-G) unterteilen. Wir werden die Schnur an einer der Markierungen durchschneiden. Wir würfeln, um zu entscheiden, welche Position wir schneiden.

Wie groß ist die Wahrscheinlichkeit, dass unser Schnitt A und G trennt? Es ist 100%, da alle Einzelschnitte dies tun.

Wie groß ist die Wahrscheinlichkeit, dass unser Schnitt A und D trennt? Es sind 50%, da Einzelschnitte bei 1,2 oder 3 dies tun.

Wie groß ist die Wahrscheinlichkeit, dass unser Schnitt A und B trennt? Es sind 16,7% (1/6), da dies nur ein Schnitt auf Position 1 tut und die Wahrscheinlichkeit, eine 1 auf unseren Würfel zu werfen, 1/6 beträgt.

Stellen Sie sich die Intervalle (A-G) als Gene und die Schnittstellen (1-6) als mögliche Kreuzungsereignisse vor. Wenn zwei homologe Chromosomen zufällig einen einzigen Crossover durchlaufen, dann ist es umso unwahrscheinlicher, dass der Crossover (Schnitt) zwischen ihnen stattfindet, je näher die Gene (Intervalle) beieinander liegen. Dies setzt natürlich voraus, dass der Übertrittsort zufällig gewählt wird.

Wenn in dem hier vorgestellten Modell die Reihenfolge der Buchstaben verwürfelt war und wir nicht wussten, was es war, uns aber die Häufigkeit des Auftretens der Trennung der Intervalle mit zufälligem Schneiden mitgeteilt wurde, konnten wir die Reihenfolge der Buchstaben ableiten.


Genabstand und Rekombinationsfrequenz: Mechanismus - Biologie

Die Rekombination ist sehr wichtig, um genetische Variabilität in Viruspopulationen zu erzeugen.

Die virale Rekombination hat wichtige Konsequenzen für verschiedene Forschungsbereiche. Dazu gehören Molekularbiologie, Virologie und Evolutionsbiologie. Es wirkt sich auch auf die tägliche Praxis von Klinikern und Beamten des öffentlichen Gesundheitswesens aus.

Hier besprechen wir drei wichtige Aspekte der viralen Rekombination: (i) molekulare Mechanismen von Modell-DNA- und RNA-Viren, (ii) Methoden zum Nachweis, Charakterisierung und Quantifizierung in viralen Populationen, (iii) ihren Einfluss auf die evolutionäre Analyse viraler Populationen .


Landwirtschaftliche und verwandte Biotechnologien

4.12.3.1 Marker und Mapping

Genetische Kartierung in ihrer einfachsten Definition ist „das Ordnen von Markern, die die relativen genetischen Abstände zwischen ihnen anzeigen“. 23 Das Konzept, eine genetische Karte zu erstellen, ist nicht neu und zielt in der Regel darauf ab, ein besseres Verständnis des genetischen Verhaltens und die (effiziente) Selektion überlegener Genotypen zu ermöglichen.

Marker auf PCR-Basis werden in der genetischen Kartierung immer beliebter, da sie selbst aus kleinen DNA-Mengen leicht hergestellt werden können. In den letzten zehn Jahren wurde die AFLP-Technik wegen ihrer hohen Effizienz bei der Generierung einer großen Anzahl molekularer Marker weit verbreitet in der genetischen Kartierung von Pflanzen eingesetzt. SSRs wurden zur bevorzugten Wahl von Markern, da sie mit hoher Häufigkeit in Pflanzengenomen auftraten, hohe Mutationsraten aufwiesen, eine gute analytische Auflösung aufwiesen und leicht automatisiert werden konnten. Die jüngsten Entwicklungen in der SNP-Technologie, kombiniert mit der Verfügbarkeit von vollständigen Genomsequenzdaten, machen es jedoch wahrscheinlich, dass sie mit der Zeit der Marker der Wahl insbesondere bei Nutzpflanzen von großer wirtschaftlicher Bedeutung sein werden.


Ergebnisse

Genregulatorische Domänen, die unter Verwendung von quantitativen Merkmals-Loci für Expression und Methylierung definiert wurden, zeigen ein Tal der Rekombinationsrate

Wir untersuchten die Beziehung zwischen menschlicher Rekombinationsrate und regulatorischen Domänen, definiert als die genomische Region, die von einem Gen überspannt wird, und die regulatorischen Regionen, die mit seinem Promotorelement innerhalb desselben Chromosoms verbunden sind. Die Rekombinationsraten wurden anhand der genetischen Karte von 1000 Genomen [4] geschätzt und dann anhand von vier Arten von Verknüpfungen mit den Genregulationsdomänen in Beziehung gesetzt.

Wir verwendeten zuerst genetische Verknüpfungen basierend auf quantitativen Merkmals-Loci der Expression (eQTLs) und quantitativen Merkmals-Loci der Methylierung (meQTLs). Diese bestehen aus 248.856 eQTL-Links zwischen regulatorischen Regionen und Transkriptionsstartstellen (TSSs) von Zielgenen, die im Vollblut anhand von 168 Personen definiert wurden, die vom Gene-Tissue Expression (GTEx) Consortium [15] profiliert wurden, und 809.577 meQTL-Links zwischen regulatorischen Regionen und CpG-Methylierung gemessen im menschlichen Gehirn, hauptsächlich in Promotorregionen, in der ROS/MAP-Kohorte von 575 Individuen [16].

Wir fanden, dass die Intervalle zwischen eQTLs und ihren Zielgenen sowie zwischen meQTLs und ihren Ziel-Methylierungssonden eine erhebliche Abnahme der Rekombinationsrate zeigten (Abb. 1a, b). Wir haben Intervalle in drei Entfernungsbereichen ausgewertet, bestehend aus kurzen (1–10 kb), mittleren (10–100 kb) und langen (100 kb–1 Mb) Entfernungen. Am ausgeprägtesten war der Effekt bei Verbindungen mittlerer und langer Distanz, die im Vergleich zu zufälligen Intervallen durchweg niedrigere Rekombinationsraten zeigten, ein Phänomen, das wir als „Rekombinationsratental“ bezeichnen (Abb. 1e, f Zusatzdatei 1: Abbildung S1a, b). In kurzen Abständen wird die Genauigkeit der Schätzung der Rekombinationsrate durch die variable SNP-Dichte in verschiedenen genomischen Regionen und genetischen Karten beeinflusst. Daher beobachteten wir keine konsistenten Täler der Rekombinationsrate innerhalb kurzer Intervalle. Um die statistische Signifikanz der beobachteten Täler der Rekombinationsrate zu bewerten, haben wir dieselbe Anzahl von zufälligen Genomregionen mit derselben physikalischen Länge auf demselben Chromosom entnommen (Details in „Methoden“). Als zusätzlichen Vergleich haben wir die gleiche Anzahl zufälliger SNP-TSS/SNP-CpG-Paare untersucht (Details in „Methoden“). Wir fanden in beiden Fällen eine signifikante Abnahme der Rekombinationsrate sowohl bei mittleren als auch bei langen Distanzen für eQTL- und meQTL-Verbindungen (Abb. 1i, j) SNP-TSS/SNP-CpG, P < 1e –4).

Rekombinationstäler innerhalb genetischer, physischer und Aktivitätsverbindungen. Beispiel für genomische Regionen, um die Anreicherung von zu zeigen ein meQTL-Paare (rot), B eQTL-Paare (Orange), C obere 10 % Hi-C-Paare (beobachtet/erwartet (O/E), kein CTCF-Motiv, Blau), D DNase-TSS-Paare (kein CTCF-Motiv, Violett) in Regionen mit niedriger Rekombinationsrate. Jedes Pixel repräsentiert ein 10-kb-Segment (für Hi-C ein 1-kb-Segment) und eine dunklere Farbe zeigt eine höhere Rekombinationsrate zwischen zwei Segmenten an. Farbige Punkte an jedem Pixel geben die genetischen oder physischen Verbindungen an, die zwischen zwei genomischen Segmenten bestehen. Die durchschnittliche Rekombinationsrate innerhalb e meQTL-Paare (rot), F eQTL-Paare (Orange), g Top 10 % der Hi-C-Paare (O/E, kein CTCF-Motiv, Blau), h DNase-TSS-Paare (kein CTCF-Motiv, Violett) sind deutlich niedriger als die übereinstimmenden Zufallsintervalle. Farbige Linien stellen die mittlere Rekombinationsrate bei jedem Intervallabstand zwischen genomischen Merkmalen dar, während schwarze Links stellen den Mittelwert in übereinstimmenden Zufallsintervallen dar. Schattierte Bereiche repräsentieren das 95 %-Konfidenzintervall (Mittelwert ± Standardabweichung × 1,96/10). Rekombinationsrate in drei verschiedenen genomischen Skalen in ich meQTL-Paare, J eQTL-Paare, k Top 10 % der Hi-C-Paare (O/E, kein CTCF-Motiv), l DNase-TSS-Paare (kein CTCF-Motiv). Vergleiche mit P < 1e -4 (zweifach gepaarter Mann-Whitney-U-Test) sind mit an . markiert Sternchen

Als nächstes bestätigten wir, dass unsere Beobachtung bei genetisch basierten Verbindungen kein Artefakt des Kopplungsungleichgewichts (LD) ist, was möglich ist, da mehr genetische Verbindungen in Regionen mit stärkerer LD gefunden werden. Erstens haben wir nur die eQTL/meQTL mit den bedeutendsten behalten P Wert für jedes Gen/CpG. Wir haben diese „besten“ eQTL/meQTL-Links weiter beschnitten, indem wir mehrere Zählungen aus derselben genomischen Region ausgeschlossen haben (Details in Zusatzdatei 2: Zusatzmethode 1) und durchgängig signifikante Täler der Rekombinationsrate in den durch genetische Verbindungen definierten Regionen gefunden (Zusatzdatei 1: Abbildung S2a–c, f–h, k–m). Zweitens haben wir eine kleine zufällige Verschiebung um die besten genetischen Verbindungen vorgenommen und eine etwas, aber signifikant höhere Rekombinationsrate festgestellt (Zusatzdatei 1: Abbildung S3 Zusatzdatei 2: Ergänzende Methode 2). Diese Beobachtungen legen nahe, dass kausale genetische Verbindungen niedrigere Rekombinationsraten innerhalb der LD aufweisen.

Wir bewerteten weiter, ob unsere Beobachtung in unabhängigen Datensätzen und mit unterschiedlichen analytischen Parametern stand. Zuerst wiederholten wir die Analyse mit 16 zusätzlichen Geweben und Zelllinien des GTEx-Konsortiums [15], des Multiple Tissue Human Expression Resource (MuTHER)-Konsortiums [17] und des Genetic European Variation in Health and Disease (gEUVADIS)-Konsortiums [18]. und fanden wiederum konsistent ein signifikantes Tal der Rekombinationsrate in den Regionen, die durch genetische Verbindungen definiert sind (Zusatzdatei 1: Abbildung S4). Zweitens wiederholten wir die Analyse mit unterschiedlichen Schwellenwerten für die Rate der falschen Entdeckungen (FDR) von eQTLs und meQTLs und fanden durchweg Täler der Rekombinationsrate. Die stärkste Reduktion der Rekombinationsrate wurde bei den strengsten FDR-Schwellenwerten für die eQTL- und meQTL-Erkennung festgestellt, was darauf hindeutet, dass das Signal bei höheren Link-Konfidenzschwellenwerten stärker wird (Zusätzliche Datei 1: Abbildung S5a, b, e, f, i, j ). Drittens wiederholten wir die Analyse auf genetischen Karten, die vom HapMap-Projekt [19] und von deCODE Genetics [2, 3] geschätzt wurden, und fanden die Ergebnisse weitgehend unverändert (Zusatzdatei 1: Abbildung S6a, b, e, f, i, l) . Um Sequenzfehler zu berücksichtigen, verwendeten wir einen Rejection-Sampling-Ansatz, um übereinstimmende Zufallsintervalle mit gleichem GC-Gehalt, CpG-Dichte, SNP-Dichte und PRDM9-Motivdichte zu generieren. Wir fanden die Ergebnisse robust gegenüber diesem strengeren Matching (Zusätzliche Datei 1: Abbildung S7a, b, e, f, i, j, m, n, q, r). Da es rechnerisch sehr aufwendig ist, durch einen Rejection-Sampling-Ansatz im hochdimensionalen Raum zufallsgematchte Kontrollen zu generieren, haben wir eine kd-Baum-Datenstruktur implementiert, um alle möglichen 1-kb- bis 1-Mb-Zufallsintervalle im Genom zu organisieren und mit noch strengeren Matching-Kriterien, einschließlich zusätzlicher Merkmale der Gendichte und Entfernung zum TSS (Details in „Methoden“ Zusatzdatei 1: Abbildung S7u, v, y, z, ac–af). Um die verringerte Rekombinationsrate in transkribierten Regionen zu berücksichtigen, haben wir Intervalle innerhalb von 2 kb Genannotationen in GENCODE v19 ausgeschlossen und immer noch Rekombinationsratentäler in intergenen meQTL/eQTL-Links gefunden, verglichen mit zufälligen Intervallen, die mit unseren strengen übereinstimmenden Kriterien generiert wurden. Die Schlussfolgerung änderte sich nicht, als wir die Rekombinationsrate nur aus nicht-kodierenden Basen gemittelt haben (Zusätzliche Datei 1: Abbildung S8a, b, e, f, i, j, m–p).

Genregulatorische Domänen durch Chromosomenkonformation zeigen ein Rekombinationstal

Zusätzlich zu genetischen Verbindungen verwendeten wir 458,132 Verbindungen zwischen genomischen Regionen in unmittelbarer Nähe, wenn sie im dreidimensionalen Kern gefaltet wurden, basierend auf dem Hochdurchsatz-Chromosom-Konformations-Capture (Hi-C), gemessen in der GM12878-Zelllinie [20]. Wir fanden heraus, dass die Rekombinationsrate innerhalb der durch Hi-C definierten regulatorischen Domänen ebenfalls signifikant niedriger war (zweifacher gepaarter Mann-Whitney-U-Test und Permutationstest, P < 1e −4 ) sowohl auf mittlere als auch auf lange Distanzen verglichen mit zwei verschiedenen Sätzen zufälliger Intervalle (Abb. 1c, g, k Zusätzliche Datei 1: Abbildung S1c). Diese Eigenschaft gilt speziell für Hi-C-Links, die nicht durch CTCF-Motive unterbrochen werden [21], in Übereinstimmung mit der Rolle von CTCF-Schleifen als Definition von regulatorischen Domänengrenzen [20] (Abb. 1g, k Zusätzliche Datei 1: Abbildung S11o, p). Wir haben auch CTCF-Motive aus zufällig abgestimmten Intervallen ausgeschlossen und immer noch signifikante Verarmungen gefunden (Zusätzliche Datei 1: Abbildung S12a, b).

Um den Bias zu vermeiden, der durch relativ mehr Hi-C-Links aus den Domänen mit niedrigerer Rekombinationsrate eingeführt wird, haben wir die übereinstimmenden Zufallsintervalle nur innerhalb derselben Schleifen erzeugt, die durch die rechnerische Hi-C-Rechenwertsuche ohne Vorspannung (HiCCUPS-Schleifen) erkannt wurden und immer noch Täler der Rekombinationsrate gefunden haben (Zusätzliche Datei 1: Abbildung S9). Wir haben auch die Hi-C-Links beschnitten, indem wir mehrere Zählungen jeder genomischen Region ausgeschlossen und durchweg Täler der Rekombinationsrate gefunden haben (Zusätzliche Datei 1: Abbildung S2d, i, n Zusätzliche Datei 2: Ergänzende Methode 1). Als nächstes variierten wir den Schwellenwert für Hi-C-Links (kein CTCF-Motiv), die in die Analyse einbezogen wurden, und beobachteten weiterhin Täler der Rekombinationsrate (zusätzliche Datei 1: Abbildung S5c, g). Wir haben die Analyse auch in verschiedenen genetischen Karten wiederholt (Zusatzdatei 1: Abbildung S6c, g) und diese mit strengeren übereinstimmenden Zufallsintervallen im gesamten Genom mit zwei Methoden verglichen (Zusatzdatei 1: Abbildung S7c, g, k, o, s , w, aa) und in nicht-kodierenden und intergenischen Regionen (Zusatzdatei 1: Abbildung S8c, g, k). Wir kombinierten Hi-C- und eQTL-Evidenz, die im gleichen Zelltyp verfügbar waren (lymphoblastoide Zelllinien (LCLs), einschließlich GM12878) [17, 20] und stellten fest, dass die Depletion der Rekombinationsrate noch ausgeprägter wurde (Zusätzliche Datei 1: Abbildung S10 Zwei-Wege-gepaarter Mann-Whitney-U-Test, P < 1e –4). Dies weist darauf hin, dass Genregulationsverbindungen mit erhöhtem Vertrauen ein noch ausgeprägteres Tal der Rekombinationsrate zeigen.

Wir wiederholten diese Analyse unter Verwendung physikalischer chromosomaler Interaktionen, die durch Chromatin-Interaktionsanalyse unter Verwendung von Paired-End-Tag-Sequenzierung (ChIA-PET) definiert wurden, einer komplementären Technik, die Long-Range-Looping-Interaktionen im Kontext eines spezifischen Regulators definiert [22]. Wir verwendeten regulatorische Domänen basierend auf ChIA-PET sowohl für Polymerase (Pol)II als auch CTCF, wie vom ENCODE-Konsortium definiert. Wir fanden, dass die Rekombinationsrate innerhalb von ChIA-PET-PolII-verknüpften Regionen ebenfalls signifikant verringert war, jedoch nicht in ChIA-PET-CTCF-verknüpften Regionen, die keine Genregulationsdomänen sind (zusätzliche Datei 1: Abbildung S11k–n).

Diese Ergebnisse zeigen, dass das Tal der Rekombinationsrate eine allgemeine Eigenschaft von Genregulationsdomänen ist, die unter Verwendung von weitreichenden physikalischen DNA-Wechselwirkungen definiert sind, die nicht durch CTCF isoliert sind.

Genregulatorische Domänen, die mittels Aktivitätskorrelation definiert wurden, zeigen ein Rekombinationstal

Als nächstes untersuchten wir die Beziehung zwischen der Rekombinationsrate und den Genregulationsverbindungen, die zwischen Enhancer-Regionen und ihren Zielgenen definiert wurden, wie unter Verwendung von Histonmodifikation, DNase-Zugänglichkeit und Genexpressionsdaten von ENCODE [23] und Roadmap Epigenomics Consortia [24] vorhergesagt. Wir verwendeten 29.557.079 einzigartige korrelationsbasierte Verbindungen, die zwischen DNase-seq-Peaks und der Genexpression mutmaßlicher Zieltranskripte vorhergesagt wurden (Details in Zusatzdatei 2: Ergänzende Methode 10). Angesichts der Rolle von CTCF-Motiven bei der Führung von Chromatin-Schleifen [20] konzentrierten wir uns auf 164.409 einzigartige Verbindungen, die nicht durch CTCF-Motive unterbrochen wurden und daher eher in den gleichen Chromatin-Schleifen liegen. Wir fanden eine signifikant reduzierte Rekombinationsrate für Regionen innerhalb dieser Enhancer-TSS-Domänen im Vergleich zu zufälligen Paaren (zweifach gepaarter Mann-Whitney-U-Test und Permutationstest, P < 1e −4 Abb. 1d, h, l Zusatzdatei 1: Abbildung S1d Zusatzdatei 1: Abbildung S11i, j).

Um Mehrfachzählungen aus derselben genomischen Region zu vermeiden, haben wir die DNase-TSS-Links mit einem ähnlichen Ansatz wie bei den Hi-C-Links beschnitten (Zusatzdatei 2: Ergänzende Methode 1) und haben ähnliche Ergebnisse gefunden (Zusatzdatei 1: Abbildung S2e, j , Ö). Als nächstes wiederholten wir die Analyse mit unterschiedlichen Schwellenwerten für DNase-TSS-Links (zusätzliche Datei 1: Abbildung S5d–h), verschiedene genetische Karten (zusätzliche Datei 1: Abbildung S6d–h) und strengere übereinstimmende Zufallsintervalle im gesamten Genom (zusätzliche Datei 1: Abbildung S7d, h, l, p, t, x, ab), nicht-kodierende Basen und intergenische Regionen (zusätzliche Datei 1: Abbildung S8d, h, l) und durchgängig signifikante Täler der Rekombinationsrate innerhalb von DNase-TSS . gefunden Links.

Wir führten eine zusätzliche Analyse mit 1.427.744 einzigartigen Enhancer-TSS-Links durch, die unter Verwendung einer modifizierten Version einer zuvor veröffentlichten Strategie [23] basierend auf zelltypspezifischen Chromatinzustandszuordnungen und Korrelation zwischen mehreren Histonmodifikationen und Genexpressionsniveaus über Zelltypen vorhergesagt wurden [24] (Einzelheiten in Zusatzdatei 2: Ergänzende Methoden 11). Wir fanden heraus, dass die resultierenden 139.043 Genregulationsdomänen ohne CTCF-Motive weiterhin eine signifikante Verringerung der Rekombinationsrate sowohl bei mittleren als auch bei langen Distanzen zeigten (zusätzliche Datei 1: Abbildung S11a–d).

Wir wiederholten diese Analyse mit 302.538 eindeutigen Links, die mit einem modulbasierten Ansatz zur gemeinsamen latenten Dirichlet-Allokation (Joint-LDA) vorhergesagt wurden (Wang et al., in Vorbereitung sind die Links von Daten und Code in Zusatzdatei 3: Tabelle S1) verfügbar hängt nicht von Korrelationen ab und kann zelltypspezifische Verbindungen vorhersagen. Trotz dieser Unterschiede bei der Vorhersage von Enhancer-TSS-Verbindungen fanden wir eine ähnliche Verarmung der Rekombinationsrate innerhalb von Genregulationsdomänen im Vergleich zu zufälligen Kontrollen (Zusatzdatei 1: Abbildung S11e–h).

Zusammen weisen diese Ergebnisse darauf hin, dass Genregulationsdomänen, die basierend auf funktioneller Genomik und epigenomischer Information definiert sind, mit einem Tal der Rekombinationsrate verbunden sind, was darauf hindeutet, dass Gene dazu neigen, mit ihren Genregulationselementen gemeinsam vererbt zu werden.

Konstitutive und Entwicklungsdomänen zeigen eine stärkere Depletion der Rekombinationsrate

Als nächstes untersuchten wir, wie die Stärke des Tals der Rekombinationsrate für verschiedene Genklassen variiert. Wir stellten fest, dass das Tal der Rekombinationsrate innerhalb von körperlichen und Aktivitätsverbindungen bei Housekeeping-Genen [25] ausgeprägter war als bei Nicht-Housekeeping-Genen (Abb. 2a–c Zusatzdatei 1: Abbildung S13). Es war auch ausgeprägter für Gene, die in frühen embryonalen Entwicklungsstadien wirken [26, 27], insbesondere für Gene im Eizellenstadium und Gene, die für die Meiose in der primordialen Keimzelle (PGC) verantwortlich sind, jedoch nicht für die meisten anderen Zelltypen -spezifische Gengruppen [28] (Abb. 2d Zusatzdatei 1: Abbildung S14). Um die Möglichkeit auszuschließen, dass das Signal in Housekeeping-Genen auf den Beitrag von Genen zurückzuführen ist, die aktiv in der Eizelle und im frühen Entwicklungsstadium exprimiert werden und daher einer Rekombination nicht zugänglich sind, teilen wir Housekeeping-Gene in drei Kategorien ein: solche, die in frühen Entwicklungsstadien stark exprimiert werden (top 10 % der Expressionsniveaus), diejenigen, die nicht zu den oberen 10 % gehören, und diejenigen, die nicht zu den oberen 50 % gehören. Täler der Rekombinationsrate wurden unabhängig von den Expressionsniveaus beobachtet (zusätzliche Datei 1: Abbildung S15).

Täler der Rekombinationsrate sind am deutlichsten bei funktionellen Verbindungen, die mit Housekeeping-Genen und konstitutiven Verbindungen verbunden sind. ein Durchschnittliche Rekombinationsrate in den oberen 10 % der Hi-C-Paare (beobachtet/erwartet (O/E), kein CTCF), assoziiert mit Housekeeping-Genen (Blau) und nicht mit Housekeeping-Genen (golden). B Durchschnittliche Rekombinationsrate in DNase-TSS-Paaren ohne dazwischenliegende CTCF-Motive, assoziiert mit Housekeeping-Genen (Violett) und nicht mit Housekeeping-Genen (golden). C Durchschnittliche Rekombinationsrate in Enhancer-TSS-Paaren, die mit der LDA-Methode aufgerufen werden, ohne dazwischenliegende CTCF-Motive, assoziiert mit Housekeeping-Genen (Grün) und nicht mit Housekeeping-Genen (golden). D Durchschnittliche Rekombinationsrate in ChIA-PET PolII-Verbindungen an frühen embryonalen Entwicklungsgenen und anderen zelltypspezifischen Genen in K562-Zellen. Fehlerbalken geben die Standardabweichung an. e Das Tal der Rekombinationsrate ist bei konstitutiven eQTL-Verbindungen viel signifikanter (Orange) als bei gewebespezifischen eQTL-Links (Magenta). F Rekombinationsrate innerhalb von Enhancer-TSS-Links (10–100 kb Region), aufgerufen durch gemeinsame LDA-Methode in unterschiedlichen Anzahlen von Zelltypen. Fehlerbalken zeigen die Standardabweichung an

Wir haben auch untersucht, wie die Stärke des Tals der Rekombinationsrate für verschiedene Klassen von regulatorischen Elementen variiert. Wir untersuchten die Depletion der Rekombinationsrate mit 43.236 konstitutiven eQTLs und 18.879 schilddrüsenspezifischen eQTL-Links aus dem GTEx-Projekt [15]. Wir fanden heraus, dass konstitutive eQTL-Links durchweg größere Diskrepanzen in den Rekombinationsraten zeigten als gewebespezifische Links, jeweils im Vergleich zu gematchten Zufallskontrollen (Abb. 2e Zusätzliche Datei 1: Abbildung S16). In ähnlicher Weise fanden wir, dass Genregulationsdomänen, die unabhängig in mehreren Zelltypen gewonnen wurden, ein ausgeprägteres Tal der Rekombinationsrate zeigten als gewebespezifische Genregulationsdomänen ( 2f ).

Somit ist das Tal der Rekombinationsrate stärker ausgeprägt in Genregulationsdomänen von konstitutiv exprimierten Genen, Genen mit Entwicklungsrollen und regulatorischen Elementen mit konstitutiver Aktivität, die alle die Eigenschaft haben, dass sie unter stärkeren evolutionären Zwängen stehen [29]. Dies deutet darauf hin, dass eine reduzierte Rekombinationsrate zwischen regulatorischen Elementen und ihren Zielgenen für Gene und regulatorische Elemente unter stärkerer Selektion in der Keimbahnlinie vorteilhaft sein kann, möglicherweise durch die Erleichterung der Aufrechterhaltung des gepaarten Gens und seiner regulatorischen Elemente in jedem Allel, die wichtig sind während der frühen Entwicklung als eine Einheit der Vererbung.

Täler der Rekombinationsrate bei Mäusen

Wir kamen zu dem Schluss, dass, wenn das Tal der Rekombinationsrate ein ausgewähltes Merkmal von Genregulationsdomänen beim Menschen ist, es ein evolutionär konserviertes Merkmal bei anderen Säugetieren sein sollte. Um diese Hypothese zu testen, wiederholten wir unsere Analyse im Mausgenom.

Wir quantifizierten die Rekombinationsraten im gesamten Mausgenom mithilfe der Muskulatur genetische Karte [30]. Wir haben Genregulationsdomänen sowohl durch genetische als auch durch physikalische Interaktionen definiert. Für genetische Interaktionen verwendeten wir 2659 eQTLs basierend auf 100 Stämmen in Mäuseleber [31] und 1035 eQTLs basierend auf 39 Stämmen in zwei Mäuseimmunologischen Zelltypen [32]. Für physikalische Interaktionen verwendeten wir 271.236 Hi-C-Links (kein CTCF) [20], die in einer murinen lymphoblastoiden Zelllinie genannt wurden.

Bei der Bewertung der Rekombinationsrate von Genregulationsdomänen fanden wir eine signifikante Erschöpfung der Rekombinationsrate im Vergleich zu zufälligen Paaren sowohl für lange genetische Interaktionen als auch für physikalische Interaktionen (zweifach gepaarter Mann-Whitney-U-Test und Permutationstest, P < 1e −4 Abb. 3 Zusatzdatei 1: Abbildung S17). Wir haben bei genetischen Verbindungen keine Täler der Rekombinationsrate in Intervallen mittlerer Reichweite beobachtet, wahrscheinlich aufgrund der längeren LD-Struktur und der viel niedriger aufgelösten genetischen Karten bei der Maus. Dies legt nahe, dass das Tal der Rekombinationsrate nicht nur ein Merkmal des menschlichen Genoms ist, sondern eine allgemeinere Eigenschaft von Säugetieren darstellen könnte, möglicherweise als evolutionär konservierter Mechanismus, um wichtige regulatorische Domänen zu erhalten.

Täler der Rekombinationsrate in regulatorischen Domänen der Maus. ein Durchschnittliche Rekombinationsrate in den oberen 10 % der Hi-C-Verbindungen (beobachtet/erwartet (O/E)) ohne dazwischenliegende CTCF-Peaks in CH-12-Zellen. B Rekombinationsrate in den oberen 10 % der Hi-C-Links (O/E) ohne dazwischenliegende CTCF-Peaks in CH-12-Zellen. Sternchen stellen einen statistisch signifikanten Unterschied zwischen zwei Gruppen dar (zwei-Wege-gepaarter Mann-Whitney-U-Test, P < 1e−4)

Mögliche Rollen von DNA-Methylierung und Doppelstrangbrüchen in Tälern der Rekombinationsrate

Als nächstes versuchten wir, mögliche mechanistische Prozesse zu verstehen, die zu den beobachteten Tälern der Rekombinationsrate führen könnten. Wir fanden heraus, dass eine Knappheit an Rekombinations-Hotspots mit Tälern der Rekombinationsrate verbunden ist (Abb. 4a Zusatzdatei 1: Abbildung S18a). Jedoch hat die Hälfte der Verbindungen keine Rekombinations-Hotspots, und daher muss ihre Variation der Rekombinationsrate mit anderen Mechanismen erklärt werden.

Die Täler der Rekombinationsrate sind mit der Hotspot-Dichte und der DNA-Methylierung korreliert. ein Die Beziehung zwischen log10 (Rekombinationsrate) und Rekombinations-Hotspot-Dichte (pro kb) bei jedem eQTL-Intervall. Wärmefarben stellen die Punktdichte dar. Dichte der Rekombinations-Hotspots weniger als 0,005/kb (rotes Rechteck) wurde für die Analyse in . extrahiert B. B Die Beziehung zwischen der durchschnittlichen Rekombinationsrate und den DNA-Methylierungsquantilen im GV-Oozytenstadium innerhalb der eQTL-Intervalle. Fehlerbalken geben Sie die Standardabweichung an

Angesichts der zuvor vorgeschlagenen Rolle der DNA-Methylierung bei der Rekombinationsrate [11] untersuchten wir die Beziehung zwischen DNA-Methylierung und Rekombinationsraten-Tälern. Wir verwendeten genomweite Methylierungsprofile mit Nukleotidauflösung in humanen Urkeimzellen (PGCs) [27] und Oozyten [33], die den Methylomzustand menschlicher Zellen sowohl vor als auch während des Meiosestillstands darstellen (Zusatzdatei 1: Abbildung S19a), in welche Rekombination über Crossover-Ereignisse erfolgt.

Wir verwendeten 500-kb-Fenster, die sich nicht überlappen, um das Genom zu scannen, und fanden eine starke globale negative Korrelation zwischen den Methylierungsniveaus in PGCs und der Rekombinationsrate (Zusatzdatei 1: Abbildung S19b Zusätzliche Datei 1: Abbildung S20a), was darauf hindeutet, dass DNA-Methylierungsniveaus unmittelbar zuvor auf Rekombinationsereignisse sind in hohem Maße prädiktiv für Rekombinationstäler. Im Gegensatz dazu fanden wir keine so starke globale Antikorrelation in Eizellen (Zusatzdatei 1: Abbildung S19b), jedoch zeigte der Methylierungsgrad innerhalb genetischer Verbindungen wie eQTL-Verbindungen eine negative Korrelation mit der Rekombinationsrate in Eizellen (Abb. 4b Zusatzdatei 1 .). : Bild S18b Zusatzdatei 1: Bild S19c Zusatzdatei 1: Bild S20b–d). Diese Ergebnisse legen nahe, dass die DNA-Methylierung eine Rolle bei der Verringerung der Häufigkeit von meiotischen Rekombinationsereignissen spielen könnte, die funktionelle regulatorische Verknüpfungen von Vätern und Müttern beeinträchtigen. Wir fanden keine starken globalen oder lokalen negativen Korrelationen zwischen Methylierung und Rekombinationsrate in weiteren Zelltypen in einer Reihe von Entwicklungsstadien (Zusatzdatei 1: Abbildung S19c Zusatzdatei 1: Abbildung S20b–d).

Rekombinationsereignisse werden durch Doppelstrangbrüche initiiert, die vermutlich mit der DNA-Methylierung assoziiert sind [34]. Somit kann die Methylierung der DNA in großen regulatorischen Domänen die verringerte Rekombinationsrate erklären. Um dieses Modell zu evaluieren, untersuchten wir die Korrelation zwischen DNA-Methylierungsniveaus und der Häufigkeit von Doppelstrangbrüchen (DSB), die beide in Spermien profiliert wurden. Wir fanden, dass die DNA-Methylierung eine signifikant negative Korrelation mit der Häufigkeit der DSB-Initiation zeigte (Pearson −0,11, P Wert = 1,71e −16 Zusatzdatei 1: Bild S21a). Um die Beziehung zwischen DNA-Methylierung und DNA-DSBs weiter zu untersuchen, korrelierten wir die in LCL profilierten DNA-Methylierungsniveaus mit ChIP-Seq-Beweisen für gamma-H2A.X, Marker für die Reparatur von Doppelstrangbrüchen und die aktive Form von H2A.X, profiliert in CD4+ T-Zellen [35, 36] und fanden eine signifikant positive Korrelation mit Hinweisen auf DNA-Reparatur (Pearson 0,36 mit gamma-H2A.X, P Wert < 10 –100 , Zusatzdatei 1: Abbildung S21b). Wir fanden eine negative Korrelation der DNA-Methylierung mit H2A.X (Pearson −0.211, P Wert = 7.92e −59 ), was die Möglichkeit ausschließt, dass die Assoziation zwischen DNA-Methylierung und gamma-H2A.X auf den H2A.X-Hintergrundspiegel zurückzuführen ist (Zusatzdatei 1: Abbildung S21c). Diese Ergebnisse deuten darauf hin, dass die erhöhte DNA-Methylierung in den Tälern der Rekombinationsrate die Häufigkeit der DSB-Initiation verringern und die Rate der DSB-Reparatur erhöhen kann, was zu einer verringerten Rekombinationsrate beiträgt (zusätzliche Datei 1: Abbildung S19d).

Um die Variation der Rekombinationsrate aufgrund von DNA-Methylierungsstufen und regulatorischen Domänen, die durch genetische, physikalische und Aktivitätsverbindungen definiert sind, zu quantifizieren, haben wir ein Random-Forest-Regressionsmodell entwickelt, das DNA-Methylierung und regulatorische Verbindungen als Merkmale verwendet, um die Rekombinationsrate in einem Genom vorherzusagen Intervall. Das Modell beinhaltete Anpassungen für die unterschiedliche Rekombinationsrate verschiedener Chromosomen und bei unterschiedlichen genomischen Abständen (Zusatzdatei 2: Ergänzende Methoden 12 und 13).

Wir fanden heraus, dass sich die einzelnen Linktypen in der Vorhersagekraft stark unterscheiden, wobei meQTLs die stärkste Vorhersagekraft sowohl für Verbindungen mit mittlerer als auch für lange Reichweite aufweisen. Die Kombination aus Chromosomenzahl, physischer Distanz, regulatorischen Verknüpfungen und DNA-Methylierungsgrad führte zu einer hohen Übereinstimmung zwischen der vorhergesagten und der beobachteten Rekombinationsrate (Pearson-Korrelationskoeffizient 0,622, P Wert < 10 –100). Interessanterweise verwendete der genaueste Prädiktor eine Kombination aller vier Verbindungstypen und DNA-Methylierung (Abb. 5). Darüber hinaus könnte ein kombinierter Prädiktor, der Rekombinations-Hotspots und DNA-Methylierung gemeinsam verwendet, bis zu 92 % des beobachteten Rekombinationsratenunterschieds bei großer Entfernung und 80 % bei mittlerer Entfernung innerhalb jeder Art von funktioneller Verbindung rekapitulieren (Zusatzdatei 1: Abbildung S22).

Vorhersagen der Rekombinationsrate innerhalb zufälliger Intervalle. ein Vorhergesagte Rekombinationsrate vs. beobachtete Rekombinationsrate innerhalb zufälliger Intervalle (100 kb–1 Mb-Region, unter Verwendung von Chromosom, genomischer Distanz, überlappter Fraktion mit allen funktionellen Verknüpfungen und DNA-Methylierungsniveau). Die Lila Linie repräsentiert die angepasste lineare Beziehung zwischen den beiden Variablen. B Durchschnittlicher Pearson-Korrelationskoeffizient zwischen vorhergesagter Rekombinationsrate und beobachteter Rekombinationsrate in mittleren (10–100 kb) und langen (100 kb–1 Mb) Distanzregionen. C Durchschnittlicher mittlerer quadratischer Fehler zwischen vorhergesagter Rekombinationsrate und beobachteter Rekombinationsrate in Regionen mit mittlerer (10–100 kb) und langer (100–1 Mb) Distanz


Wirkung von Markerabstand und -orientierung auf die rekombinante Bildung in Pockenvirus-infizierten Zellen.

Über den Mechanismus der Pockenvirus-Rekombination ist wenig bekannt, obwohl die Konstruktion rekombinanter Viren durch rekombinationsabhängige Verfahren eine weit verbreitete Technik ist. Wir haben zuvor gezeigt, dass transfizierte DNAs effizient rekombiniert werden, während sie sich in Zellen replizieren, die mit Shope-Fibroma-Virus infiziert sind. Da rekombinante DNA aus infizierten Zellen als hochmolekulares Kopf-Schwanz-Konkatemer gewonnen werden kann, war es möglich, genetisch markierte Lambda-DNAs in infizierte Zellen zu transfizieren und Rekombinanten als Bakteriophagen-Partikel nach in vitro-Verpackung zu testen. Dieser Ansatz wurde in dieser Studie verwendet, um zu untersuchen, wie Markerabstand und Markerorientierung die Rekombination in Shope-Fibromavirus-infizierten Zellen beeinflussen. Einfache Zwei-Faktor-Kreuzungen wurden unter Verwendung einer aus klassischen Phagenstudien abgeleiteten Kartierungsfunktion leicht modelliert und zeigten eine geringe negative Interferenz (I = -2,8 ± 0,5) in Kreuzungen mit Markern mit einem Abstand von mehr als 100 bp. Komplexere Vier- und Fünf-Faktor-Kreuzungen zeigten, dass die Rekombinationsfrequenz pro Distanzeinheit nicht konstant war (ansteigend, wenn die Markertrennung von 100 auf 1 bp verringert wurde) und dass Kreuzungen, die in Pockenvirus-infizierten Zellen durchgeführt wurden, einer hohen negativen Interferenz unterliegen. Eine Folge davon ist, dass die Markerorientierung das Ergebnis der meisten Shope-Fibromavirus-katalysierten Kreuzungen nicht dramatisch beeinflusst, ganz im Gegensatz zu dem, was bei mit Adenovirus oder Simianvirus 40 infizierten Zellen beobachtet wird. Diese Ergebnisse können interpretiert werden, um anzuzeigen, dass ähnliche statistische und physikalische Beschränkungen sowohl die Virus- als auch die Phagenrekombination beeinflussen und legen nahe, dass Heteroduplexe wichtige Zwischenprodukte im Pockenvirus-Rekombinationsprozess sein können.


Danksagung

Wir bedauern, dass viele der einschlägigen Arbeiten aus Platzgründen nicht zitiert werden konnten. Wir danken R. Kanaar für die kritische Lektüre des Manuskripts und für seine wertvollen und ausführlichen Kommentare. Wir danken auch den drei anonymen Gutachtern für ihre konstruktive Kritik am Manuskript. This work was partially supported by the INSERM (Institut National de la Santé et de la Recherche Médicale), France, and the Erasmus University Medical Center, Rotterdam, The Netherlands.


Transformation of genetic recombination in bacteria

Defination of recombination :
Bacterial recombination is characterized by DNA Transfer from one organism called donor to another organism as recipient.

Genetic recombination process in Bacteria occurs in 3 main ways -
1) Transformation,
2) Conjugation,
3) Transduction.

Bacteria (Prokaryotes) do horizontaler Gentransfer at the time of recombination.
Gene transfer has 2 machanism
1) Horizontal gene transfer - in this machanism gene transfer between two unabhängig Organismen. Z.B. conjugation, transduction and transformation.
2) Vertical gene transfer - in this machanism gene transfers Elternteil zu Nachwuchs. Z.B. sexual reproduction by Binary Fission in Prokaryotes.

The fragment of DNA that is Transferred during horizontal gene transfer from donor to recipient is referred as Exogenote.
The recipient bacterial cell's own genetic material is called Endogenote.

A bacterial cell that has received an exogenote is initially deploid for part of its genome is called merozygote(partially diploid).

Recombination generally requires that the two DNA molecules be homolog (very similar/ not identical). If they are non homologous due to origin from different species than recombination is unlikely.

Exogenote are often degraded rapidly so that there is a race between degradation of exogenote and recombination.

Transformation :

Transformation is the process of uptake a naked DNA molecule or fragment from the medium by a cell and it's incorporation into chromosome of recipient.

Introduction :

Kompetenz -
- The ability of recipient bacterium to take up free DNA and become transformed is called competence. It is an inheritable characteristic.
- Competent bacteria that take up DNA from environment at high frequency encode proteins called competence factor.
- Competence factor facilitate binding of DNA fragment to cell surface and uptake of DNA in cytoplasm. z.B. competent bacteria produces competent proteinwhich binds to foreign DNA on cell surface and then uptake by cytoplasm.

Process of Transformation :

Transduction in bacteria

2). Once DNA comes in contact with competent bacteria, linear dsDNA converts to single stranded DNA and one strand is degraded.
3). Single stranded DNA (exogenote) is unstable and degraded unless they are integrated into endogenote by homologous recombination.

Genetic analysis of transformation :
- Transformation is used for gene mapping.
- Genetic analysis of Transfer together is they are near enough to be carried on same DNA fragment.
- Frequenz of transformation is inversely proportional to the distance between two genes.


Gene distance and Recombination Frequency: Mechanism - Biology

In his autobiography, Darwin mused with regret at his failure to learn more mathematics, observing that those with an understanding of the “great leading principles of mathematics” “seem to have an extra sense”. This extra sense is beautifully exemplified in a subject that was near to Darwin’s heart, namely, the origins of heredity, the study of which gave rise to modern genetics. Gregor Mendel was intrigued by the same question that has perplexed naturalists as well as parents for countless generations, namely, what are the rules governing the similarities and differences of parents and their offspring? His approach required the painstaking and meticulous act of counting frequencies of various traits such as pea shape from carefully constructed plant crosses, where he found that out of a total of 7,324 garden peas, 5,474 of them were round and 1,850 were wrinkled. The subsequent analysis of the data showed for this case a ratio of these traits in the second generation of crosses of 2.96 to 1, providing a critical clue permitting Mendel to posit the existence of the abstract particles of inheritance we now call genes.

Figure 1: Schematic of the first genetic map of the X chromosome of Drosophila redrawn with modern symbols. Sturtevant’s map included five genes on the X chromosome of Drosophila. Adapted from: http://www.nature.com/scitable/topicpage/thomas-hunt-morgan-genetic-recombination-and-gene-496. Locations updated from Green & Piergentili, PNAS 2000. Based on: Pierce, Benjamin. Genetics: A Conceptual Approach, 2nd ed. (New York: W. H. Freeman and Company), 161. From:

To cause a sea change in biological research required going beyond phenomenological observations to a situation where genetic manipulations could be more easily performed and more detailed predictions made. This came about when Morgan, head of a lab already overflowing with studies of pigeons and starfish, undertook with his students an object of study with minimal space requirements and faster generation times. So came to the scene one of the great protagonists of modern genetics, the fruit fly Drosophila Melanogaster. As Morgan’s lab transformed to what became known as the “fly room” (first at Columbia University, then at Caltech), it harbored flies with several distinct morphological properties akin to Mendel’s mottled and different colored peas. Systematic crosses of these mutant flies showed deviations from the predictions of Mendelian genetics on the relative fractions of different progeny. An inquisitive Columbia University undergraduate student in Morgan’s lab decided to analyze the frequencies of linkage, that is of pairs of co-inherited traits. During a long night that was supposed to be devoted to homework for his undergrad studies, the young Alfred Sturtevant instead made a conceptual leap that was to become textbook material and a cherished story from the history of science. He found that the tendency of the traits they studied to be inherited together such as white eyes instead of red eyes or a more yellow body color could be quantitatively explained if one assumes that the genes for these traits are ordered along a line (chromosome) and the tendency not to be inherited together is then reasonably predicted as increasing linearly with their distance. Using this logic, that night Sturtevant created the first genetic map reproduced in Figure 1.

Table 1: Recombination rates in various mammals and marsupials of similar genome sizes. Genetic map length is the sum of genetic map lengths summing in units of cM over all chromosomes in each genome. The right most column, recombination events per chromosome, is calculated by dividing the genetic map length (cM/100) by the number of chromosomes. Note how this genetic map length per chromosome is close to one over the range of organisms. (BNID 107023, adapted from Dumont BL, Payseur BA. Evolution of the genomic rate of recombination in mammals. Evolution. 62:276, 2008. Choromosme numbers are from: http://www.genomesize.com.)

The mechanism explaining the frequency with which characteristics are inherited together is that of recombination. This is an act of two chromosomes of similar composition coming together and performing a molecular crossover, thereby exchanging genetic content. Two genes on the chromosome that have a 1% chance of crossover per generation are defined to be at a distance of one centimorgan, or cM for short. In humans, the average rate of recombination is about 1cM per 1Mbp (BNID 107023), that is, for every million base pairs there is a one in a hundred chance of crossover on average per generation. The variation in the rate of recombination is shown in Table 1. It tends to scale inversely with genomic length. This interesting scaling property can be simply understood by noting that in most species there are one to two crossover events per chromosome per replication. This results in an organism-wide rule of thumb of one recombination event per chromosome as demonstrated in the right-most column of Table 1, or equivalently as 100 cM (i.e. one Morgan or one crossover) per chromosome per replication. Beyond general rules of thumb, we now also know that some locations along chromosomes are hotspots that are more labile for crossovers. Finally, human females have ≈50% higher recombination rates than males (42 versus 28 on average in one recent study, BNID 109268). So even though you tend to get more of your single base mutations from your father as discussed in the vignette on “How many chromosome replications occur per generation?”, your crossovers are mostly thanks to your mother.

Figure 2: Detection of recombination events based on sequencing of a single sperm cell. The two columns in each chromosome represent the two homologous chromosomes carried by the subject. The source of the sperm single chromosome copy can be traced to one or the other homologous chromosome based on single nucleotide polymorphisms that appear in one chromosome but not the other. Blue lines show the association of the sperm sequence to the two chromosome sets based on those single nucleotide polymorphisms. Each switch (haplotype block) indicates a recombination event. (Adapted from J. Wang, et al., Cell 150:402,2012.)

Recent breakthroughs in genotyping have made it possible to perform a single-cell analysis of recombination activity. Single nucleotide polymorphisms (SNPs) are locations in the human genome where there is variation between people such that say more than 1% of the population has a nucleotide different than the majority of the population. For the human population there are on the order of 10 6 such locations on the genome. Here is how this can be used to infer the number and location of recombination events. The chromosomes of a male were separated in a microfluidic device (arbitrarily marked as left and right for each of the 22 pairs) and then each chromosome was separately analyzed for the variant of nucleotide it carries by a microarray technology. The same process was repeated for a sperm cell leading to maps such as that shown in Figure 2. At the locations where it is known that there is polymorphism in the genome it was checked if the variant in the sperm cells is the one that appears in one chromosome but not the other, and if so its location was marked as a blue stripe on the relevant chromosome. The events of recombination are clearly seen as switches of those polymorphism locations from one arm to the other. On average, 23 recombination events were found for a human sperm cell (BNID 108035). Short stretches consisting of a single SNP switching chromosome, as highlighted in chromosome 8, are cases of what has been termed gene conversion where one allele (gene copy) has performed homologous recombination that makes it replace the other copy (its heterozygous allele). Such analysis at the single-cell level, in contrast to inference at the population level or from studying progeny in a family, makes it possible to see the rates of events such as recombination and mutation in the gametes including for those gametes that will not lead to viable progeny. This is relevant as the human monthly fecundity rate, that is the chance of a menstrual cycle leading to pregnancy, is only about 25% (BNID 108080) even at the peak ages of 20-30. Aberrations in the genome content are often detected naturally early in development, within the first few weeks following conception, and lead to natural termination of the pregnancy even before the woman is aware she is pregnant.

Today recombination also serves researchers as a key tool in genetic engineering for creating designer genomes. Homologous recombination enables incorporation of a DNA sequence at a prescribed location within the genome. Its use has transformed our ability to tag genes of interest and resulted in genome-wide libraries enabling high-throughput analysis of key cellular properties ranging from localization of proteins to different cellular locations to genome-wide assessments of protein levels and variability. Though recombineering, as it is called, is incredibly powerful, unfortunately it can only be used in some organisms and not others, giving those lucky organisms a strong selective pressure in labs around the world as attractive model systems. Outstanding examples are the budding yeast and the moss physcomitrella patens. The method of homologous recombination requires a sequence of homology flanking the integrated sequence. The length of this sequence varies depending on the organism, the gene of interest and the specific technique and protocol employed. Some characteristic values are ≈30-50 bp in budding yeast (BNID 101986) whereas in mouse it is ≈3-5 kbp (BNID 101987). With the longer stretches also comes a much lower efficiency of performing the act of homologous recombination complicating the lives of molecular biologists, though modern CRISPR techniques have effected a new revolution in genome editing that may largely supersede recombineering methods.


Notes on the Process and Mechanism of Crossing Over

Janssens (1909) was the first person to discover chiasma formation and related process of crossing over (Chiasma type hypothesis). Morgan (1910) found the phenomena of linkage and recombination.

Image Courtesy : online.santarosa.edu/homepage/cgalt/BIO10-Stuff/Ch09-Genetics/Crossing-Over.jpg

The recombination or new combination of genes is possible only due to exchange of genetic material between homologous chromosomes (Breakage and Reunion Theory, Darlington 1937). Linkage is incomplete in such cases.

Definition:

(i) Crossing over is a recombination of genes due to exchange of genetic material between two homologous chromosomes,

(ii) It is the mutual exchange of segments of genetic material between non-sister chromatids of two homologous chromosomes, so as to produce re-combinations or new combinations of genes.

The non-sister chromatids in which exchange of segments have occurred are called recombinants or cross-overs while the other chromatids in which crossing over has not taken place are known as parental chromatids or non cross-overs.

C.B. Hutchinson (1922) crossed a pure breeding coloured and smooth grained (CS/CS) Maize variety with pure breeding colourless and shrunken grained (cs/cs) Maize variety. Plants of F1 generation possessed coloured and smooth grains showing that both the expressions are dominant. F1 plants were obviously heterozygous for the two traits (CS/cs). F1 plants were then test crossed with double recessive parents (cs/cs). It resulted in four types of offspring in the ratio of 27: 1 : 1 : 27 instead of 1 : 1 : 1 : 1 ratio expected for independent assortment (Table 5.3).

Table 5.3. Test cross between heterozygous coloured and smooth grained (CS/cs) Maize plants with double recessive parents having colourless and shrunken grains (cs/cs):

The above ratio is possible when the genes of the two traits do not show independent assortment. Apparently the two genes are linked in the same chromosome but 1.8% non-sister chromatids of the homologous chromosomes show crossing over in between the two genes by exchanging segments.

Recombination and Crossing Over:

A new grouping of genes or a new combination of characters which is different from the parental types is called recombination or recombinant type. It is produced due to crossing over that occurs during meiosis prior to gamete formation. The frequency of recombination is directly related to the frequency of crossing over.

However, sometimes two or even more crossing overs may occur simultaneously in the same non sister chromatids of the homologous chromosomes without altering the frequency of re-combinations. Therefore, frequency of crossing over may be higher than the frequency of observed re-combinations. The frequency of recombination (cross over value, COV) is calculated using the formula

This COV of 10.7% between genes of red eye and normal wings means that these genes are located 10.7 units apart on the same chromosome.

Parental and Recombinant Types:

An individual contains two homologous chromosomes of each type. The two chromo­somes are obtained from the two different parents, father and mother. Therefore, these chromosomes are also called paternal and maternal chromosomes. Suppose these two chro­mosomes possess two linked genes, AB (dominant) in one and ab (recessive) in the other. Each chromosome further possesses two chromatids of similar type (AB, AB ab, ab).

If there is no crossing over at the time of gamete formation or meiosis, only two types of gametes are produced, one carrying the paternal (AB) and other maternal (ab) linkage. In case crossing over occurs at one place, one chromatid of each homologous chromosome gets involved in the exchange of segment while the other chromatid remains unaltered.

Thus four types of chromatids will be produced after one crossing over— AB, Ab, aB, ab. Two of them are parental (AB, ab) and two recombinant (Ab, aB). After meiosis the four types of chromatids segregate and pass on to four different gametes, 2 parental and 2 recombinant (Fig. 5.20).

In case the distance between two linked genes is such that one cross occurs regularly between them at each meiosis, they will produce two parental and two recombinant types in the ratio of 25%: 25%: 25%: 25%. This is similar to independent assortment. Mendel was lucky that three of the seven traits used by him in his famous experiments exhibited regular crossing over.

Therefore, independent assortment can occur in two circumstances,

(a) Genes occur in different non-homologous chromosomes,

(b) Genes lying in the same chromosome but showing regular crossing over (50% recombinants or cross-overs).

Factors Influencing Crossing Over (and Linkage):

The physical distance between two genes determines both the strength of the linkage and the frequency of the crossing over between two genes. The strength of the linkage increases with the closeness of the two genes. On the other hand the frequency of crossing over increases with the increase in the physical distance between the two genes.

Increase in age decreases the degree of crossing over in most of the cases.

Male Drosophila shows little crossing over. The phenomenon of crossing over is quite common in the female fly. Negligible crossing over is also reported in one sex of some other heterogametic organisms.

Exposure to X-rays increases the incidence of crossing over. Whittinghill produced a number of cross-overs in male Drosophila with the help of X-rays.

Variations in temperature increase the frequency of crossing over.

Presence of centromere and heterochromatic areas (e.g., near telomere) decrease the rate of crossing over.

A number of chemicals present in the food have been found to change the degree of crossing over in animals.

One cross-over reduces the occurrence of another crossing over in its vicinity. The phenomenon is called interference. Coincidence is the ratio of observed double cross over in relation to expected double cross-over on the basis of non-interference or independent occurrence. Coincidence is small when interference is high.

Bedeutung:

1. Crossing over is a means of introducing new combinations of genes and hence traits.

2. It increases variability which is useful for natural selection under changed environment.

3. Since the frequency of crossing over depends upon the distance between the two genes, the phenomenon is used for preparing linkage chromosome maps.

4. It has proved that genes lie in a linear fashion in the chromosome.

5. Breeders have to select small or large population for obtaining the required cross­overs. For obtaining cross-overs between closely linked genes, a very large population is required.

6. Useful re-combinations produced by crossing over are picked up by breeders to develop useful new varieties of crop plants and animals. Green revolution has been achieved in India due to this selective picking up of useful re-combinations. Operation flood or white revolution is also being carried out on the similar lines.

Types of Crossing Over:

Crossing over can be single, double or multiple,

(i) Single Crossing Over:

Crossing over occurs at one point between two non-sister chromatids of a homologous chromosome pair. There are two parental types and two recombinants,

(ii) Double Crossing Over:

Crossing over occurs at two points in a homologous pair of chromosomes,

(a) Reciprocal Double Crossing Over:

Two points of crossing over occur between the same non-sister chromatids,

(b) Complementary Crossing Over:

The two crossing overs involve three or all the four chromatids so that the number of cross overs is three or four with occurrence
of one or no parental type,

(iii) Multiple Crossing Over:

Three or more points of crossing over occur in the same homologous chromosome. Double cross-overs and parental types may or may not occur.

Mechanism of Crossing Over:

Chromosomes get replicated in S-phase of interphase. Therefore, leptotene chromo­somes are double stranded though the two strands are not visible due to presence of nucleoprotein complex in between the chromatids.

(i) Synapsis:

Replicated but apparently single homologous chromosomes come to lie side by side with similar gene loci of the two chromosomes exactly opposite. It occurs in the zygotene stage of prophase I. The phe­nomenon is called synapsis. The synapsed pairs of homologous chromosomes are called bivalents. The small amount of unreplicated chromosome (0.3%), if present, also under­goes replication (Stem and Hotta, 1973). The two homologous chromosomes are held to­gether by a synaptinemal complex.

(ii) Crossing Over:

It occurs in the pachytene stage, at four strand stage with the help of enzymes (endonuclease, exo-nuclease, R-protein or recombinase Stern and Hotta, 1969, 1978). There is breakage of chromatid segments, exchange of nonsister chromatid segments and later their fusion in new places.

(iii) Tetrad Stage:

Synaptinemal complex begins to dissolve except in the region of crossing over. Therefore, chromosomes separate and chromatids become distinct at most of the places. As a bivalent appears to have four chromatids now, it is called tetrad stage. It occurs in the diplotene stage of prophase I. The synaptinemal attachment points between the homologous chromosomes are called chiasmata. In later stages the chiasmata tend to shift to the sides. The phenomenon is called terminalisation. Many of them disappear prior to metaphase I.


Using Cross Over Frequencies to Map Genes

Alfred H. Sturtevant hypothesized that the frequency at which linked genes become unlinked (recombination frequencies calculated from experiments similar to the one in this figure) could be used to determine the distances between genes on a chromosome. He predicted that the farther apart two genes were on a particular chromosome, the higher the probability that crossing over would occur between them, and subsequently, a higher recombination frequency would be observed.


Abbildung. Calculating Recombination Frequencies. (zum Vergrößern auf das Bild klicken)

By considering a chromosome a linear sequence of genes, Sturtevant assigned each gene he was studying in fruit fly crosses a position on the chromosome using recombination frequencies. This figure illustrates one of Sturtevant's genetic maps, where three genes that are linked to each other (body color (b), wing size (vg) and an eye color gene called cinnabar (cn)) are positioned based on recombination frequencies observed in test crosses. This type of genetic map is called a linkage map because it portrays the sequence of genes along a chromosome, but it does not give the precise location of the genes. To determine the distance between two genes, Sturtevant divided the number of gametes with recombinant chromosomes by the total number of gametes observed. In the figure above, the recombination frequency between cn and b is 9%, and the recombination frequency between cn and vg is 9.5%. Therefore, crossovers between cn and b, and between cn and vg, are about half as frequent as crossovers between b and vg (17%). A map that places cn between b and vg (approximately half-way) is consistent with these observations. Sturtevant expressed the distance between genes in map units. By definition, one map unit (1 m.u.) is equivalent to a 1% recombination frequency. In honor of Morgan, one map unit, or a 1% frequency, is also called one centimorgan (cM).


Abbildung. (zum Vergrößern auf das Bild klicken)

Thus, using crossover data, Sturtevant and his coworkers mapped other Drosophila genes in linear arrays at particular genetic locations. This figure depicts an abbreviated genetic map of chromosome II in Drosophila.

As with many rules, there are exceptions. If genes on the same chromosome are far apart, crossovers between them can occur frequently and these genes can have a maximum recombination frequency of 50%. These genes would appear to assort independently and may mistakenly be thought to exist on different chromosomes because they are so far apart on their chromosome that linkage is not observed in genetic crosses. These genes are mapped by adding the recombination frequencies from crosses involving intermediate genes, and by determining the approximate distance of each gene from the intermediates.


Abbildung. Genetic Map of Chromosome II in Drosophila. (zum Vergrößern auf das Bild klicken)


Schau das Video: GenkopplungKopplungsbruch Drosophila - Biologie, Genetik, Oberstufe (August 2022).