Information

Fixationsrate am neutralen Ort

Fixationsrate am neutralen Ort



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Es ist ein klassisches Ergebnis, dass die erwartete Zeit, bis eine neutrale Mutation auftritt und behoben wird, $2 N mu frac{1}{2N} = mu$ beträgt, wobei $N$ die Populationsgröße und $mu$ ist die neutrale Mutationsrate (wiki).

Ich bin mir nicht sicher, ob ich verstehe, was das eigentlich bedeutet. Wie groß ist die Wahrscheinlichkeit, dass (mindestens) ein Fixationsereignis in $frac{1}{mu}$-Generationen auftritt? Ist es 0,5? Könnten wir die Wahrscheinlichkeit berechnen, dass (mindestens) ein Fixationsereignis in $n$ Generationen auftritt? Ist zum Beispiel nach $n=frac{mu}{10}$ die Wahrscheinlichkeit, (mindestens) ein Fixationsereignis zu beobachten, gleich $0.1$ oder ist es komplizierter?

AKTUALISIEREN

Folgt den Kommentaren von @DanielWeissman:

Nehmen wir an, wir beginnen mit einer anfänglich monomorphen Population (Population von Klonen). Außerdem nehmen wir an, dass die Population relativ klein ist $Nmu < 1$


Zunächst einmal ist $mu$ nicht die erwartete Zeit, in der eine Mutation auftritt und behoben wird; es ist die Rate, mit der Mutationen in der Population fixiert werden. Das grundlegende Ergebnis besagt, dass, wenn neutrale Mutationen an einem Locus mit einer Rate von $mu$ . auftreten, innerhalb von Individuen, Mutationen an diesem Locus werden behoben in der Bevölkerung auch zum Preis $mu$.

Die erwartete Zeit, die eine gegebene neutrale Mutation nach ihrer Entstehung repariert, vorausgesetzt, dass sie nicht von der Population verloren geht, beträgt ungefähr $4N_e$, wobei $N_e$ die effektive Populationsgröße ist. Kimura und Ohta (1969) leiten dieses Ergebnis mit Hilfe einer Diffusionsnäherung ab; Kingman (1982) entwickelt die Koaleszenztheorie und erhält dabei eine meiner Meinung nach elegantere Ableitung derselben Näherung.

Wie groß ist nun die Wahrscheinlichkeit, dass etwas Mutation als Funktion der Zeit zur Fixierung in der Population führt? Auch wenn die Fixationsrate in der Population $mu$ beträgt, bedeutet dies nicht, dass einige Mutationen mit einer Wahrscheinlichkeit von 0,5 innerhalb von $1/mu$ Zeiteinheiten fixiert werden. Diese Wahrscheinlichkeit hängt von der Verteilung der Fixationsereignisse in der Population ab. Hier ist eine gute Möglichkeit, darüber nachzudenken. Wenn Fixationsereignisse gleichmäßig verteilt wären und mit einer Rate von $mu$ auftraten, dann hättest du mit Wahrscheinlichkeit 1 eine Mutation innerhalb eines Intervalls der Länge $1/mu$. Wenn Fixationsereignisse stark verklumpt wären, hätten Sie eine sehr geringe Wahrscheinlichkeit, ein Fixationsereignis innerhalb eines Intervalls der Länge $1/mu$ zu haben - aber wenn Sie ein Ereignis hätten, würden Sie wahrscheinlich viele haben. Wenn Fixationsereignisse als Poisson-Prozess verteilt werden – was ich in einem rein neutralen Modell vermute – wäre die Wahrscheinlichkeit eines Fixationsereignisses innerhalb eines Zeitintervalls $1/mu$ durch eine (negative) Exponentialverteilung gegeben und somit wäre die Wahrscheinlichkeit, mindestens ein Fixationsereignis in einem Zeitintervall der Länge $1/mu$ zu haben, $1-frac{1}{e}$.


Fixierungsstrategien und Formulierungen für die IHC-Färbung

Die Fixierung spielt in der Immunhistochemie vier entscheidende Rollen:

  • Es konserviert und stabilisiert Zellmorphologie und Gewebearchitektur
  • Es inaktiviert proteolytische Enzyme, die sonst die Probe abbauen könnten
  • Es stärkt Proben, damit sie einer weiteren Verarbeitung und Färbung standhalten
  • Es schützt Proben gegen mikrobielle Kontamination und mögliche Zersetzung.

Die richtige Fixierungsmethode erfordert eine Optimierung basierend auf der Anwendung und dem anzufärbenden Zielantigen. Dies bedeutet, dass die optimale Fixierungsmethode möglicherweise empirisch bestimmt werden muss. Zu den gängigen Befestigungsmethoden gehören:

  • Durchblutung: Gewebe kann nach Ausbluten und Perfusion mit Kochsalzlösung mit Fixiermittel perfundiert werden, um eine schnelle Fixierung ganzer Organe zu ermöglichen.
  • Eintauchen: Die Proben werden in Fixiermittel getaucht, das dann in und durch die Gewebe- oder Zellprobe diffundiert. Immersion wird oft mit Perfusion kombiniert, um eine gründliche Fixierung im gesamten Gewebe zu gewährleisten.
  • Einfrieren: Proben mit Antigenen, die für eine chemische Fixierung oder Exposition gegenüber den zur Entparaffinierung verwendeten organischen Lösungsmitteln zu labil sind, können in ein kryoprotektives Einbettungsmedium, z .
  • Trocknen: Blutausstriche für die ICC-Färbung werden luftgetrocknet und über eine Flamme geschwenkt, um die Zellen auf dem Objektträger durch Hitze zu fixieren.

Während ein bestimmtes Fixiermittel die Immunreaktivität eines antigenen Epitops konservieren kann, kann es andere zerstören, selbst wenn sie sich auf demselben Antigen befinden. Die hier bereitgestellten Richtlinien sind hilfreich bei der Bestimmung des geeigneten Fixiermittels für ein bestimmtes System, aber es ist wichtig, sich daran zu erinnern, dass jedes Antigen einzigartig ist. Daher sollten bei der Auswahl eines Fixativs folgende Überlegungen berücksichtigt werden:

  • Art des Fixiermittels (Formaldehyd, Glutaraldehyd, organisches Lösungsmittel usw.)
  • Penetrations- und Fixierungsrate
  • Fixiermittelkonzentration
  • Fixiermittel pH
  • Ideale Fixiertemperatur
  • Behandlung nach der Fixierung

Mehr erfahren

Mehr erfahren

Chemische Fixiermittel vernetzen oder präzipitieren Probenproteine, die Zielantigene maskieren oder die Zugänglichkeit von Antikörpern zum Gewebeziel nach längerer Fixierung verhindern können. Kein einzelnes Fixiermittel ist ideal für alle Gewebe, Proben oder Antigene. Dies bedeutet, dass jedes Fixierverfahren optimiert werden muss, um eine angemessene Fixierung sicherzustellen, ohne das Antigen zu verändern oder die endogene Lokalisation und die zellulären Details des Gewebes zu stören.

Physische Fixierung ist ein alternativer Ansatz, um Proben für die Färbung vorzubereiten, und die spezifische Methode hängt von der Probenquelle und der Stabilität des Zielantigens ab. Zum Beispiel werden Blutausstriche normalerweise durch Trocknen fixiert, wodurch die Flüssigkeit aus der Probe entfernt und die Zellen auf dem Objektträger fixiert werden. Gewebe, das für die rigorose Verarbeitung, die mit der Paraffinentfernung und Antigengewinnung verbunden ist, zu empfindlich ist, wird zuerst in ein kryoprotektives Einbettungsmedium, wie z. Das folgende Beispiel liefert ein Beispiel für die IHC-Färbung in formalinfixiertem Gewebe.

Die IHC wurde an einem formalinfixierten, in Paraffin eingebetteten (FFPE) menschlichen Dickdarmkrebsgewebeschnitt durchgeführt. Um Zielproteine ​​zu exponieren, wurde eine hitzeinduzierte Epitop-Wiedergewinnung (HIER) unter Verwendung von 10 mM Natriumcitratpuffer, pH 6, (z. B. 00-5000, AP-9003-125) für 20 Minuten durch Erhitzen auf 95 °C durchgeführt. Nach der Antigengewinnung, dem Abkühlen auf Raumtemperatur und dem Waschen wurden die Gewebe in 3% BSA (Produkt Nr. 37525) in PBST für 30 Minuten bei Raumtemperatur blockiert und dann mit einem monoklonalen Ezrin-Antikörper (Produkt Nr. MA5-13862) in einer Verdünnung von . sondiert 1:100 für 1 h in einer befeuchteten Kammer. Die Gewebe wurden ausgiebig mit PBS/0,025% Tween-20 (Produkt Nr. 003005) gewaschen und die endogene Peroxidaseaktivität wurde mit Peroxidasesuppressor (Produkt Nr. 35000) 30 Minuten lang bei Raumtemperatur gelöscht. Der Nachweis wurde unter Verwendung eines HRP-konjugierten Ziege-Anti-Maus-IgG-HRP-Sekundärantikörpers (Produkt-Nr. 31430) in einer Verdünnung von 1:500 durchgeführt, gefolgt von einem kolorimetrischen Nachweis unter Verwendung des Metal Enhanced DAB Substrate Kit (Produkt-Nr. 34065). Die Bilder wurden mit einem Lichtmikroskop bei 40-facher Vergrößerung aufgenommen.

Formaldehyd

Das am häufigsten verwendete chemische Fixiermittel ist Formaldehyd, das eine breite Spezifität für die meisten zellulären Ziele aufweist. Das wasserlösliche, farblose, giftige und stechende Gas reagiert mit primären Aminen an Proteinen und Nukleinsäuren unter Bildung von teilreversiblen Methylenbrückenvernetzungen

Formaldehyd und Paraformaldehyd

Der meiste kommerzielle Formaldehyd wird aus Paraformaldehyd (PFA, polymerer Formaldehyd) hergestellt, der in destilliertem/deionisiertem Wasser gelöst ist, wobei bis zu 10 % (Vol./Vol.) Methanol zugegeben werden, um das wässrige Formaldehyd zu stabilisieren. Die Stabilisierung ist wichtig, um die Oxidation des Formaldehyds zu Ameisensäure und seine eventuelle Repolymerisation zu Paraformaldehyd zu verhindern. Um die Verwendung von methanolstabilisiertem Formaldehyd zur Fixierung zu vermeiden, empfehlen viele Protokolle, unmittelbar vor der Probenfixierung „frisches“ Formaldehyd aus Paraformaldehyd herzustellen.

Formalin vs. Formaldehyd

Die Begriffe „Formalin“ und „Formaldehyd“ werden oft synonym verwendet, obwohl die chemische Zusammensetzung jedes Fixiermittels unterschiedlich ist. Formalin wird mit Formaldehyd hergestellt, aber der Prozentsatz bezeichnet eine andere Formaldehydkonzentration als echte Formaldehydlösungen. Zum Beispiel ist 10% neutral gepuffertes Formalin (NBF oder einfach Formalin) in Wirklichkeit eine 4% (v/v) Formaldehydlösung. Die Grundlage für diesen Unterschied ist, dass Formalin in der Vergangenheit mit handelsüblichem Stammformaldehyd, der 37 bis 40 % (w/v) Formaldehyd enthielt, hergestellt wurde, indem es 1:10 mit Phosphatpuffer bei neutralem pH-Wert . verdünnt wurde

Mehr erfahren

Mehr erfahren

Glutaraldehyd

Glutaraldehyd ist eine Dialdehydverbindung, die mit Amino- und Sulfhydrylgruppen und möglicherweise mit aromatischen Ringstrukturen reagiert. Fixative, die Glutaraldehyd enthalten, sind stärkere Proteinvernetzer als Formaldehyd. Sie dringen jedoch langsamer in das Gewebe ein, wodurch lösliche Antigene extrahiert und die Gewebearchitektur modifiziert wird. Gewebe, die mit einem Fixiermittel auf Glutaraldehyd-Basis fixiert wurden, müssen vor der IHC-Färbung mit inerten aminhaltigen Molekülen behandelt oder abgeschreckt werden, da alle verfügbaren freien, ungesättigten Aldehydgruppen kovalent mit aminhaltigen Einheiten wie Antikörpern reagieren (Schiff Basenbildung). Die wirksamsten Aldehydblocker/Quencher sind Ethanolamin und Lysin.

Andere Fixative

Fixiermittel auf Quecksilberchloridbasis werden manchmal als Alternativen zu Fixiermitteln auf Aldehydbasis verwendet, um eine schlechte zytologische Konservierung zu überwinden. Diese scharfen Fixiermittel wirken, indem sie mit Aminen, Amiden, Aminosäuren wie Cystein und Phosphatgruppen in Proteinen und Nukleinsäuren reagieren. Die Folge ist eine Protein- und Nukleinsäure-Koagulation, die zu einer unerwünschten Gewebeverhärtung führen kann. Die Vorteile der Verwendung dieser Fixative sind eine intensivere IHC-Färbung, begleitet von der Erhaltung zytologischer Details, die eine einfachere morphologische Interpretation ermöglichen. Diese Fixiermittel enthalten oft neutrale Salze, die Zink enthalten, um die Tonizität zu erhalten, und sie können mit anderen Fixiermitteln gemischt werden, um eine ausgewogene, weniger aggressive Formulierung bereitzustellen. Fixiermittel auf Quecksilberchlorid-Basis umfassen Helly und Zenker's Solution. Ein Nachteil von quecksilberhaltigen Fixiermitteln besteht darin, dass Schnitte vor der IHC-Färbung von Quecksilberablagerungen befreit werden müssen. Der Hauptnachteil dieser Fixiermittel auf Quecksilberbasis besteht darin, dass sie hochgiftig und korrosiv sind und spezielle Entsorgungsverfahren erfordern. Aus diesem Grund werden sie nicht mehr häufig verwendet.

Ausfällende Fixative umfassen Ethanol, Methanol und Aceton. Diese Lösungsmittel fällen und koagulieren große Proteinmoleküle, wodurch sie denaturiert werden und können gut für die zytologische Konservierung sein. Solche Reagenzien können auch Zellen permeabilisieren, was je nach Probe kritisch sein kann. Insbesondere Aceton extrahiert jedoch Lipide aus Zellen und Geweben, was die Morphologie nachteilig beeinflussen kann. Trotzdem wird Aceton meist als Postfixativ für bereits auf Objektträger gebundene Gefrierschnitte verwendet. Im Gegensatz dazu sind die Lösungsmittelfixative für die Elektronenmikroskopie nicht geeignet, da sie eine starke Gewebeschrumpfung verursachen können.

Diimidoesterfixierung die Verwendung von Dimethylsuberimidat (DMS), einem aminreaktiven Vernetzer, ist eine selten verwendete Alternative zur Fixierung auf Aldehydbasis (Hassel, J. et al., 1974). DMS ist ein homobifunktionelles Reagens, das die α- und ε-Aminogruppen von Proteinen miteinander vernetzt. Diimidoester sind insofern einzigartig, als sie Amidinbindungen mit den Aminen auf den Zielmolekülen herstellen. Als Ergebnis ändert DMS die Nettoladung des Proteins nicht. Die Vorteile der Verwendung von DMS als Fixiermittel sowohl für die Licht- als auch für die Elektronenmikroskopie umfassen die Beibehaltung der Immunreaktivität des Antigens und das Fehlen von Aldehydgruppen, die eine Blockierung erfordern.

Es gibt eine Vielzahl weiterer Fixative, die in besonderen Situationen verwendet werden. Dazu gehören Acrolein und Glyoxal, die dem Formaldehyd ähnlich sind, und Osmiumtetroxid, das sich besonders gut als Fixiermittel vor der Elektronenmikroskopie eignet. Andere spezielle Fixiermittel umfassen Carbodiimid und andere Proteinvernetzer, Zinksalzlösungen, Pikrinsäure, Kaliumdichromat und Essigsäure.


Neutrale Theorie und Substitutionsraten

-
Es scheint einige Verwirrung darüber zu geben, was die neutrale Theorie sagt über Substitutionsraten. NickM scheint zu denken dass bei einer Mutationsrate von 1,1x10^-8 bei jeder Geburt 40 (neutrale) Mutationen auftreten und 40 in jeder Generation fixiert werden, weil Substitutionsrate = Mutationsrate.

NickM gibt eine Wikipedia-Referenz für eine Mutationsrate von 1,1 x 10^-8 an.

Wie auch immer – eine andere Sache, die Sie offensichtlich überhaupt nicht verstehen, ist, dass selbst unter völlig neutralen Bedingungen, ohne dass überhaupt eine natürliche Selektion stattfindet und nur genetische Drift stattfindet, *die Substitutionsrate der Mutationsrate entspricht*.

Wenn die Genomgröße 3,2 Milliarden Basen beträgt, wenn die Mensch-Schimpansen-Divergenzzeit 6 my beträgt und wenn die Generationsgröße 15 Jahre beträgt, erfordert eine 1%ige Divergenz bei Punktmutationen 32 Millionen Mutationen. Das sind 40 Mutationen/Generation.

Was NickM nicht zu erkennen scheint, ist die Substitutionsrate = 1,1 x 10^-8, nicht 40 Mutationen/Generation. Die 40 ist die Anzahl von Mutationen, die wir bei jeder Geburt bei einem Genom von 3,2 bp erwarten können.

Die neutrale Theorie bezieht sich nur auf die Mutationsrate, nicht auf die Anzahl der Mutationen. Was ist Ihr Abschluss?

Wenn man Nick sieht, muss jedes Mitglied der Bevölkerung es wagen. Jedes Mitglied, Biologie 101. Nun, ich denke, wenn die Populationsgröße eins ist.

60 Kommentare:

"Du siehst Nick, um in Ordnung zu sein, muss jedes Mitglied der Bevölkerung es riskieren"

". feste Effekte (Mutationen, die dem Driftverlust entkommen)"

Aber zitieren Sie gerne Unterstützung für Ihre Behauptung.

Du bist ein ignoranter Fick, Richie:

In der Populationsgenetik ist die Fixierung die Veränderung eines Genpools von einer Situation, in der mindestens zwei Varianten eines bestimmten Gens (Allels) existieren, zu einer Situation, in der nur eines der Allele übrigbleibt.

Die Fixationswahrscheinlichkeit, die Wahrscheinlichkeit, dass die Häufigkeit eines bestimmten Allels in einer Population letztendlich eins wird, ist einer der Eckpfeiler der Populationsgenetik.

Wow, noch mehr Blödsinn. In der neutralen Theorie geht es um viele Dinge, aber eines der wichtigsten Themen ist die Substitutionsrate und wie sie mit der Mutationsrate zusammenhängt.

Wenn, sagen wir, 40 Mutationen pro Individuum und Generation auftreten (was ungefähr das ist, was Sie erhalten, wenn Sie Mutationen-pro-Site-pro-Generation mal Genomlänge in Sites nehmen), geschieht dies bei *jedem Individuum in der Population*.

Daher kommt es in jeder Generation *in der Bevölkerung* zu einer großen Anzahl von Mutationen. Bei einer effektiven Populationsgröße von 10.000 wären dies 40 x 10.000 = 400.000 neue Mutationen, die der Population jede Generation hinzugefügt werden.

In einer neutralen Situation geht die überwiegende Mehrheit dieser neuen Mutationen schließlich durch Neutraldrift aus der Population verloren.

Aber zufällig werden einige von ihnen zur Fixierung übergehen. Die Gewinnchancen sind im Wesentlichen die gleichen wie die Gewinnchancen im Lotto. Die Wahrscheinlichkeit, dass sich jede Mutation zur Fixierung ausbreitet, beträgt 1/(Populationsgröße). (Ich verwende die Populationsgröße der haploiden Loci, wenn Sie die diploide Population als N verwenden, ist es 2N).

Die meisten neutralen Mutationen sterben also aus, aber einige verbreiten sich zur Fixierung. Im Durchschnitt ergibt sich, dass die Substitutionsrate gleich der Mutationsrate ist.

Es kann also eine große Anzahl von Auswechslungen passieren, ohne dass überhaupt eine Auswahl stattfindet.

Oder kürzere Version:
http://www.stat.berkeley.edu/users/terry/Classes/s260.1998/Week13a/week13a/node10.html

Wenn, sagen wir, 40 Mutationen pro Individuum und Generation auftreten (was ungefähr das ist, was Sie erhalten, wenn Sie Mutationen-pro-Site-pro-Generation mal Genomlänge in Sites nehmen), geschieht dies bei *jedem Individuum in der Population*.

ja, aber nicht die gleichen 40 Mutationen. Damit diese 40 Mutationen behoben werden können, müsste jedes Individuum, sogar die Eltern und Großeltern, sie haben.

Das ist die Bedeutung von fixiert sein – EINHEIT – was bedeutet, dass alle sie haben müssen.

Daher kommt es in jeder Generation *in der Bevölkerung* zu einer großen Anzahl von Mutationen. Bei einer effektiven Populationsgröße von 10.000 wären dies 40 x 10.000 = 400.000 neue Mutationen, die der Population jede Generation hinzugefügt werden.

Ja, aber um repariert zu werden, muss jeder Einzelne es haben.

Aber zufällig werden einige von ihnen zur Fixierung übergehen.

vielleicht und vielleicht nicht. Die Frage ist, wie lange wird es dauern und wie viele werden behoben?

Die Wahrscheinlichkeit, dass sich jede Mutation zur Fixierung ausbreitet, beträgt 1/(Populationsgröße). (Ich verwende die Populationsgröße der haploiden Loci, wenn Sie die diploide Population als N verwenden, ist es 2N).

Nicht für neutrale Mutationen. Dann ist es die Mutationsrate.

Auch wenn es eine Chance von 1/N hat, behoben zu werden, bedeutet dies, dass es eine (N - 1/N) Chance hat, verloren zu gehen. Und das berücksichtigt nicht einmal zufällige Effekte, die alle Mutationen auslöschen würden.

Es kann also eine große Anzahl von Auswechslungen passieren, ohne dass überhaupt eine Auswahl stattfindet.

Wie viele und wie lange dauert es?

Bei einer Mutationsrate von 1,1 x 10^-8 sagt das eine ziemlich lange, lange Zeit.

OK NickM- Lookie, was ich gefunden habe:

Für neutrale Allele, die fixieren, dauert es durchschnittlich 4N Generationen, um dies zu tun.

Was ist also nochmal das Problem, JoeG? Keiner der Links, die Sie gerade gepostet haben, widersprach meinen Aussagen.

Sie behaupteten, es sei nicht genug Zeit, um den beobachteten Unterschied zwischen dem Schimpansen- und dem menschlichen Genom zu ermitteln.

Zuerst habe ich darauf hingewiesen, dass die Differenz von "10%" davon herrührt, dass Dinge wie Indels einbezogen werden, die eher in großen Blöcken als in Punktmutationen vorkommen. Diese erforderten nur eine Indel-Ersetzung alle

15 Generationen, keine unmögliche Zahl.

Dann wandten wir uns den Punktmutationen (der 1%-Differenz) zu, und ich wies darauf hin, dass der beobachtete Substitutionsunterschied zwischen Schimpanse und Mensch ungefähr dem entspricht, was wir angesichts der Zeit der Schimpansen-Mensch-Spaltung und der beobachteten Mutationsrate erwarten sollten. Nichts, was Sie seitdem gepostet haben, hat dem widersprochen.

Geben Sie einfach zu, dass Ihre ursprüngliche Behauptung falsch war. Das ist der wissenschaftliche Weg.

Oder lesen Sie S.239 hier: http://books.google.com/books?id=ng85sd1UR7EC&lpg=PA72&ots=pqL73i-4iH&dq=4N%20generations&pg=PA239#v=onepage&q=substitution%20rate&f=false

NickM:
Was ist also nochmal das Problem, JoeG? Keiner der Links, die Sie gerade gepostet haben, widersprach meinen Aussagen.

Sie sagten, dass es eine Reihe von Mutationen geben würde, die in einer/jeder Generation fixiert werden. Das ist offensichtlich falsch

Sie behaupteten, es sei nicht genug Zeit, um den beobachteten Unterschied zwischen dem Schimpansen- und dem menschlichen Genom zu ermitteln.

Es gibt, wenn Sie sich auf Design verlassen. Es gibt nicht, wenn Sie sich auf etwas anderes verlassen.

Zuerst habe ich darauf hingewiesen, dass die Differenz von "10%" davon herrührt, dass Dinge wie Indels einbezogen werden, die eher in großen Blöcken als in Punktmutationen vorkommen.

Etwas, das ich seit Jahren kenne.

Diese erforderten nur eine Indel-Ersetzung alle

15 Generationen, keine unmögliche Zahl.

Eher 10 Generationen und es gibt nichts, was eine so hohe Fixierungsrate unterstützt. Und das ist nur für Indels, das ist ein Bruchteil der Unterschiede, die berücksichtigt werden müssen.

Dann wandten wir uns den Punktmutationen (der 1%-Differenz) zu, und ich wies darauf hin, dass der beobachtete Substitutionsunterschied zwischen Schimpanse und Mensch ungefähr dem entspricht, was wir angesichts der Zeit der Schimpansen-Mensch-Spaltung und der beobachteten Mutationsrate erwarten sollten. Nichts, was Sie seitdem gepostet haben, hat dem widersprochen.

Alles, was ich gepostet habe, hat dem widersprochen.

4N Generationen, um 1 neutrale Mutation zu fixieren (Schätzung), wobei N die Populationsgröße ist.

Haldane veröffentlichte 1 von 300 Generationen und Experimente haben es bei über 600 Generationen für NÜTZLICHE Mutationen angegeben, die leichter fixiert werden als jede neutrale Mutation.

Du verstehst also entweder nichts, was ich gepostet habe, was ziemlich offensichtlich ist, weil dein Strohmann, den du bei deiner Ankunft widerlegt hast, die restlichen Mutationen jenseits von Indels vermeidet und dein offensichtlicher Fick in der Mathematik.

Und jetzt verlassen wir uns auf noch nie gehörte Substitutionsraten für die Indels.

Aber ja, ich werde meine ursprüngliche Behauptung revidieren und sagen:

Bei einem genetischen Unterschied von mehr als 10% zwischen Schimpansen und Menschen etwas Anzahl der Mutationen muss jedes Jahr behoben werden.

(Und alles was ich brauche ist ein-
alles was ich brauche ist ein-
Alles was ich brauche ist 1, 1.
1 ist alles was ich brauche)

Ah, ich sehe dein Problem. Sie denken, dass eine Mutation (Indel- oder Punktmutation) entstehen muss, sich dann bis zur Fixierung ausbreitet, dann muss die nächste den gleichen Prozess wiederholen.

Dies wäre in der Tat langsam.

Leider können viele, viele Mutationen gleichzeitig in einer Population wandern. Eigentlich alle. Erstens haben wir 23 Chromosomenpaare, und die Häufigkeit jeder Variante in der Population von Chromosom 1 kann steigen oder fallen, unabhängig davon, was mit der Häufigkeit einer Variante in der Population von Chromosom 2 passiert.

Zweitens erleben alle Chromosomen bei jeder Meiose viele Crossing-Over-Ereignisse, so dass wirklich jedes Chromosom in viele kleine Segmente unterteilt ist, die sich unabhängig voneinander segregieren und in jeder Generation neu kombiniert werden.

4N Generationen, um 1 neutrale Mutation zu fixieren (Schätzung), wobei N die Populationsgröße ist.

Das ist wahr, aber das gilt nur für eine Mutation und nur für die Mutationen, die das Glück haben, repariert zu werden (die überwiegende Mehrheit wird nie repariert und geht stattdessen verloren, daher ist ihre "Zeit bis zur Fixierung" unendlich).

In Wirklichkeit haben wir ungefähr (20 neue Mutationen pro Individuum) * (N = Populationsgröße), die jede einzelne Generation in die Population eintreten. Die meisten sind verloren, einige sind repariert. Die durchschnittliche Rate, mit der die Population Mutationen fixiert, ist gleich mu, der Mutationsrate.

Sie sprechen von etwas anderem, der durchschnittlichen Zeit bis zur Fixierung für eine einzelne Mutation, von der wir wissen, dass sie nachträglich behoben wurde. Beeinflusst weder meinen Standpunkt noch Ihre Unrichtigkeit in Bezug auf Ihre Gesamtaussage.

DU bist das Problem. Sie benötigen Anhäufungen von Mutationen und sie müssen in den Individuen von heute kulminieren.

320.000.000+ AKKUMULIERTE Differenzen.

Wie sammeln sich Mutationen an, wenn sie nicht zuerst behoben werden?

Einmal verloren, kann es sich nicht mehr ansammeln.

Kimura, Populationsgenetik, molekulare Evolution und die neutrale Theorie: „Wenn die Mutante selektiv neutral ist, ist die Wahrscheinlichkeit der endgültigen Fixierung gleich ihrer Anfangshäufigkeit, d. h. u=1/(2N) in der diploiden Population, und daher von Gl. (1), wir haben Ks=v. Mit anderen Worten, für neutrale Allele ist die Evolutionsrate gleich der Mutationsrate.“

Es ist eine sehr einfache Ableitung. Ein einfaches Beispiel sollte genügen. Betrachten Sie eine haploide Population, Größe N) mit durchschnittlich einer neutralen Mutation pro Individuum (sagen wir ein Genom von 10^8 und eine Mutationsrate von 10^-8). Die Fixierungswahrscheinlichkeit ist der Kehrwert der Populationsgröße oder 1/N. Aber wir haben N Mutationen pro Generation. Die erwartete Fixationsrate beträgt daher N*1/N. Das heißt, eine Mutation wird im Durchschnitt pro Generation behoben.

Zacho:
Das heißt, eine Mutation wird im Durchschnitt pro Generation behoben.

Wie ist das bei einer Bevölkerung über 3 überhaupt möglich?

Wenn die Nachkommen, also die nächste Generation, eine neue Mutation bekommen, wissen Sie was? Die Eltern haben es nicht, so dass es nicht repariert werden kann, bis sie sterben. Und dann wird es behoben, wenn die nächste Generation eine Bevölkerung von 1 hat.

Wenn die Mutationsrate 1,1 x 10-8 beträgt, ist dies die Anzahl der Mutationen, und da dies keine ganze Zahl ist und viel kleiner als 1 ist, sind Sie offensichtlich ahnungslos.

Aber danke für die Unterhaltung.

Talk Origins hat eine neutrale Mutation, die alle 4N Generationen fixiert wird (wobei N = Populationsgröße).

Relevante Referenzen (von genetische Drift- siehe oben), die meine Behauptung stützen, die eigentlich die evolutionsbiologische Behauptung ist:

Hedrick, Philip W. (2004). Genetics of Populations, 737, Jones and Bartlett Publishers.

Daniel Hartl, Andrew Clark (2007). Prinzipien der Populationsgenetik, 4. Auflage

Wen-Hsiung Li, Dan Graur (1991). Grundlagen der molekularen Evolution, Sinauer Associates.

Kimura, Motoo (2001). Theoretische Aspekte der Populationsgenetik, 232, Princeton University Press.

Masel J, King OD, Maughan H (2007). Der Verlust der adaptiven Plastizität während langer Zeiträume der Umweltstase. Amerikanischer Naturforscher 169 (1): 38–46.

Joe G: Wie ist das bei einer Bevölkerung über 3 überhaupt möglich?

Die Wahrscheinlichkeit einer Fixierung beträgt 1/N. Wenn die Population also 100 beträgt, beträgt die Wahrscheinlichkeit, dass sie schließlich eine Fixierung erreicht, 1/100. In unserem Beispiel treten jedoch 100 Mutationen in jeder Generation auf. Wir können also erwarten, dass im Durchschnitt 100* 1/100 oder man irgendwann die Fixierung erreicht. Jede Generation.

Joe G: Talk Origins hat eine neutrale Mutation, die alle 4N Generationen fixiert wird (wobei N = Populationsgröße).

Das ist die *Zeit* zur Fixierung. In unserem Beispiel vor 4N Generationen traten durchschnittlich 100 Mutationen auf, von denen 1/100 jetzt die Fixierung erreichen. Im Durchschnitt natürlich.

Zacho:
Die Wahrscheinlichkeit einer Fixierung beträgt 1/N. Wenn die Population also 100 ist, beträgt die Chance, dass sie schließlich eine Fixierung erreicht, 1/100. In unserem Beispiel treten jedoch 100 Mutationen in jeder Generation auf. Wir können also erwarten, dass im Durchschnitt 100* 1/100 oder man irgendwann die Fixierung erreicht. Jede Generation.

Das ist einfach nur dumm. Wenn 100 verschiedene Mutationen auftreten, wie kann man eine Fixierung in einer Generation erreichen?

Sie haben keine Ahnung, wovon Sie sprechen, und es zeigt sich immer noch.

Talk Origins hat eine neutrale Mutation, die alle 4N Generationen fixiert wird (wobei N = Populationsgröße).

Das ist die *Zeit* zur Fixierung

Nein, das ist die Anzahl der Generationen. Bei einer Population von 100 würde das bedeuten, dass es 400 Generationen dauern würde, bis eine neutrale Mutation fixiert ist.

Offensichtlich sind Sie in Mathe immer noch ahnungslos.

Sie können jedoch gerne einige positive Beweise für Ihre Behauptung vorlegen.

Joe G: Das ist einfach nur dumm. Wenn 100 verschiedene Mutationen auftreten, wie kann man eine Fixierung in einer Generation erreichen?

Sie werden nicht in einer Generation repariert. Ungefähr einer von Hundert wird nach 4N-Generationen repariert. im Durchschnitt. Es treten jedoch ständig neue Mutationen auf. Diejenigen, die in der aktuellen Generation behoben wurden, traten im Durchschnitt vor 4N Generationen auf.

Joe G: Bei einer Population von 100 würde das bedeuten, dass es 400 Generationen dauern würde, bis eine neutrale Mutation fixiert ist.

Das stimmt. Im Durchschnitt würde nur eine von 100 eine Fixierung erreichen, und es würde im Durchschnitt 400 Generationen dauern, bis dies geschieht. Da in jeder Generation Mutationen eingeführt werden, bedeutet dies, dass ein ständiger Strom von Mutationen behoben wird.

Lassen wir das durchschnittliche Bit beiseite und gehen von genau 100 neutralen Mutationen pro Generation in einer Population von 100 und einer Fixierungszeit von 400 Generationen aus. In Generation 0 haben wir 100 Mutationen, im Laufe der Zeit gehen 99 verloren, aber eine wird in Generation 400 behoben. In Generation 1 haben wir 100 Mutationen, im Laufe der Zeit gehen 99 verloren, aber eine wird in Generation 401 repariert 2, wir haben 100 Mutationen, im Laufe der Zeit gehen 99 verloren, aber eine wird in der Generation 402 behoben. Und so weiter. Es wird eine Mutation geben, die in jeder Generation dauerhaft fixiert wird.

Zacho:
Sie werden nicht in einer Generation repariert.

Zacho vorhin:
Das heißt, eine Mutation wird im Durchschnitt pro Generation behoben.

Zacho:
Ungefähr einer von Hundert wird nach 4N-Generationen repariert.

Zacho:
Diejenigen, die in der aktuellen Generation behoben wurden, traten im Durchschnitt vor 4N Generationen auf.

Wenn es überhaupt 4N Generationen gäbe.

Bei einer Population von 100 würde das bedeuten, dass es 400 Generationen dauern würde, bis eine neutrale Mutation fixiert ist.

Okay, du stimmst dem zu, was ich gesagt habe. Worum geht es dir?

Da in jeder Generation Mutationen eingeführt werden, bedeutet dies, dass ein ständiger Strom von Mutationen behoben wird.

Nein. Das bedeutet nur, dass es einen ständigen Strom von Variationen gibt.

Auch hier ist klar, dass Sie keine Ahnung haben, wovon Sie sprechen.

In Generation 0 haben wir 100 Mutationen, im Laufe der Zeit gehen 99 verloren, aber eine wird in Generation 400 behoben.

Zu viele Unbekannte, um das zu behaupten. Die Gleichungen berücksichtigen nicht die alltäglichen Belastungen der realen Welt. Und dann gibt es Bevölkerungswachstum und Wettbewerb mit vorteilhaften Eigenschaften.

Aber da Sie so überzeugt von Ihrem Spewag sind, sollten Sie vielleicht versuchen, es zu veröffentlichen. Dann interessiert sich vielleicht jemand.

Joe G: Die Gleichungen berücksichtigen nicht die alltäglichen Belastungen der realen Welt.

Bei dem genannten Modell neutraler Mutationen ist die Fixierungsrate neuer neutraler Mutationen gleich der Mutationsrate. Es ist ein einfaches und direktes Ergebnis.

Joe G: Aber da Sie so überzeugt von Ihrem Spewag sind, sollten Sie vielleicht versuchen, es zu veröffentlichen. Dann interessiert sich vielleicht jemand.

Es wurde bereits von jemandem namens Motoo Kimura veröffentlicht.

Kimura, Populationsgenetik, molekulare Evolution und die neutrale Theorie: „Wenn die Mutante selektiv neutral ist, ist die Wahrscheinlichkeit der endgültigen Fixierung gleich ihrer Anfangshäufigkeit, d. h. u=1/(2N) in der diploiden Population, und daher von Gl. (1), wir haben Ks=v. Mit anderen Worten, für neutrale Allele ist die Evolutionsrate gleich der Mutationsrate.“

Zachriel:
Bei dem genannten Modell neutraler Mutationen ist die Fixierungsrate neuer neutraler Mutationen gleich der Mutationsrate. Es ist ein einfaches und direktes Ergebnis.

Außer es ist nicht so einfach und nicht einmal annähernd direkt.

Die Mutationsraten variieren und sind alle sehr, sehr kleine Zahlen, dh 10^-8.

Offenbar haben Sie keine Ahnung, was das bedeutet.

Aber trotzdem, da Sie so zuversichtlich in Ihre Spewag sind, sollten Sie vielleicht versuchen, sie zu veröffentlichen. Dann interessiert sich vielleicht jemand.

Zachriel:
Es wurde bereits von jemandem namens Motoo Kimura veröffentlicht.

Leider sagt er für Sie nie etwas über die serielle Fixierung von neutralen Mutationen, nachdem eine bestimmte Schwelle überschritten wurde.

IOW Zacho, du bist ein anmaßender Lügner.

Substitutionsrate = Mutationsrate

Allerdings ist die Mutationsrate für neutrale Mutationen unbekannt, was bedeutet, dass auch die Substitutionsrate unbekannt ist.

„Die Fixierungsrate für eine Mutation, die nicht der Selektion unterliegt, ist also einfach die Rate der Einführung solcher Mutationen.“

Wow, schau dir Troy an und verlinke auf Scheiße, die wir bereits besprochen und vereinbart haben.

Allerdings ist die Mutationsrate für neutrale Mutationen unbekannt, was bedeutet, dass auch die Substitutionsrate unbekannt ist.

All diese theoretischen Überlegungen sind in Ordnung, aber früher oder später müssen einige bestätigende experimentelle Beweise vorliegen, die für die neutrale Theorie zur Fixierung neutraler Mutationen noch fehlen.

Joe G: Außer es ist nicht so einfach und nicht einmal annähernd direkt. Die Mutationsraten variieren und sind alle sehr, sehr kleine Zahlen, dh 10^-8. Offenbar haben Sie keine Ahnung, was das bedeutet.

Das bedeutet, *wenn* wir ein Genom der Länge 10^8 und eine Mutationsrate von 10^-8 pro Standort pro Generation haben, dann ist der erwartete Wert eine Mutation pro Genom pro Generation. Wenn es 100 Genome in der Population gibt, dann beträgt der erwartete Wert 100 Mutationen in der Population pro Generation. Aus deinem ursprünglichen Beitrag:

Joe G: Was NickM nicht zu erkennen scheint, ist die Substitutionsrate = 1,1 x 10^-8, nicht 40 Mutationen/Generation. Die 40 ist die Anzahl von Mutationen, die wir bei jeder Geburt bei einem Genom von 3,2 bp erwarten können.

Die Substitutionsrate ist gleich der Rate der neutralen Mutationen. Das heißt, wenn die Rate 40 neutrale Mutationen pro Geburt pro Generation beträgt, dann beträgt der Erwartungswert 40 (zuvor aufgetretene) Mutationen, die in jeder Generation in der gesamten Population festgelegt werden. Wie Nick sagte.

Zacho:
Das heißt, wenn die Rate 40 neutrale Mutationen pro Geburt pro Generation beträgt, dann beträgt der Erwartungswert 40 (zuvor aufgetretene) Mutationen, die in jeder Generation in der gesamten Population festgelegt werden.

Wow, du bist entweder wirklich dumm oder wirklich ignorant.

40 ist die Anzahl der Mutationen, nicht die Rate.

All diese theoretischen Überlegungen sind in Ordnung, aber früher oder später müssen einige bestätigende experimentelle Beweise vorliegen, die für die neutrale Theorie zur Fixierung neutraler Mutationen noch fehlen.

Es ist erstaunlich, was Evotards glauben werden, wenn sie denken, dass es ihre Behauptungen unterstützt.

BTW Zacho – Sie müssen die neutrale Mutationsrate kennen, da die Mutationsrate alle Arten umfasst, neutral, schädlich und nützlich. Und das wäscht nicht mit der Gleichung.

Joe G: 40 ist die Anzahl der Mutationen, nicht die Rate.

Wenn die Rate 1,1e-8 pro Base pro Generation beträgt, dann ist die Rate, wenn das Genom eine Länge von 3,2e9 Basen hat,

40 pro Genom pro Generation.

Gibt es einen Grund, warum alle unsere Kommentare in Maßen gehen?

Zacho:
Wenn die Rate 1,1e-8 pro Base pro Generation beträgt, dann ist die Rate, wenn das Genom eine Länge von 3,2e9 Basen hat,

40 pro Genom pro Generation.

Falsch - Sie verwechseln die Nummer mit dem Tarif.

Nicht nur, dass Sie keine experimentellen Beweise für diese Zahl haben.

Sie müssen also dort anfangen. Und wenn Sie keine experimentellen Beweise gesagt haben, dann haben Sie nichts.

Gibt es einen Grund, warum alle unsere Kommentare in Maßen gehen?

Zachriel: Wenn die Rate 1,1e-8 pro Base pro Generation beträgt, dann ist die Rate, wenn das Genom eine Länge von 3,2e9 Basen hat,

40 pro Genom pro Generation.

Joe G: Falsch - Sie verwechseln die Nummer mit dem Tarif.

1.1e-8 Mutationen pro Base pro Generation ist eine Rate. 4e1 pro Genom pro Generation ist eine Rate.

Warum weigern Sie sich, Ihre Behauptungen experimentell zu untermauern?

Was ist Ihr Beweis dafür, dass es pro Genom pro Generation 40 neutrale Mutationen gibt?

Warum weigern Sie sich, Ihre Behauptungen experimentell zu untermauern?

Was ist Ihr Beweis dafür, dass es pro Genom pro Generation 40 neutrale Mutationen gibt?

Nun, da Sie endlich zu haben scheinen, dass 1,1 x 10^-8 Mutationen PRO BASIS PRO GEBURT mal 3,2 x 10*9 Basen im menschlichen Genom = 35,2 Mutationen PRO GENOM PRO GEBURT sind, und dass * beides* Raten sind, können wir besprechen Sie Ihre obige Frage.

1. Die Mutationszahl 1,1 x 10^-8 stammt aus experimentellen Daten, siehe die Wikipedia-Seite für die Referenz. Es gibt mehrere gängige Experimente, um Mutationsraten zu bestimmen, z.B.:

(a) Sortiere die Eltern und die Nachkommen und zähle die Unterschiede

(b) einen Mann und die DNA einiger seiner Samenzellen zu sequenzieren (damals aufgrund der Gemeinsamkeit dieser Samenzellen beliebt)

2. Wie viele dieser Mutationen sind nun neutral? Antwort: fast alle, da nur wenige Prozent des Genoms für Gene oder Genregulation kodieren, und selbst in Genen sind die meisten Punktmutationen wegen der Redundanz des genetischen Codes neutral.

Es gibt einige Hinweise darauf, dass einige "neutrale" Mutationen (wie die dritte Position in DNA-Codons) möglicherweise nicht genau vollständig selektiv neutral sind, einige von ihnen könnten sehr leicht vorteilhaft oder schädlich sein. Aber die Selektion kann nur Mutationen mit einem bestimmten minimalen Selektionswert "sehen" (der Wert ist so etwas wie s muss größer als 1/N sein, ich erinnere mich nicht genau). Wenn also der selektive Nachteil einer Mutation nur 1/10.000 beträgt, wäre sie bei einer Spezies wie dem Menschen mit einer historischen effektiven Populationsgröße von etwa 1/10.000 effektiv neutral. Und alles mit einem s in der Nähe von 1/10.000 würde sich auch fast neutral verhalten (d. h. genetische Drift hätte einen großen Einfluss auf sein Schicksal, verglichen mit der Selektion).

NickM:
1. Die Mutationszahl 1,1 x 10^-8 stammt aus experimentellen Daten, siehe die Wikipedia-Seite für die Referenz.

2. Wie viele dieser Mutationen sind nun neutral? Antwort: fast alle, da nur wenige Prozent des Genoms für Gene oder Genregulation kodieren, und selbst in Genen sind die meisten Punktmutationen wegen der Redundanz des genetischen Codes neutral.

Unüberprüfbares Kauderwelsch, da es keine Möglichkeit gibt, A) zu testen, wie viel % Codes für notwendige Dinge kodieren und B) wir von vielen angeblichen stillen Mutationen wissen, die Auswirkungen haben - das liegt an der Art und Weise, wie die Codierung funktioniert.

Sie benötigen jedoch einige experimentelle Daten oder reale Daten, um Ihre Behauptung der Substitutionsraten zu untermauern.

Sie haben das nicht oder weigern sich aus irgendeinem Grund, es vorzulegen.

Bis dahin hast du also nichts anderes als eine kahle Behauptung.

NickM: Aber die Selektion kann nur Mutationen mit einem bestimmten minimalen Selektionswert "sehen" (der Wert ist so etwas wie s muss größer als 1/N sein, ich erinnere mich nicht genau).

Das stimmt. Eine Mutation ist effektiv neutral, wenn |s| << 1/(2N), diploid.

Und weigern sich immer noch, experimentelle Unterstützung für Ihre Behauptungen zu geben.

Joe G: Und weigern sich immer noch, experimentelle Unterstützung für Ihre Behauptungen zu geben.

Wir haben keine experimentellen Behauptungen aufgestellt. Wir haben vielmehr eine Frage beantwortet, wie sich neutrale Mutationen in einer Population bei einer bestimmten Rate neutraler Mutationen ausbreiten würden.

Zacho:
Wir haben vielmehr eine Frage beantwortet, wie sich neutrale Mutationen in einer Population bei einer bestimmten Rate neutraler Mutationen ausbreiten würden.

Ihre "answer" wird nicht unterstützt, d. h. es ist überhaupt keine Antwort.

Übrigens, der "Wie"-Teil ist zufällig, also hast du nicht geantwortet, wie.

Zacho:
Das heißt, wenn die Rate 40 neutrale Mutationen pro Geburt pro Generation beträgt, dann beträgt der Erwartungswert 40 (zuvor aufgetretene) Mutationen, die in jeder Generation in der gesamten Population festgelegt werden.

Reiner Bullshit - Bedeutung ohne experimentelle Unterstützung. Und bis Sie experimentelle Unterstützung bekommen, wird es reiner Quatsch sein.

Also entweder machen Sie es oder machen Sie einen Ausflug den Shenandoah hinunter und hinaus aufs Meer, wenn Sie meinen Drift verstehen.

Joe G: Ihre "answer" wird nicht unterstützt, d. h. es ist überhaupt keine Antwort.

Hä? Wir haben nicht nur erklärt, warum die Substitutionsrate der Mutationsrate entspricht, sondern wir haben Kimura auch direkt zitiert. Hier ist es wieder:

Kimura, Populationsgenetik, molekulare Evolution und die neutrale Theorie: „Wenn die Mutante selektiv neutral ist, ist die Wahrscheinlichkeit der endgültigen Fixierung gleich ihrer Anfangshäufigkeit, d. h. u=1/(2N) in der diploiden Population, und daher von Gl. (1), wir haben Ks=v. Mit anderen Worten, für neutrale Allele ist die Evolutionsrate gleich der Mutationsrate.“

Eine Möglichkeit, Ihre feige Natur zu beweisen, indem Sie nicht einmal auf das eingehen, was ich poste.

Zacho:
Wir haben nicht nur erklärt, warum die Substitutionsrate der Mutationsrate entspricht, sondern wir haben Kimura auch direkt zitiert.

Leider für Sie unterstützt imura nicht Ihre Behauptung von:

Das heißt, wenn die Rate 40 neutrale Mutationen pro Geburt pro Generation beträgt, dann beträgt der Erwartungswert 40 (zuvor aufgetretene) Mutationen, die in jeder Generation in der gesamten Population festgelegt werden.

Du bist ein Lügenbluffer. Was bedeutet, was du sagst ist reiner Bullshit - Bedeutung ohne experimentelle Unterstützung. Und bis Sie experimentelle Unterstützung bekommen, wird es reiner Quatsch sein.

Sehen Sie, alles, was ich verlange, sind Beweise, die Ihre Behauptung stützen:

Das heißt, wenn die Rate 40 neutrale Mutationen pro Geburt pro Generation beträgt, dann beträgt der Erwartungswert 40 (zuvor aufgetretene) Mutationen, die in jeder Generation in der gesamten Population festgelegt werden.

Ich habe Referenzen angegeben, die 4N-Generationen für 1 besagen.

NickM begann mit einer Bevölkerung von 10.000. Verstehst du was das bedeutet?

Joe G: NickM begann mit einer Bevölkerung von 10.000. Verstehst du was das bedeutet?

Ja, das bedeutet, dass die ungefähr 40 neutralen Mutationen, die heute eine Fixierung erreichen, im Durchschnitt vor 40.000 Generationen aufgetreten sind.

Was ist der empirische Beweis für Ihre Behauptung?

Joe G: Es scheint einige Verwirrung darüber zu geben, was die neutrale Theorie über die Substitutionsraten sagt.

Joe G: Und wie können wir das sagen? Was ist der empirische Beweis für Ihre Behauptung?

Es ist keine empirische Behauptung, sondern eine Folge des neutralen Theoriemodells der Evolution, das Sie in Ihrem ursprünglichen Beitrag eingeführt haben.

Zacho:
Es ist keine empirische Behauptung, sondern eine Folge des neutralen Theoriemodells der Evolution, das Sie in Ihrem ursprünglichen Beitrag eingeführt haben.

Ich habe die neutrale Theorie nicht eingeführt. Kimura hat es getan.

Und wie wurde festgestellt, dass es sich um eine Folgerung ohne empirische Unterstützung handelt?

Joe G: Ich habe die neutrale Theorie nicht eingeführt. Kimura hat es getan.

Sie haben in Ihrem ursprünglichen Beitrag neutrale Theorien angesprochen.

Joe G: Und wie wurde festgestellt, dass es sich um eine Folgerung ohne empirische Unterstützung handelt?

Eine Theorie ist ein Modell, in diesem Fall ein Modell dafür, wie sich neutrale Mutationen durch eine Population ausbreiten. Da einige Mutationen neutral sind (wie synonyme Substitutionen oder Basen in einem Pseudogen), kann ihre statistische Verteilung vorhergesagt werden. Insbesondere wird die Fixierungsrate neutraler Mutationen gleich der neutralen Mutationsrate sein.

Joe G: Und wie wurde festgestellt, dass es sich um eine Folgerung ohne empirische Unterstützung handelt?

Wissen Sie, was "Quotentailment" bedeutet?

Zacho:
Wissen Sie, was "Quotentailment" bedeutet?

Ja, ich will. Woher wissen Sie also, was Sie gesagt haben, ist eine Folge der Theorie?

Zacho:
Sie haben in Ihrem ursprünglichen Beitrag neutrale Theorien angesprochen.

Das liegt daran, dass NickM es im anderen Thread über Schimpansen und menschliche DNA erwähnt hat.

Aber es zur Sprache zu bringen ist nicht dasselbe wie es einzuführen.

Und wie wurde festgestellt, dass es sich um eine Folgerung ohne empirische Unterstützung handelt?

Eine Theorie ist ein Modell, in diesem Fall ein Modell dafür, wie sich neutrale Mutationen durch eine Population ausbreiten.

Kann etwas ohne Beweise wissenschaftlich nicht modellieren.

Da einige Mutationen neutral sind (wie synonyme Substitutionen oder Basen in einem Pseudogen), kann ihre statistische Verteilung vorhergesagt werden.

Eine Vorhersage ohne empirische oder beweiskräftige Unterstützung ist wertlos.

Insbesondere wird die Fixierungsrate neutraler Mutationen gleich der neutralen Mutationsrate sein.

Ja, und Sie können alles sagen, solange Sie es nicht unterstützen müssen. Und das macht es, wie ich schon sagte, reiner Quatsch.

Zachriel: Wissen Sie, was "Quotentailment" bedeutet?

Dann sagen Sie uns, was eine Verpflichtung ist.

Es gibt mehrere Definitionen, aber ich würde sagen, dass Sie es verwenden, um "notwendige Begleitung oder Konsequenz" zu bedeuten, weshalb ich gefragt habe Woher wissen Sie also, was Sie gesagt haben, ist eine Folge der Theorie?

Sie haben diese Frage vermieden, weil Sie Probleme mit der intellektuellen Integrität haben.

Etwas als Folge zu erklären und Beweise dafür zu haben, dass es wirklich so ist, sind zwei verschiedene Dinge. Nicht dass du das verstehen könntest.

Joe G: Woher wissen Sie also, dass das, was Sie gesagt haben, eine Folge der Theorie ist?

Denn es folgt direkt aus den Räumlichkeiten. Unter der Annahme nicht verknüpfter, zufälliger neutraler Mutationen μ, in einer diploiden Population N:

Die Häufigkeit einer neuen Mutation in der Population beträgt 1/(2N).
Die Wahrscheinlichkeit der Fixierung einer Mutation ist ihre Häufigkeit in der Population.
Die Zahl der Neumutationen in der Population beträgt 2Nμ.
Daher beträgt die Fixierungsrate neutraler Mutationen 2Nμ * 1/(2N) = μ.

Einige Mutationen sind eindeutig neutral, wie beispielsweise Basen in Pseudogenen. Und die Beweise unterstützen ihre neutrale Entwicklung.

Woher wissen Sie also, was Sie gesagt haben, ist eine Folge der Theorie?

Denn es folgt direkt aus den Räumlichkeiten.

Aber alles, was wir haben, ist Ihr Wort dafür. Und das bedeutet, dass es bedeutungslos ist.

Sie können alle ungeprüften Gleichungen wiederholen, die Sie wollen, das macht sie nicht richtig. Es bedeutet auch nicht, dass Sie sie verstehen.

Also keine experimentelle Stütze für die kahle Verpflichtungserklärung.

Als Einstein seine Relativitätstheorie zum ersten Mal veröffentlichte, enthielten seine Berechnungen eine Folgerung. Seltsamerweise glaubte ihm niemand wirklich, bis Eddington es durch ein natürliches Experiment bestätigte. Und es wurde immer wieder durch Experimente bestätigt.

Die neutrale Theorie Verpflichtung ist auf Papier geklebt und das macht es für die reale Welt strittig.

Etwas als Folge zu deklarieren und Beweise dafür zu haben, dass es wirklich so ist, sind zwei verschiedene Dinge. Nicht dass du das verstehen könntest.

Und Zacho versteht das offensichtlich nicht.

Eine andere Vorhersage hat sich erfüllt.

Joe G: Aber alles, was wir haben, ist Ihr Wort dafür.

Ähm, nein. Aus den Prämissen des Modells, das wir gezeigt haben, folgt eine Folgerung. Alles, was Ihnen bleibt, ist Handwinken. Viel Glück damit.

Aber alles, was wir haben, ist Ihr Wort dafür.

Ohne empirische Beweise haben wir nur Ihr Wort dafür. Und Sie haben zugegeben, dass Ihre Behauptung keine empirische Unterstützung hat.

Aus den Prämissen des Modells ergibt sich eine Folgerung.

Ein Entschluss ohne empirische Unterstützung ist bedeutungslos. Und ein Modell ohne empirische Unterstützung ist ein Wunschtraum.

Sie haben gezeigt, dass Sie aufblähende Evotards sind, die nicht die Absicht haben, jemals etwas zu unterstützen, was Sie behaupten.


ERGEBNISSE

Um die Unterstützung für einen kürzlich durchgeführten selektiven Sweep zu bewerten, folge ich dem von Pritchard entwickelten Ansatz et al. (1999), um die Zeit seit Beginn des Wachstums beim Menschen abzuschätzen. Insbesondere fasse ich die Polymorphismusdaten zusammen und erhalte eine Stichprobe der Posterior-Verteilung der Parameter, abhängig davon, dass die Zusammenfassungen nahe bei (d.h., innerhalb einer vorgegebenen Umgebung) oder gleich dem beobachteten Wert. Ähnliche Rejection-Sampling-Methoden wurden in anderen Zusammenhängen verwendet, einschließlich der Schätzung der effektiven Populationsgröße (B achtrog und Charlesworth 2002), Populationsparametern (T avare et al. 1997 W all 2000 F Earnhead und D onnelly 2002) und das Alter eines Allels (T ishkoff et al. 2001), sowie demografische Inferenz (Weiss und von Häseler 1998 B eaumont et al. 2002). Für eine Diskussion der Unterschiede zwischen Implementierungen siehe Beaumont et al. (2002).

Auswahl an Zusammenfassungen: Um nicht alle Informationen in den Daten verwenden zu können, möchte man Zusammenfassungen verwenden, die auf den interessierenden Parameter (hier die Zeit seit der Fixierung des nützlichen Allels, T) und erfassen verschiedene Facetten der Daten. Ich konzentriere mich auf drei Statistiken: die Anzahl der getrennten Sites (S), eine Zusammenfassung des Allelfrequenzspektrums (D) und eine Zusammenfassung des Kopplungsungleichgewichts (h). Frühere Studien haben zwei der Statistiken gezeigt, S und D, sensibel sein T. Insbesondere wird erwartet, dass selektive Sweeps die Diversität reduzieren und somit die S, und verzerren das Frequenzspektrum in Richtung seltener Allele, was zu negativem führt D Werte (M aynard S mith und Haigh 1974 B raverman et al. 1995 Simonsen et al. 1995). Ich entschied mich D zwischen verschiedenen Frequenzspektrum-Zusammenfassungen, weil sie, wenn sie als Teststatistik verwendet wird, mehr als andere Statistiken die Fähigkeit behält, ein neutrales Modell abzulehnen, wenn Daten unter einem selektiven Sweep-Modell für größere . erzeugt werden T Werte (K im und S tephan 2002 P rzeworski 2002). D ist die (ungefähr) normalisierte Differenz zwischen einem Diversitätsmaß basierend auf S und die mittlere paarweise Differenz in der Stichprobe (T ajima 1989). So spezifizieren S und D bestimmt auch π.

Die Zahl der Haplotypen, h, trägt auch Informationen über T. Sein Verhalten hängt von der Stärke der Selektion und der Rekombinationsrate ab. Wenn während des selektiven Sweeps eine Rekombination zwischen ausgewählten und neutralen Loci auftritt, dann T = 0, h/(S + 1) im Durchschnitt niedriger ausfallen als ohne Selektion (P rzeworski 2002). Mit anderen Worten, allelische Assoziationen neigen dazu, stärker zu sein, als sie es ohne Selektion wären. Wie T erhöht, entstehen durch Mutation neue Allele. Diese seltenen Allele werden neue Haplotypen erzeugen, so dass h/(S + 1) wird die neutrale Erwartung schnell übertreffen. Das Verhältnis wird anschließend abnehmen (bei T » 0.1), da die Allele allmählich an Frequenz zunehmen und auf anderen Hintergründen rekombinieren (P rzeworski 2002). Wenn während des selektiven Sweeps keine Rekombination zwischen ausgewählten und neutralen Loci stattfindet, sind die meisten Allele selten und h/(S + 1) wird unter Neutralität größer als erwartet sein, wobei der größte Wert erreicht wird für T > 0,1 (Przeworski 2002).

—(A) Eine Probe aus der Posterior-Verteilung von T für einen simulierten Datensatz, wenn die wahre Zeit TÖ = 0. Andere Parameter, die zur Generierung des Datensatzes verwendet werden, sind die gleichen wie in Tabelle 1 (mit einem einheitlichen Vorrang). T) mit ε auf 0.1 gesetzt und mε = 10 4 . In diesem Beispiel, S = 7, D =-1,78, und h = 4. (B) Eine Stichprobe aus der Posterior-Verteilung von T für einen simulierten Datensatz, wenn die wahre Zeit TÖ = 0,2. Andere Parameter sind wie in A. In diesem Beispiel S = 8, D = -0,91 und h = 10.

Zusammenfassend lässt sich sagen, dass in grober Näherung S und D werden voraussichtlich mit monoton zunehmen NS/(S + 1) tendiert dazu, einen maximalen Wert bei einem Zwischenwert zu haben T. Dies deutet darauf hin, dass die Verwendung h als zusätzliche Statistik kann helfen, zwischen den letzten T Werte und daher die Schätzungen von zu verfeinern T erhalten mit D und S allein. Ich veranschauliche dies in Abbildung 1, indem ich die Posterior-Verteilung von T für zwei simulierte Datensätze, bedingt ein S und D (erste Reihe) S und h (zweite Reihe) und S, D, und h (letzte Reihe). Wie zu sehen ist, führt die Konditionierung auf alle drei Zusammenfassungen zu einer engeren Verteilung um den wahren Wert als die Verwendung von nur zwei dieser Ergebnisse wird durch umfangreichere Simulationen bestätigt (Ergebnisse nicht gezeigt).

Inwieweit die drei Zusammenfassungen aufschlussreich sind über T hängt von Vorkenntnissen über die Parameter ab. Insbesondere erfordert das Erkennen einer Verringerung der Diversität eine gewisse Kenntnis darüber, welche Diversitätsgrade ohne Auswahl erwartet werden. Wenn man also genaue Vorkenntnisse über die Populationsmutationsrate θ (= 4nμ), kann die Abnahme der Zahl der Segregationsstellen und der Zahl der Haplotypen sehr aufschlussreich über die Zeit seit dem selektiven Sweep sein (S imonsen et al. 1995). Wenn weniger über θ bekannt ist, stammen die meisten Informationen über die Zeit seit dem selektiven Sweep aus dem beobachteten Wert von D und der Wert von h gegeben S.

Durchführung der Methode an simulierten Daten

Ein zusätzlicher Vorteil der Verwendung unterschiedlicher Aspekte der Daten besteht darin, dass der Ansatz möglicherweise weniger empfindlich auf Fehlspezifikationen der vorherigen Verteilungen reagiert. Zum Beispiel Methoden, die schätzen T allein auf der Grundlage von Diversitätsniveaus sind sehr empfindlich auf die Schätzung von θ. Wenn θ höher geschätzt wird, als es in der Realität ist, aber keine Auswahl stattgefunden hat, erscheinen die Variationsniveaus reduziert. Auf dieser Grundlage können Methoden fälschlicherweise die kürzliche Fixierung eines nützlichen Allels nahelegen. Werden die Daten jedoch unter einem neutralen Modell mit erhöhter Mutationsrate generiert, sind die Werte von D und h bei einem kürzlich erfolgten selektiven Sweep tendenziell weniger wahrscheinlich sein wird als bei einer Neutralität. Daher kann die Verwendung aller drei Zusammenfassungen zu einer geringeren Unterstützung für eine aktuelle T. Um dies zu untersuchen, habe ich 20 Simulationen ohne Auswahl durchgeführt, bei denen der Mittelwert der Prior-Verteilung von θ doppelt so groß war wie der Wert, der zur Generierung der Daten verwendet wurde (Parameter wie in Tabelle 1 für einen einheitlichen Prior von T). Für keinen der simulierten Datensätze gab es starke Unterstützung für einen kürzlich durchgeführten selektiven Sweep (Ergebnisse nicht gezeigt).

Durchführung des Ansatzes: Ein Problem besteht darin, dass die Posterior-Wahrscheinlichkeiten möglicherweise nicht gut geschätzt werden. In dieser Hinsicht besteht ein Vorteil dieser Methode gegenüber effizienteren Methoden wie der Monte-Carlo-Markov-Kette darin, dass sie unabhängige Stichproben aus der Posterior-Verteilung liefert, sodass man die Genauigkeit der Schätzungen der Posterior-Wahrscheinlichkeiten leicht beurteilen kann. Insbesondere, wenn die Probe aus dem Seitenzahnbereich groß ist mε, der mit verbundene Stichprobenfehler BJ, die beobachtete Anzahl von Zählungen im Intervall J, ist binomial (C arlin und Louis 1998) und kann anhand von Parametern (BJ/mε, mε). Dies zeigt an, dass Wahrscheinlichkeiten in der Größenordnung von 1/mε werden schlecht geschätzt, während diese »1/mε ziemlich genau geschätzt werden. In den hier vorgestellten Simulationen mε = 2000 und die interessierenden Wahrscheinlichkeiten sind »5 × 10 –4 .

Eine zweite Frage ist, ob Daten, die unter einem Auswahl-Sweep-Modell mit realistischen Parametern generiert wurden, viele Informationen über den Parameter enthalten T. Lassen TÖ die wahre Zeit seit der Fixierung des nützlichen Allels sein. Wenn die Daten informativ sind, sollte die Unterstützung für die jüngste Zeit in der Posterior-Verteilung stärker sein als in der vorherigen if TÖ 0 oder 0,10 beträgt, während es ohne Auswahl eine schwächere Unterstützung für die letzten Zeiten geben sollte. Wie in Tabelle 1 zu sehen ist, gilt dies für fast alle simulierten Durchläufe, unabhängig davon, ob die vorherige Verteilung von T ist Exp(1.2) oder U(0, 1). Um den Anteil von Datensätzen mit starker Unterstützung für einen „neuen“ selektiven Sweep zu messen, tabelliere ich den Anteil von 100 simulierten Datensätzen, bei denen der posteriore Pr(T ≤ 0,2) > 0,50. Zum TÖ = 0, der Anteil ist sehr hoch. Es nimmt mit . ab TÖ, aber auch wenn die vorteilhafte Substitution vor einiger Zeit stattgefunden hat (TÖ = 0,10), unterstützt über ein Drittel der simulierten Datensätze stark einen selektiven Sweep (Tabelle 1). Im Gegensatz dazu findet man selten (in <5% der Läufe) eine starke Unterstützung für einen kürzlich erfolgten selektiven Sweep, wenn kein solcher aufgetreten ist. Zusammenfassend scheinen die simulierten Datensätze aufschlussreich über die jüngsten genetischen Anpassungen zu sein. Beim Menschen entsprechen die für die Simulationen gewählten Parameter ungefähr 25 Individuen, die für 10 kb in einem Bereich durchschnittlicher Rekombination sequenziert wurden, vergleichbar mit dem, was derzeit für Studien an mutmaßlich ausgewählten Loci gesammelt wird (z.B., E nard et al. 2002 H amblin et al. 2002).

Beachten Sie außerdem, dass diese Leistungstests für zwei ziemlich unterschiedliche frühere Distributionen für durchgeführt wurden T. Die Ergebnisse sind in beiden Implementierungen sehr ähnlich, was darauf hindeutet, dass das Verfahren robust gegenüber der Wahl einer vorherigen Verteilung ist. Dies ist beruhigend, da normalerweise wenig oder nichts darüber bekannt ist T—im Gegensatz zu anderen Parametern, bei denen oft unabhängiges Wissen vorhanden ist, um die Spezifikation des Priors zu leiten.

In manchen Zusammenhängen ist man an einer Schätzung der unskalierten Zeit (in Generationen) seit der Fixierung des nützlichen Allels interessiert, TGen = 4NT. Als Punktschätzung könnte man den Modus der Stichprobe aus der Posterior-Verteilung von TGen. In Abbildung 2 zeichne ich die Verteilung der Moden (d.h., der Bin mit der größten Anzahl von Zählungen) für 100 simulierte Datensätze. Wenn die Daten unter einem No-Selection-Modell generiert werden, sind nur wenige Modi in letzter Zeit (z.B., 6 sind um TGen ≤ 8000 Generationen). Im Gegensatz dazu, wenn die Daten unter einem aktuellen selektiven Sweep-Modell erzeugt werden, sind die meisten Modi nahe an der wahren Zeit. Zum Beispiel, wenn die wahre TGen ist 0, 94 der Modi sind bei TGen ≤ 4000 Generationen. Als die wahre TGen steigt, nimmt die Genauigkeit der Schätzung ab: Wenn also der wahre TGen 4000 Generationen beträgt, liegen nur 60 der Modi innerhalb eines Faktors von zwei des wahren Wertes.

—Die Modi der Posterior-Verteilungsstichproben von TGen = 4NT für 100 simulierte Datensätze. Für jeden Datensatz sind die Werte von TGen werden in 2000er-Schritten von 0 bis 80.000 unterteilt, der Modus bezieht sich auf den Bin mit der höchsten Anzahl von Zählungen. Die simulierten Datensätze sind die gleichen wie in Tabelle 1 für einen einheitlichen Vorlauf zusammengefasst T die Ergebnisse sind ähnlich, wenn der Prior stattdessen Exp(1.2) ist (Ergebnisse nicht gezeigt).

Bewerbung um tb1: Die tb1 locus ist für die kurzen Äste verantwortlich, die Mais von seinem wilden Vorläufer Teosinte unterscheiden. Es wird angenommen, dass dieses Merkmal während des Domestikationsprozesses fixiert wurde, 5-10 KYA (cf. Wang et al. 1999). Ich verwende Polymorphismus-Daten, die für 2740 bp des Mais gesammelt wurden tb1 von Tenaillon et al. (2001 verfügbar unter http://bgbox.bio.uci.edu/data/maud1asd.html). Ich konzentriere mich auf die 14 Landrassen unter den 23 Linien, die sequenziert wurden. Die Ergebnisse sind ähnlich, wenn die 9 zusätzlichen Inzuchtlinien einbezogen werden (Ergebnisse nicht gezeigt). Für diese Daten, S = 39, h = 14, und D =-2,25 [Statistiken wurden unter Verwendung von DNAsp berechnet (Rozas und Rozas 1999)]. Eine Probe aus der Posterior-Verteilung von T ist in Abbildung 3A dargestellt. Über 99,99 % des Supports sind aktiviert T 0,2. Im Einklang mit dem, was über die Rolle von . bekannt ist, tb1 bei der Domestikation von Mais weisen Polymorphismusdaten stark auf die kürzliche Fixierung eines nützlichen Allels hin.

Ich präsentiere auch eine Probe aus der gemeinsamen posterioren Verteilung von S, der Selektionskoeffizient des bevorzugten Allels, und TGen, die Zeit in Generationen seit der Fixierung des nützlichen Allels (Abbildung 3B). Die Ergebnisse legen einen großen Selektionskoeffizienten nahe, in Übereinstimmung mit Beweisen dafür, dass das Merkmal unter künstlicher Selektion stand. Der größte Teil der Unterstützung erfolgt jedoch zu älteren Zeitpunkten, als aus den archäologischen Aufzeichnungen erwartet (bei Mais wird etwa eine Generation pro Jahr angenommen). Diese Diskrepanz kann zufällig sein, da nur wenige Schätzungen von TGen wird auch unter idealen Bedingungen auf dem wahren Wert liegen (siehe Abbildung 2). Alternativ kann es eine falsche Annahme über den Standort des ausgewählten Standorts oder einen herausragenden Aspekt der Maisgeschichte widerspiegeln, der nicht durch das demografische oder selektive Modell erfasst wird (siehe unten).


Ergebnisse

Ermitteln der neutralen Substitutionsrate

Unsere Untersuchungen beziehen sich auf eine Klasse von Evolutionsmodellen (formell in den Methoden beschrieben), bei denen die Fortpflanzung ungeschlechtlich ist und die Populationsgröße und räumliche Struktur festgelegt sind. Insbesondere gibt es eine feste Anzahl von Websites, die indiziert sind ich = 1, …, n. Jeder Standort wird immer von einer einzelnen Person besetzt. Bei jedem Zeitschritt tritt ein Ersetzungsereignis ein, dh die Bewohner einiger Standorte werden durch die Nachkommen anderer ersetzt. Ersetzungsereignisse werden gemäß einer festen Wahrscheinlichkeitsverteilung, die als Ersetzungsregel bezeichnet wird, ausgewählt, die für das betreffende Modell spezifisch ist. Da wir nur neutrale Mutationen ohne phänotypische Wirkung betrachten, hängen die Wahrscheinlichkeiten von Ersatzereignissen nicht vom aktuellen Populationszustand ab.

Diese Klasse umfasst viele etablierte evolutionäre Modelle. Eine wichtige Unterklasse sind räumliche Moranprozesse [23, 33�], bei denen in jedem Zeitschritt genau eine Reproduktion stattfindet. Diese Klasse umfasst auch räumliche Wright-Fisher-Prozesse, bei denen die gesamte Population in jedem Zeitschritt ersetzt wird [36, 37]. Im Allgemeinen ist jede Teilmenge R ⊂ <1, …, n> von Personen können in einem bestimmten Ersatzereignis ersetzt werden. Die Abstammung in einem Ersatzereignis wird in einer Nachkommen-zu-Eltern-Karte aufgezeichnet α:R → <1, …, n> (siehe Methods, [32, 38]), die sicherstellt, dass jedes Nachkommen genau einen Elternteil hat und uns erlaubt, die Abstammungslinien über die Zeit zu verfolgen.

Für ein gegebenes Modell in dieser Klasse lassen wir e ij bezeichnet die (marginale) Wahrscheinlichkeit, dass der Nutzer des Standorts J wird durch die Nachkommen der Site ersetzt ich in einem einzigen Zeitschritt. Somit ist die erwartete Anzahl von Nachkommen der Site ich über einen einzelnen Zeitschritt ist b i = ∑ j = 1 N e i j . Die Wahrscheinlichkeit, dass Knoten ich stirbt (d.h. wird ersetzt) ​​in einem Zeitschritt ist d i = ∑ j = 1 N e j i . Die Sterberate D ich kann auch als Umsatzrate am Standort angesehen werden ich. Die erwartete Gesamtzahl der Nachkommen pro Zeitschritt wird mit B = ∑ i = 1 N b i = ∑ i = 1 N d i = ∑ i , j e i j bezeichnet. Wir definieren eine Generation zu sein n/B Zeitschritte, so dass jede Site im Durchschnitt einmal pro Generation ersetzt wird.

Wir verwenden diesen Rahmen, um das Schicksal einer einzelnen neutralen Mutation zu untersuchen, wenn sie entsteht und entweder verschwindet oder fixiert wird. Die Wahrscheinlichkeit der Fixierung hängt von der räumlichen Struktur und dem Standort der ursprünglichen Mutante ab. Wir lassen ρ ich geben die Wahrscheinlichkeit an, dass eine neue Mutation an der Stelle . entsteht ich wird fest. (ρ ich kann auch als Fortpflanzungswert des Standorts verstanden werden ich [39].) Wir zeigen in den Methoden, dass die Fixationswahrscheinlichkeiten ρ ich sind die eindeutige Lösung des Gleichungssystems

Gleichung (2) entsteht, weil ρ ich gleich der Wahrscheinlichkeit, dass der aktuelle Nutzer des Standorts ich wird der eventuelle Vorfahre der Bevölkerung, was für genau einen der n Websites.

Um die Gesamtrate der Substitution zu bestimmen, müssen wir die Wahrscheinlichkeit des Auftretens von Mutationen an jeder Stelle berücksichtigen. Die Rate, mit der Mutationen an der Stelle auftreten ich ist proportional zur Fluktuationsrate D ich, da jedes neue Nachkommen eine unabhängige Mutationschance bietet. Insbesondere wenn die Mutation mit einer Rate auftritt du ≪ 1 pro Reproduktion, dann entstehen neue Mutationen an der Stelle ich zum Preis Nackt ich/B pro Generation [32]. Somit ist der Anteil der Mutationen, die an der Stelle ich ist D ich/B.

Die Gesamtfixierungswahrscheinlichkeit ρ neuer Mutationen unter Berücksichtigung aller möglichen Ausgangsstellen ist daher

Die molekulare Taktrate K erhält man durch Multiplikation der Fixationswahrscheinlichkeit ρ durch die Gesamtmutationsrate pro Generation:

Die Einheiten von K sind Substitutionen pro Generation. Alternativ kann die molekulare Uhr in Einheiten von Substitutionen pro Zeitschritt ausgedrückt werden, in diesem Fall lautet die Formel K ˜ = B u ρ = u ∑ i = 1 N d i ρ i .

Auswirkungen der räumlichen Struktur

Wie wirkt sich die räumliche Struktur auf die Rate der neutralen Substitution aus? In einer gut gemischten Population werden die Nachkommen jedes Individuums mit gleicher Wahrscheinlichkeit jedes andere Individuum ersetzen, was bedeutet, dass e ij ist insgesamt konstant ich und J ( Abb. 2a ). In diesem Fall ist die eindeutige Lösung von Gl. (1)–(2) ist ρ ich = 1/n für alle ich, und wir erholen Kimura’s [2] Ergebnis K = Nu(1/n) = du. Wenn außerdem jede Stelle unter Symmetrie äquivalent ist, wie in Abb. 2b , impliziert diese Symmetrie, dass ρ ich = 1/n für alle ich und K = du wie im gut gemischten Fall.

(a) Für eine gut gemischte Population, dargestellt durch einen vollständigen Graphen mit einheitlichen Kantengewichten, hat eine neutrale Mutation eine 1/n Möglichkeit der Fixierung, wo n ist die Bevölkerungszahl. Daraus folgt, dass die Rate K der neutralen Substitution in der Bevölkerung entspricht der Rate du der neutralen Mutation bei Individuen. (b) Dasselbe Ergebnis gilt für räumliche Strukturen, bei denen jeder Standort a priori identisch ist, wie z. B. der Zyklus mit einheitlichen Kantengewichten.

Eine asymmetrische Raumstruktur kann jedoch zu schnelleren (K > du) oder langsamer (K < du) molekulare Taktraten als eine gut gemischte Population, wie in Abb. 3 gezeigt. Aus Gl. (2) und (4) können wir sehen, dass K > du entspricht der Bedingung d ρ ¯ > d ‾ ρ ‾ , wobei die Balken Durchschnittswerte über . anzeigen ich = 1, …, n. Das bedeutet, dass die molekulare Uhr genau dann beschleunigt wird, wenn D ich und ρ ich sind über Standorte positiv korreliert, das heißt, wenn und nur wenn eine positive räumliche Korrelation zwischen dem Eintreffen neuer Mutationen und ihrem Erfolg besteht.

Dies liegt daran, dass sich die Häufigkeit von Mutationen und die Wahrscheinlichkeit der Fixierung von Ort zu Ort unterscheiden. Umsatzraten werden durch Färbung angezeigt, wobei Rot häufigem Umsatz und folglich häufiger Mutation entspricht. (a) Ein Stern besteht aus einer Nabe und n Blätter, so dass die Populationsgröße n = n+1. Kantengewichte werden so gewählt, dass die Geburtenraten einheitlich sind (B ich = 1 für alle ich). Lösen von Gl. (1)–(2) erhalten wir ortsspezifische Fixationswahrscheinlichkeiten von ρ h = 1/(1+n 2 und ρ L = n/(1+n 2) für die Nabe bzw. jedes Blatt. Aus Gl. (4) ist die molekulare Taktrate K = 2 n 1 + n 2 u , was gleich du zum n = 1 und ist kleiner als du zum n ≥ 2. Somit verlangsamt die Sternstruktur die Rate der neutralen Substitution in Übereinstimmung mit Ergebnis 3. Intuitiv tritt die Verlangsamung auf, weil Mutationen mit größerer Wahrscheinlichkeit an der Nabe auftreten, wo ihre Chancen auf eine Fixierung verringert sind. (b) Eine eindimensionale Population mit Selbstersetzung nur in Standort 1. Lösen von Gl. (1)–(2) finden wir ρ 1 = 8 15 , ρ 2 = 4 15 , ρ 3 = 2 15 und ρ 4 = 1 15 . (Die Zweierpotenzen entstehen, weil in die eine Richtung doppelt so viel Genfluss stattfindet wie in die andere.) Aus Gl. (4), die molekulare Uhr ist K = 16 13 u > u , also wird die molekulare Uhr in diesem Fall beschleunigt.

Diese Ergebnisse führten uns dazu, allgemeine Bedingungen für die räumliche Struktur zu suchen, die zu schnelleren, langsameren oder gleichen molekularen Taktraten wie eine gut gemischte Population führen. Wir finden zuerst

Ergebnis 1. Wenn die Sterberaten dich über alle Seiten konstant sind i = 1, …, N, dann ρ = 1/N, und folglich K = u.

Somit wird die molekulare Taktrate von der räumlichen Struktur nicht beeinflusst, wenn jede Stelle mit der gleichen Rate ersetzt wird ( 4a ). Dieses Ergebnis kann man erkennen, wenn man feststellt, dass wenn die D ich sind ständig über ich, dann folgt aus ∑ i = 1 N d i = B D ich = B/n für jeden ich. Einsetzen in Gl. (3) ergibt ρ = 1/n.

(a) Unser Ergebnis 1 besagt, dass die molekulare Uhr die gleiche Geschwindigkeit hat wie in einer gut gemischten Population, K = du, wenn die Umsatzrate D ich ist standortübergreifend einheitlich, wie in diesem Beispiel (D ich = 0,2 für alle ich). (b) Ergebnis 2 besagt, dass ρ ich = 1/n für alle ich—wieder impliziert K = du—wenn und nur wenn jeder Standort eine Geburtenrate gleich der Sterberate hat, B ich = D ich für alle ich, wie in diesem Beispiel. Knoten werden entsprechend ihrer Umschlagshäufigkeit eingefärbt D ich.

Eine andere Bedingung, die zu führt K = du ist das Folgende:

Ergebnis 2. Entspricht die Geburtenrate der Sterberate an jedem Standort (bich = dich für alle i = 1, …, N), dann ist ρ = 1/N und folglich K = u. Außerdem, bich = dich für alle i = 1, …, N genau dann, wenn die Fixationswahrscheinlichkeit an jedem Standort gleich ist (ρich = 1/N für alle i = 1, …, N).

Wenn also Geburten und Todesfälle an jeder Stelle ausgeglichen sind, bieten alle Stellen die gleiche Chance für die Mutantenfixierung ( 4b ). In diesem Fall ist die molekulare Uhr wieder unverändert gegenüber dem Grundlinienwert. Insbesondere wenn die Streuung in dem Sinne symmetrisch ist, dass e ij = e ji für alle ich und J dann K = du. Ergebnis 2 kann durch Ersetzen erhalten werden ρ ich = 1/n für alle ich in Gl. (1) und vereinfachend zu erhalten B ich = D ich für alle ich (Details in Methoden). Alternativ kann Ergebnis 2 als Korollar zum Zirkulationssatz von Lieberman et al. [23].

Unser drittes Ergebnis zeigt eine “Geschwindigkeitsgrenze” zur neutralen Entwicklung bei konstanten Geburtenraten:

Ergebnis 3. Wenn die Geburtenraten bich sind über alle Standorte konstant i = 1, …, N, dann ρ ≤ 1/N, und folglich K ≤ u, mit Gleichheit genau dann, wenn die Sterberaten dich sind auch über Seiten konstant.

Mit anderen Worten, eine Kombination aus einheitlichen Geburtenraten und uneinheitlichen Sterberaten verlangsamt die molekulare Uhr. Ein Beispiel dieser Verlangsamung ist in Fig. 3a gezeigt. Intuitiv sind die Orte, an denen Mutationen am häufigsten auftreten, solche mit hohen Sterberaten D ich Aufgrund dieser hohen Sterblichkeitsraten bieten diese Stellen insgesamt eine verringerte Chance auf eine Fixierung. Der Beweis dieses Ergebnisses ist jedoch wesentlich komplizierter, als diese Intuition vermuten lässt (siehe Methoden).

Schließlich untersuchen wir den gesamten Bereich möglicher Werte für K ohne Einschränkungen bei Geburten- und Sterberaten. Wir finden folgendes:

Ergebnis 4. Für eine beliebige räumliche Bevölkerungsstruktur (keine Einschränkungen für eij) die Fixationswahrscheinlichkeit kann jeden Wert annehmen 0 ≤ ρ < 1 und folglich kann die molekulare Uhr jede beliebige Geschwindigkeit annehmen 0 ≤ K < Nu.

Dieses Ergebnis ist insofern überraschend, als es impliziert, dass die Wahrscheinlichkeit der Fixierung einer neuen Mutation beliebig nahe an Eins kommen kann. Ergebnis 4 kann durch Betrachtung der in Abb. 5 dargestellten hypothetischen Raumstruktur belegt werden. Jeder nicht negative Wert von ρ weniger als 1 kann durch geeignete Wahl der Parameter erreicht werden (Details in Methoden).

Dies wird durch die Betrachtung einer Populationsstruktur mit unidirektionalem Genfluss von einem Hub (H) nach belegt n𢄡 Blätter (L). Bei Mutationen, die in der Nabe entstehen, ist die Fixierung gewährleistet (ρ h = 1) und unmöglich für diejenigen, die in Blättern entstehen (ρ L = 0). Die Gesamtfixationswahrscheinlichkeit ist nach Gl. (3) zur Umschlagshäufigkeit am Hub: ρ = D h = 1−(n𢄡)ein. Die molekulare Taktrate ist daher K = Nuρ = n[1−(n𢄡)ein]du. Es folgt dem K > du dann und nur dann, wenn ein < 1/n. Intuitiv wird die molekulare Uhr beschleunigt, wenn der Hub mehr Umsatz (und damit mehr Mutationen) erfährt als die anderen Stellen. Jeder Wert von ρ größer oder gleich 0 und kleiner 1 kann durch entsprechende positive Wahl von erreicht werden ein kleiner oder gleich 1/(n𢄡). Zum ein = 1/(n𢄡) wir haben K = 0, da Mutationen nur an den Blättern entstehen, wo keine Fixierungsmöglichkeit besteht. Im entgegengesetzten Extrem, im Limit ein → 0, wir haben KNu.

Anwendung auf vor- und nachgelagerte Populationen

Um die Auswirkungen der asymmetrischen Dispersion auf die molekulare Uhr zu veranschaulichen, betrachten wir eine hypothetische Population mit zwei Subpopulationen, die mit “upstream” und 𠇍ownstream” bezeichnet sind ( Abb. 6 ). Die Größen dieser Teilpopulationen sind beschriftet n und n , bzw. Jede Subpopulation ist gut gemischt, mit Ersetzungswahrscheinlichkeiten e für jedes Paar von Upstream-Sites und e für jedes Paar von stromabwärts gelegenen Standorten. Die Streuung zwischen den Teilpopulationen wird durch die Ersetzungswahrscheinlichkeiten dargestellt e von jedem vorgelagerten Standort zu jedem nachgelagerten Standort und e von jedem stromabwärts gelegenen Standort zu jedem stromaufwärts gelegenen Standort. Wir nehmen an, dass es einen Netto-Genfluss stromabwärts gibt, so dass e > e .

Jede Subpopulation ist gut gemischt. Die Ersatzwahrscheinlichkeit e ij gleich e wenn Seiten ich und J sind beide stromaufwärts, e wenn ich und J sind beide stromabwärts, e wenn ich ist stromaufwärts und J ist stromabwärts, und e wenn ich ist stromabwärts und J ist stromaufwärts. Wir nehmen an, dass es einen Netto-Genfluss stromabwärts gibt, so dass e > e . Wir finden, dass die molekulare Uhr im Vergleich zum gut gemischten Fall genau dann beschleunigt wird, wenn die stromaufwärts gelegene Subpopulation mehr Umsatz erfährt als die stromabwärts gelegene Subpopulation: K > du dann und nur dann, wenn D > D .

Lösen von Gl. (1)–(2) stellen wir fest, dass die Fixierungswahrscheinlichkeiten von jedem stromaufwärts gelegenen Standort bzw. jedem stromabwärts gelegenen Standort

Diese Fixationswahrscheinlichkeiten wurden zuvor für ein anderes Modell einer unterteilten Population entdeckt [40]. Einsetzen dieser Fixationswahrscheinlichkeiten in Gl. (4) ergibt die molekulare Taktrate:

Über, D und D sind die Umsatzraten in den vor- bzw. nachgelagerten Populationen und B = n D +n D ist die Gesamtgeburtenrate pro Zeitschritt. In Methoden zeigen wir, dass K > du dann und nur dann, wenn D > D das heißt, die molekulare Uhr wird genau dann beschleunigt, wenn in der Upstream-Population mehr Umsatz stattfindet als in der Downstream-Population.

Im Falle eines unidirektionalen Genflusses, e = 0, die molekulare Taktrate ist einfach K = (D /B)Nu. Die Quantität D /B stellt die relative Fluktuationsrate in der Upstream-Population dar und kann jeden Wert im Bereich 0 ≤ . annehmen D /B < 1/n daher K nimmt Werte im Bereich 0 an ≤ K < (n/n )du. Wir bemerken, dass die obere Schranke von K ist umgekehrt proportional zur Größe n der Upstream-Bevölkerung. Die größtmöglichen Werte von K werden erreicht, wenn n = 1, in welchem ​​Fall K kann beliebig nahe kommen Nu. Diese Grenzen gelten auch, wenn es mehrere stromabwärts gelegene Subpopulationen gibt, da beim unidirektionalen Genfluss die räumliche Anordnung der stromabwärts gelegenen Stellen die molekulare Taktrate nicht beeinflusst. Insbesondere wenn Nabe und Blätter in Abb. 5 jeweils durch gut gemischte Subpopulationen ersetzt werden, dann K ist oben begrenzt durch (n/n h)du, wo n h ist die Größe der Hub-Subpopulation.

Anwendung auf Epithelzellpopulationen

Unsere Ergebnisse sind auch auf die somatische Evolution in sich selbst erneuernden Zellpopulationen, wie den kryptenähnlichen Strukturen des Darms, übertragbar. Neuartige Markierungstechniken haben gezeigt, dass sich neutrale Mutationen in Darmkrypten mit einer konstanten Rate über die Zeit ansammeln [41]. Die Zellpopulation in jeder Krypta wird durch eine kleine Anzahl von Stammzellen aufrechterhalten, die sich am Kryptenboden befinden und sich ständig stochastisch ersetzen ( Abb. 7 [42�]). Wir konzentrieren uns auf den proximalen Dünndarm bei Mäusen, für den neuere Studien [41, 45] darauf hindeuten, dass es pro Krypta ∼ 5 aktive Stammzellen gibt, die jeweils 0,1-mal pro Tag durch einen ihrer beiden Nachbarn ersetzt werden. In unserem Rahmen entspricht dies einer zyklusstrukturierten Population der Größe 5 mit Austauschraten von 0,05/Tag zwischen Nachbarn, so dass D ich = 0,1/Tag für alle ich.

Eine kleine Anzahl von Stammzellen (n ∼ 5) befinden sich am Boden der Darmgruft und werden nach und nach ersetzt D ∼ 0,1 pro Stammzelle pro Tag. Empirische Ergebnisse [41, 45] legen eine Zyklenstruktur für Stammzellen nahe. Um die richtige Austauschrate zu erreichen, setzen wir e ij = 0,05/Tag für jedes benachbarte Paar. Stammzellen in einer einzelnen Krypta ersetzen eine viel größere Anzahl von Vorläufer- und differenzierten Zellen (∼ 250 [46]). Diese nachgeschalteten Vorläufer- und differenzierten Zellen werden etwa täglich ersetzt [46]. Die hierarchische Organisation der Darmkrypten, kombiniert mit der geringen Umsatzrate von Stammzellen, begrenzt die Rate neutraler genetischer Substitutionen ( K ˜ ≈ 0,1 u Substitutionen pro Tag), da nur Mutationen, die in Stammzellen auftreten, fixieren können.

Nur Mutationen, die in Stammzellen auftreten, können in einer Krypta fixiert werden, daher müssen wir nur die Fixierungswahrscheinlichkeiten und Umsatzraten zwischen Stammzellen berücksichtigen. Durch Symmetrie zwischen den Stammzellen, ρ ich = 1/5 für jede der fünf Stammzellstellen. Die molekulare Taktrate ist daher K ˜ = u ∑ i = 1 5 d i ρ i = 0 . 1 U Auswechslungen pro Tag. Dies stimmt mit dem empirischen Befund überein, dass für einen neutralen genetischen Marker mit Mutationsrate du ≈ 1,1휐 𢄤 , Substitutionen akkumulieren mit einer Rate K ˜ ≈ 1,1 × 10 − 5 pro Krypta pro Tag [41].

Begrenzt die Kryptenarchitektur die Rate genetischer Veränderungen im Darmgewebe? Darmkrypten bei Mäusen enthalten ∼ 250 Zellen und ersetzen alle ihre Zellen etwa einmal täglich [46]. Wenn jede Krypta eine gut gemischte Population wäre, wäre die molekulare Taktrate K ˜ = B u / N ≈ u Substitutionen pro Tag. Somit verlangsamt die asymmetrische Struktur dieser epithelialen Krypten die Rate der neutralen genetischen Substitution um das Zehnfache.

Antrag auf Verbreitung von Ideen

Unsere Ergebnisse lassen sich auch auf Ideen übertragen, die sich durch Nachahmung in sozialen Netzwerken verbreiten. In diesem Kontext entspricht eine Mutation einer neuen Idee, die möglicherweise eine etablierte ersetzen könnte. Neutralität bedeutet, dass alle Ideen mit gleicher Wahrscheinlichkeit nachgeahmt werden.

Um zu untersuchen, ob menschliche soziale Netzwerke die Rate der Ideensubstitution beschleunigen oder verlangsamen, haben wir 973 Twitter-Netzwerke aus der Stanford Large Network Dataset Collection analysiert [47]. Jedes dieser 𠇎go” repräsentiert Follower-Beziehungen zwischen denen, denen eine einzelne 𠇎go”-Person folgt (die selbst nicht im Netzwerk enthalten ist). Wir haben die Links in jedem Netzwerk so ausgerichtet, dass sie von Follower zu Follower zeigen, entsprechend der vermuteten Richtung des Informationsflusses. Selbstschleifen wurden entfernt. Um sicherzustellen, dass eine Fixierung möglich ist, haben wir Individuen, die über ausgehende Links nicht erreichbar waren, aus dem Knoten mit der größten Eigenvektor-Zentralität eliminiert. Die resultierenden Netzwerke variierten in der Größe von 3 bis 241 Knoten.

Um die Verbreitung von Ideen in diesen Netzwerken zu modellieren, setzen wir e ij = 1/L wenn J folgt ich und null andernfalls, wobei L ist die Gesamtzahl der Links. Dies kann instanziiert werden, indem angenommen wird, dass bei jedem Zeitschritt eine Followe-Follower-Verbindung mit gleichförmiger Wahrscheinlichkeit gewählt wird. Der Follower übernimmt entweder die Idee des Followers mit Wahrscheinlichkeit 1−du, oder erfindet mit Wahrscheinlichkeit Innovationen, um eine neue Idee zu schaffen du, wo du ≪ 1. Unter diesen Annahmen ist die resultierende Rate der Ideensubstitution (als Vielfaches von du) hängt nur von der Netztopologie ab und nicht von anderen Parametern.

Wir haben festgestellt, dass der Mittelwert von K unter diesen Ego-Netzwerken ist 0,557du, mit einer Standardabweichung von 0,222du. 19 der 973 Netzwerke (2%) haben K > du. Zwei Netzwerke haben K = du genau jede davon hat n = 3 Knoten und einheitlicher In-Grad D ich, daher K = du folgt aus Ergebnis 1 für diese Netzwerke. Wir fanden eine schwache, aber statistisch signifikante negative Beziehung zwischen der Netzwerkgröße n und Wert K/du (Steigung ≈ 𢄠.00164 mit 95 % Konfidenzintervall (𢄠.0023, 𢄠.001) basierend auf der Bootstrap-Methode R ≈ 𢄠.45). Diese negative Beziehung bleibt auch dann bestehen, wenn kleine Netzwerke mit weniger als 10 Knoten entfernt werden (Steigung ≈ 𢄠.00156 mit 95 %-Konfidenzintervall (𢄠.0023, 𢄠.0009) R ≈ 𢄠.43). Zusammenfassend lässt sich sagen, dass einige Twitter-Ego-Netzwerke zwar die Substitution neutraler Innovationen beschleunigen, die überwiegende Mehrheit jedoch diese Geschwindigkeit verlangsamt (Abb. ​ (Abb. 8 8 und ​ und 9 9 ).

(a𠄾) Fünf der 973 analysierten Netzwerke, einschließlich derer mit (a) dem größten Wert von K, (b) der kleinste Wert von K, und (c) die wenigsten Knoten. (f) Ein Streudiagramm von K/du gegen n zeigt eine schwach negative Korrelation (Steigung ≈ 𢄠.00164 mit 95 % Konfidenzintervall (𢄠.0023, 𢄠.001) basierend auf der Bootstrap-Methode R ≈ 𢄠.45). Die farbigen Punkte im Streudiagramm entsprechen den in (a𠄾) gezeigten Netzwerken. Die gestrichelte Linie entspricht K/du = 1, oberhalb dessen die Netzwerktopologie die neutrale Substitution beschleunigt.

Netzwerkstruktur beschleunigt Ideensubstitution (K > du) genau dann, wenn eine positive räumliche Korrelation zwischen der Generierung neuer Ideen besteht (die für unser Modell proportional zur Rate auftritt D ich eingehender Ideen) und die Wahrscheinlichkeit der Fixierung ρ ich. Die Felder (a) und (b) zeigen die Netzwerke mit den langsamsten (K ≈ 0,667du) und schnellste (K ≈ 1.085du) jeweils Raten der Ideensubstitution zwischen Netzwerken der Größe 13. Die Färbung der Knoten entspricht ihrer Umsatzrate D ich, wobei wärmere Farben auf einen schnelleren Umsatz hinweisen. Die Größe der Knoten entspricht ihrer Fixationswahrscheinlichkeit ρ ich.

Eine mögliche Erklärung für die Seltenheit von Netzwerken, die die Ideensubstitution beschleunigen, hat mit dem intrinsischen Zusammenhang zwischen den Fluktuationsraten zu tun D ich und die ortsspezifischen Fixationswahrscheinlichkeiten ρ ich. Aus Gl. (1), wir sehen das ρ ich kann als das Produkt ( 1 / d i ) × ( ∑ j = 1 N e i j ρ j ) geschrieben werden , wobei der erste Faktor als die 𠇊ttention span” des Knotens interpretiert werden kann ich und die zweite kann als ihr Einfluss interpretiert werden. Obwohl diese beiden Faktoren nicht streng unabhängig voneinander sind, würden wir in unserem Twitter-Netzwerkensemble nicht unbedingt eine systematische Beziehung zwischen ihnen erwarten. In Ermangelung einer solchen Beziehung ρ ich ist umgekehrt verwandt mit D ich, was impliziert K < du. Mit anderen Worten, die fruchtbarsten Knoten (in Bezug auf die Generierung neuer Ideen) sind auch die launischsten (in Bezug auf die Übernahme der Ideen anderer), sodass viele neue Ideen sofort nach ihrer Entstehung aufgegeben werden. Dieses heuristische Argument legt nahe, dass K > du, obwohl möglich, kann in Netzwerken, die aus statistischen oder probabilistischen Ensembles stammen, ein seltenes Vorkommen sein.


Inhalt

Der Prozess der genetischen Drift kann anhand von 20 Murmeln in einem Glas veranschaulicht werden, um 20 Organismen in einer Population darzustellen. [8] Betrachten Sie dieses Glas mit Murmeln als die Ausgangspopulation. Die Hälfte der Murmeln im Glas ist rot und die andere Hälfte blau, wobei jede Farbe einem anderen Allel eines Gens in der Population entspricht. In jeder neuen Generation vermehren sich die Organismen zufällig. Um diese Reproduktion darzustellen, wählen Sie zufällig eine Murmel aus dem Originalglas aus und legen Sie eine neue Murmel mit der gleichen Farbe in ein neues Glas. Dies ist der "Nachkomme" des ursprünglichen Marmors, was bedeutet, dass der ursprüngliche Marmor in seinem Glas verbleibt. Wiederholen Sie diesen Vorgang, bis sich 20 neue Murmeln im zweiten Glas befinden. Das zweite Glas enthält nun 20 "Nachkommen" oder Murmeln in verschiedenen Farben. Sofern das zweite Glas nicht genau 10 rote Murmeln und 10 blaue Murmeln enthält, ist eine zufällige Verschiebung der Allelfrequenzen aufgetreten.

Wenn dieser Vorgang mehrmals wiederholt wird, schwankt die Anzahl der roten und blauen Murmeln, die jede Generation ausgewählt wird. Manchmal hat ein Glas mehr rote Murmeln als sein "Eltern"-Glas und manchmal mehr blaue. Diese Fluktuation ist analog zur genetischen Drift – einer Veränderung der Allelfrequenz der Population, die aus einer zufälligen Variation der Alleleverteilung von einer Generation zur nächsten resultiert.

Es ist sogar möglich, dass in einer Generation keine Murmeln einer bestimmten Farbe gewählt werden, also keine Nachkommen haben. Wenn in diesem Beispiel keine roten Murmeln ausgewählt wurden, enthält das Glas, das die neue Generation darstellt, nur blaue Nachkommen. In diesem Fall ist das rote Allel dauerhaft in der Population verloren gegangen, während das verbleibende blaue Allel fest geworden ist: Alle zukünftigen Generationen sind vollständig blau. In kleinen Populationen kann die Fixierung in nur wenigen Generationen erfolgen.

Die Mechanismen der genetischen Drift lassen sich an einem vereinfachten Beispiel veranschaulichen. Betrachten Sie eine sehr große Bakterienkolonie, die in einem Tropfen Lösung isoliert ist. Die Bakterien sind bis auf ein einziges Gen mit zwei markierten Allelen genetisch identisch EIN und B. EIN und B sind neutrale Allele, was bedeutet, dass sie die Fähigkeit der Bakterien, zu überleben und sich zu vermehren, nicht beeinträchtigen, alle Bakterien in dieser Kolonie haben die gleiche Wahrscheinlichkeit zu überleben und sich zu vermehren. Angenommen, die Hälfte der Bakterien hat Allel EIN und die andere Hälfte hat Allel B. Daher EIN und B haben jeweils die Allelfrequenz 1/2.

Der Lösungstropfen schrumpft dann, bis er nur noch genug Nahrung hat, um vier Bakterien zu ernähren. Alle anderen Bakterien sterben ab, ohne sich zu vermehren. Unter den vier Überlebenden gibt es sechzehn mögliche Kombinationen für die EIN und B Allele:

Da alle Bakterien in der ursprünglichen Lösung mit gleicher Wahrscheinlichkeit überleben, wenn die Lösung schrumpft, sind die vier Überlebenden eine Zufallsprobe aus der ursprünglichen Kolonie. Die Wahrscheinlichkeit, dass jeder der vier Überlebenden ein gegebenes Allel hat, ist 1/2, und daher ist die Wahrscheinlichkeit, dass eine bestimmte Allelkombination auftritt, wenn die Lösung schrumpft,

(Die ursprüngliche Populationsgröße ist so groß, dass die Stichprobenziehung effektiv mit Ersatz erfolgt). Mit anderen Worten, jede der sechzehn möglichen Allelkombinationen tritt mit gleicher Wahrscheinlichkeit mit einer Wahrscheinlichkeit von 1/16 auf.

Zählen der Kombinationen mit der gleichen Anzahl von EIN und B, erhalten wir die folgende Tabelle.

EIN B Kombinationen Wahrscheinlichkeit
4 0 1 1/16
3 1 4 4/16
2 2 6 6/16
1 3 4 4/16
0 4 1 1/16

Wie in der Tabelle gezeigt, ist die Gesamtzahl der Kombinationen mit der gleichen Anzahl von EIN Allele ab B Allele ist sechs, und die Wahrscheinlichkeit dieser Kombination ist 6/16. Die Gesamtzahl der anderen Kombinationen ist zehn, also die Wahrscheinlichkeit einer ungleichen Anzahl von EIN und B Allele ist 10/16. Obwohl die ursprüngliche Kolonie mit einer gleichen Anzahl von EIN und B Allele ist es sehr wahrscheinlich, dass die Anzahl der Allele in der verbleibenden Population von vier Mitgliedern nicht gleich ist. Gleiche Zahlen sind tatsächlich weniger wahrscheinlich als ungleiche Zahlen. Im letzteren Fall ist eine genetische Drift aufgetreten, weil sich die Allelfrequenzen der Population durch Zufallsstichproben verändert haben. In diesem Beispiel schrumpfte die Population auf nur vier zufällige Überlebende, ein Phänomen, das als Populationsengpass bekannt ist.

Die Wahrscheinlichkeiten für die Anzahl der Kopien des Allels EIN (oder B), die überleben (in der letzten Spalte der obigen Tabelle angegeben), können direkt aus der Binomialverteilung berechnet werden, wobei die "Erfolgswahrscheinlichkeit" (Wahrscheinlichkeit, dass ein gegebenes Allel vorhanden ist) 1/2 ist (d. h. die Wahrscheinlichkeit, dass es k Kopien von EIN (oder B) Allele in der Kombination) ist gegeben durch

wo n=4 ist die Anzahl der überlebenden Bakterien.

Mathematische Modelle der genetischen Drift können entworfen werden, indem entweder Verzweigungsprozesse oder eine Diffusionsgleichung verwendet werden, die Veränderungen der Allelfrequenz in einer idealisierten Population beschreibt. [9]

Wright-Fisher-Modell Bearbeiten

Betrachten Sie ein Gen mit zwei Allelen, EIN oder B. In diploiden Populationen bestehend aus n Einzelpersonen gibt es 2n Kopien jedes Gens. Ein Individuum kann zwei Kopien desselben Allels oder zwei verschiedene Allele haben. Wir können die Frequenz eines Allels nennen P und die Frequenz der anderen Q. Das Wright-Fisher-Modell (benannt nach Sewall Wright und Ronald Fisher) geht davon aus, dass sich Generationen nicht überschneiden (zum Beispiel haben einjährige Pflanzen genau eine Generation pro Jahr) und dass jede Kopie des in der neuen Generation gefundenen Gens unabhängig voneinander zufällig gezogen wird von allen Kopien des Gens in der alten Generation. Die Formel zur Berechnung der Wahrscheinlichkeit, zu erhalten k Kopien eines Allels mit Häufigkeit P in der letzten Generation ist dann [10] [11]

wo das Symbol "!" bezeichnet die Fakultätsfunktion. Dieser Ausdruck kann auch mit dem Binomialkoeffizienten formuliert werden,

Moran-Modell Bearbeiten

Das Moran-Modell geht von überlappenden Generationen aus. Bei jedem Zeitschritt wird ein Individuum zur Fortpflanzung und ein Individuum zum Sterben ausgewählt. In jedem Zeitschritt kann die Anzahl der Kopien eines gegebenen Allels also um eins steigen, um eins sinken oder gleich bleiben. Dies bedeutet, dass die Übergangsmatrix tridiagonal ist, was bedeutet, dass mathematische Lösungen für das Moran-Modell einfacher sind als für das Wright-Fisher-Modell. Andererseits sind Computersimulationen mit dem Wright-Fisher-Modell in der Regel einfacher durchzuführen, da weniger Zeitschritte berechnet werden müssen. Beim Moran-Modell dauert es n Zeitschritte, um eine Generation zu überstehen, wo n ist die effektive Populationsgröße. Beim Wright-Fisher-Modell braucht es nur einen. [12]

In der Praxis liefern das Moran- und das Wright-Fisher-Modell qualitativ ähnliche Ergebnisse, aber die genetische Drift verläuft im Moran-Modell doppelt so schnell.

Andere Modelle von Drift Bearbeiten

Wenn die Varianz in der Anzahl der Nachkommen viel größer ist als die, die durch die vom Wright-Fisher-Modell angenommene Binomialverteilung gegeben ist, dann ist die genetische Drift bei der gleichen Gesamtgeschwindigkeit der genetischen Drift (der Varianz der effektiven Populationsgröße) eine weniger starke Kraft im Vergleich zur Auswahl. [13] Selbst bei gleicher Varianz wird die Kraft der genetischen Drift wieder deutlich geschwächt, wenn höhere Momente der Nachkommenzahlverteilung die der Binomialverteilung überschreiten. [14]

Zufällige Effekte außer Sampling-Fehler Bearbeiten

Zufällige Änderungen der Allelfrequenzen können auch durch andere Effekte als den Stichprobenfehler verursacht werden, beispielsweise durch zufällige Änderungen des Selektionsdrucks. [fünfzehn]

Eine wichtige alternative Quelle der Stochastik, vielleicht wichtiger als die genetische Drift, ist der genetische Entwurf. [16] Genetischer Entwurf ist die Wirkung auf einen Locus durch Selektion auf verknüpfte Loci. Die mathematischen Eigenschaften des genetischen Entwurfs unterscheiden sich von denen der genetischen Drift. [17] Die Richtung der zufälligen Änderung der Allelfrequenz ist über Generationen hinweg autokorreliert. [2]

Das Hardy-Weinberg-Prinzip besagt, dass in ausreichend großen Populationen die Allelfrequenzen von einer Generation zur nächsten konstant bleiben, es sei denn, das Gleichgewicht wird durch Migration, genetische Mutationen oder Selektion gestört. [18]

In endlichen Populationen werden jedoch keine neuen Allele aus der Zufallsstichprobe von Allelen gewonnen, die an die nächste Generation weitergegeben werden, aber die Stichprobe kann dazu führen, dass ein vorhandenes Allel verschwindet. Da Zufallsstichproben ein Allel entfernen, aber nicht ersetzen können und weil zufällige Abnahmen oder Zunahmen der Allelfrequenz die erwarteten Allelverteilungen für die nächste Generation beeinflussen, treibt die genetische Drift eine Population im Laufe der Zeit zu einer genetischen Einheitlichkeit. Wenn ein Allel eine Häufigkeit von 1 (100%) erreicht, wird es in der Population als "fixiert" bezeichnet, und wenn ein Allel eine Häufigkeit von 0 (0%) erreicht, geht es verloren. Kleinere Populationen erreichen eine schnellere Fixierung, während im Grenzbereich einer unendlichen Population keine Fixierung erreicht wird. Sobald ein Allel fixiert ist, kommt die genetische Drift zum Stillstand, und die Allelfrequenz kann sich nicht ändern, es sei denn, ein neues Allel wird durch Mutation oder Genfluss in die Population eingeführt. Auch wenn die genetische Drift ein zufälliger, richtungsloser Prozess ist, dient sie der Eliminierung der genetischen Variation im Laufe der Zeit. [19]

Rate der Allelfrequenzänderung aufgrund von Drift Bearbeiten

Angenommen, genetische Drift ist die einzige evolutionäre Kraft, die auf ein Allel einwirkt, nachdem T Generationen in vielen replizierten Populationen, beginnend mit Allelfrequenzen von P und Q, ist die Varianz der Allelfrequenz in diesen Populationen

Zeit bis zur Fixierung oder zum Verlust Bearbeiten

Unter der Annahme, dass genetische Drift die einzige evolutionäre Kraft ist, die auf ein Allel einwirkt, ist die Wahrscheinlichkeit, dass ein Allel schließlich in der Population fixiert wird, einfach seine Häufigkeit in der Population zu einem bestimmten Zeitpunkt. [21] Wenn beispielsweise die Frequenz P für Allel EIN beträgt 75% und die Häufigkeit Q für Allel B beträgt 25%, dann ist bei unbegrenzter Zeit die Wahrscheinlichkeit EIN sich letztendlich in der Grundgesamtheit festsetzen wird 75 % und die Wahrscheinlichkeit, dass B fest wird, beträgt 25 %.

Die erwartete Anzahl von Generationen für das Auftreten einer Fixierung ist proportional zur Populationsgröße, so dass die Fixierung in kleineren Populationen voraussichtlich viel schneller auftritt. [22] Normalerweise wird die effektive Populationsgröße verwendet, die kleiner ist als die Gesamtpopulation, um diese Wahrscheinlichkeiten zu bestimmen. Die effektive Bevölkerung (ne) berücksichtigt Faktoren wie den Grad der Inzucht, das Stadium des Lebenszyklus, in dem die Population am kleinsten ist, und die Tatsache, dass einige neutrale Gene genetisch mit anderen selektionierten Genen verbunden sind. [13] Die effektive Populationsgröße ist möglicherweise nicht für jedes Gen in derselben Population gleich. [23]

Eine zukunftsweisende Formel, die verwendet wird, um die erwartete Zeit, bis ein neutrales Allel durch genetische Drift fixiert wird, nach dem Wright-Fisher-Modell zu approximieren, ist

wo T ist die Anzahl der Generationen, ne die effektive Populationsgröße ist und P ist die Anfangshäufigkeit für das gegebene Allel. Das Ergebnis ist die Anzahl der Generationen, die voraussichtlich vergehen, bevor die Fixierung für ein gegebenes Allel in einer Population mit gegebener Größe eintritt (ne) und Allelfrequenz (P). [24]

Die erwartete Zeit für den Verlust des neutralen Allels durch genetische Drift kann berechnet werden als [10]

Wenn eine Mutation nur einmal in einer Population auftritt, die groß genug ist, um die anfängliche Häufigkeit zu vernachlässigen, können die Formeln vereinfacht werden zu [25]

für die durchschnittliche Anzahl von Generationen, die vor der Fixierung einer neutralen Mutation erwartet werden, und

für die durchschnittliche Anzahl von Generationen, die vor dem Verlust einer neutralen Mutation erwartet werden. [26]

Zeit zu verlieren mit Drift und Mutation Bearbeiten

Die obigen Formeln gelten für ein Allel, das bereits in einer Population vorhanden ist und weder einer Mutation noch einer natürlichen Selektion unterliegt. Wenn ein Allel durch Mutation viel häufiger verloren geht als durch Mutation gewonnen wird, können sowohl die Mutation als auch die Drift die Zeit bis zum Verlust beeinflussen. Wenn das Allel, das für Mutationsverlust anfällig ist, in der Population als fixiert beginnt und durch Mutation mit der Rate m pro Replikation verloren geht, dann wird die erwartete Zeit in Generationen bis zu seinem Verlust in einer haploiden Population angegeben durch

wobei γ die Eulersche Konstante ist. [27] Die erste Näherung stellt die Wartezeit bis zur ersten Mutante dar, die zum Verlust bestimmt ist, wobei der Verlust dann durch genetische Drift relativ schnell auftritt und Zeit benötigt ne ≪ 1/m. Die zweite Näherung stellt die Zeit dar, die für den deterministischen Verlust durch Mutationsakkumulation benötigt wird. In beiden Fällen wird die Zeit bis zur Fixierung von der Mutation über den Begriff 1/ dominiert.m, und wird weniger von der effektiven Populationsgröße beeinflusst.

In natürlichen Populationen wirken genetische Drift und natürliche Selektion nicht isoliert, beide Phänomene sind zusammen mit Mutation und Migration immer im Spiel. Neutrale Evolution ist das Produkt von Mutation und Drift, nicht allein Drift. Auch wenn die Selektion die genetische Drift überwältigt, kann sie nur auf die Variation wirken, die die Mutation bietet.

Während die natürliche Selektion eine Richtung hat und die Evolution zu erblichen Anpassungen an die aktuelle Umwelt führt, hat die genetische Drift keine Richtung und wird nur von der Mathematik des Zufalls geleitet. [28] Als Ergebnis wirkt sich die Drift auf die genotypischen Häufigkeiten innerhalb einer Population aus, ohne deren phänotypische Auswirkungen zu berücksichtigen. Im Gegensatz dazu begünstigt die Selektion die Verbreitung von Allelen, deren phänotypische Effekte das Überleben und/oder die Reproduktion ihrer Träger erhöhen, senkt die Häufigkeit von Allelen, die ungünstige Merkmale verursachen, und ignoriert diejenigen, die neutral sind. [29]

Das Gesetz der großen Zahlen sagt voraus, dass, wenn die absolute Kopienzahl des Allels klein ist (z. B. in kleinen Populationen), die Drift der Allelfrequenzen pro Generation größer ist. Die Größe der Drift ist groß genug, um die Selektion bei jeder Allelfrequenz zu überwältigen, wenn der Selektionskoeffizient kleiner als 1 dividiert durch die effektive Populationsgröße ist. Nicht-adaptive Evolution, die aus dem Produkt von Mutation und genetischer Drift resultiert, wird daher als Folgemechanismus evolutionärer Veränderungen vor allem innerhalb kleiner, isolierter Populationen angesehen. [30] Die Mathematik der genetischen Drift hängt von der effektiven Populationsgröße ab, aber es ist nicht klar, wie diese mit der tatsächlichen Anzahl von Individuen in einer Population zusammenhängt. [16] Die genetische Verknüpfung mit anderen Genen, die selektiert werden, kann die effektive Populationsgröße eines neutralen Allels reduzieren. Mit einer höheren Rekombinationsrate nimmt die Kopplung ab und damit auch dieser lokale Effekt auf die effektive Populationsgröße. [31] [32] Dieser Effekt ist in molekularen Daten als Korrelation zwischen lokaler Rekombinationsrate und genetischer Diversität [33] und negative Korrelation zwischen Gendichte und Diversität an nichtkodierenden DNA-Regionen sichtbar. [34] Stochastik, die mit der Verknüpfung mit anderen selektierten Genen verbunden ist, ist nicht dasselbe wie Stichprobenfehler und wird manchmal als genetischer Entwurf bezeichnet, um ihn von genetischer Drift zu unterscheiden. [16]

Wenn die Allelfrequenz sehr klein ist, kann die Drift die Selektion auch in großen Populationen überwältigen. Während beispielsweise nachteilige Mutationen in großen Populationen normalerweise schnell eliminiert werden, sind neue vorteilhafte Mutationen fast genauso anfällig für Verluste durch genetische Drift wie neutrale Mutationen. Erst wenn die Allelfrequenz für die vorteilhafte Mutation eine bestimmte Schwelle erreicht, hat die genetische Drift keine Wirkung. [29]

Ein Populationsengpass liegt vor, wenn eine Population aufgrund eines zufälligen Umweltereignisses innerhalb kurzer Zeit auf eine deutlich geringere Größe schrumpft. In einem echten Populationsengpass sind die Überlebenschancen eines jeden Mitglieds der Population rein zufällig und werden nicht durch einen bestimmten inhärenten genetischen Vorteil verbessert. Der Engpass kann zu radikalen Veränderungen der Allelfrequenzen führen, völlig unabhängig von der Selektion. [35]

Die Auswirkungen eines Bevölkerungsengpasses können nachhaltig sein, selbst wenn der Engpass durch ein einmaliges Ereignis wie eine Naturkatastrophe verursacht wird. Ein interessantes Beispiel für einen Engpass, der eine ungewöhnliche genetische Verteilung verursacht, ist der relativ hohe Anteil von Individuen mit totaler Stäbchen-Farbenblindheit (Achromatopsie) auf dem Pingelap-Atoll in Mikronesien. Nach einem Engpass nimmt die Inzucht zu. Dies erhöht den Schaden, der durch rezessive schädliche Mutationen verursacht wird, in einem Prozess, der als Inzuchtdepression bekannt ist. Gegen die schlimmsten dieser Mutationen wird in einem Prozess der Hintergrundselektion selektiert, was zum Verlust anderer genetisch mit ihnen verknüpfter Allele führt. [2] Bei rezessiven Schadmutationen kann diese Selektion als Folge des Engpasses durch genetische Säuberung verstärkt werden. Dies führt zu einem weiteren Verlust der genetischen Vielfalt. Darüber hinaus erhöht eine nachhaltige Verringerung der Populationsgröße die Wahrscheinlichkeit weiterer Allelschwankungen durch Drift in den kommenden Generationen.

Die genetische Variation einer Population kann durch einen Engpass stark reduziert werden, und sogar vorteilhafte Anpassungen können dauerhaft eliminiert werden. [36] Der Verlust an Variation macht die überlebende Population anfällig für neuen Selektionsdruck wie Krankheiten, Klimawandel oder Verschiebung der verfügbaren Nahrungsquelle, da die Anpassung an Umweltveränderungen eine ausreichende genetische Variation in der Population erfordert, damit eine natürliche Selektion erfolgen kann Platz. [37] [38]

In der jüngeren Vergangenheit sind viele Fälle von Bevölkerungsengpässen bekannt geworden. Vor der Ankunft der Europäer waren die nordamerikanischen Prärien Lebensraum für Millionen von Präriehühnern. Allein in Illinois sank ihre Zahl von etwa 100 Millionen Vögeln im Jahr 1900 auf etwa 50 Vögel in den 1990er Jahren. Der Bevölkerungsrückgang war auf die Jagd und die Zerstörung von Lebensräumen zurückzuführen, aber die Folge war ein Verlust des größten Teils der genetischen Vielfalt der Art. DNA-Analysen, die Vögel aus der Mitte des Jahrhunderts mit Vögeln in den 1990er Jahren vergleichen, dokumentieren einen starken Rückgang der genetischen Variation in den letzten Jahrzehnten. Derzeit erlebt das Große Präriehuhn einen geringen Fortpflanzungserfolg. [39]

Der durch Engpass und genetische Drift verursachte genetische Verlust kann jedoch die Fitness steigern, wie in Ehrlichia. [40]

Auch beim nördlichen See-Elefanten verursachte die Überjagung im 19. Ihr daraus resultierender Rückgang der genetischen Variation lässt sich aus einem Vergleich mit dem des südlichen See-Elefanten ableiten, der nicht so aggressiv bejagt wurde. [41]

Gründereffekt Bearbeiten

Der Gründereffekt ist ein Sonderfall eines Populationsengpasses, der auftritt, wenn sich eine kleine Gruppe in einer Population von der ursprünglichen Population abspaltet und eine neue bildet. Es wird erwartet, dass die Zufallsstichprobe von Allelen in der gerade gebildeten neuen Kolonie die ursprüngliche Population zumindest in gewisser Hinsicht grob falsch darstellt. [42] Es ist sogar möglich, dass die Anzahl der Allele für einige Gene in der Originalpopulation größer ist als die Anzahl der Genkopien in den Gründern, was eine vollständige Darstellung unmöglich macht. Wenn eine neu gebildete Kolonie klein ist, können ihre Gründer die genetische Ausstattung der Population weit in die Zukunft hinein stark beeinflussen.

Ein gut dokumentiertes Beispiel findet sich in der Amish-Migration nach Pennsylvania im Jahr 1744. Zwei Mitglieder der neuen Kolonie teilten das rezessive Allel für das Ellis-Van-Creveld-Syndrom. Mitglieder der Kolonie und ihre Nachkommen sind in der Regel religiöse Isolate und bleiben relativ isoliert. Infolge von Inzucht über viele Generationen ist das Ellis-Van-Creveld-Syndrom heute bei den Amish viel häufiger als in der Allgemeinbevölkerung. [29] [43]

Der Unterschied in der Genhäufigkeit zwischen der ursprünglichen Population und der Kolonie kann auch dazu führen, dass die beiden Gruppen im Laufe vieler Generationen deutlich auseinandergehen. Wenn der Unterschied oder die genetische Distanz zunimmt, können die beiden getrennten Populationen sowohl genetisch als auch phenetisch unterschiedlich werden, obwohl nicht nur die genetische Drift, sondern auch die natürliche Selektion, der Genfluss und die Mutation zu dieser Divergenz beitragen. Dieses Potenzial für relativ schnelle Veränderungen der Genfrequenz der Kolonie führte dazu, dass die meisten Wissenschaftler den Gründereffekt (und im weiteren Sinne die genetische Drift) als eine wesentliche treibende Kraft bei der Entwicklung neuer Arten betrachteten. Sewall Wright war der erste, der der Zufallsdrift und kleinen, neu isolierten Populationen mit seiner Shifting-Balance-Theorie der Artbildung diese Bedeutung beimaß. [44] Nach Wright erstellte Ernst Mayr viele überzeugende Modelle, um zu zeigen, dass der Rückgang der genetischen Variation und die geringe Populationsgröße nach dem Gründereffekt von entscheidender Bedeutung für die Entwicklung neuer Arten waren. [45] Allerdings gibt es heute viel weniger Unterstützung für diese Ansicht, da die Hypothese wiederholt durch experimentelle Forschung getestet wurde und die Ergebnisse bestenfalls zweideutig waren. [46]

Die Rolle des Zufalls in der Evolution wurde erstmals 1921 von Arend L. Hagedoorn und A. C. Hagedoorn-Vorstheuvel La Brand skizziert. Fisher (1922) reagierte darauf mit der ersten, wenn auch geringfügig falschen, mathematischen Behandlung des „Hagedoorn-Effekts“. [48] ​​Bemerkenswerterweise erwartete er, dass viele natürliche Populationen zu groß waren (ein N

10.000), damit die Auswirkungen der Drift erheblich sind und die Gedankendrift einen unbedeutenden Einfluss auf den Evolutionsprozess hätte. Die korrigierte mathematische Behandlung und der Begriff "genetische Drift" wurden später von einem Begründer der Populationsgenetik, Sewall Wright, geprägt. Seinen ersten Gebrauch des Begriffs "Drift" gab er 1929, [49] allerdings benutzte er ihn damals im Sinne eines gezielten Veränderungsprozesses oder natürlicher Auslese. Zufälliges Driften durch Sampling-Fehler wurde als "Sewall-Wright-Effekt" bekannt, obwohl er sich nie ganz wohl dabei fühlte, wie ihm sein Name gegeben wurde. Wright bezeichnete alle Änderungen der Allelfrequenz entweder als "stetige Drift" (z. B. Selektion) oder als "zufällige Drift" (z. B. Abtastfehler). [50] "Drift" wurde als Fachbegriff ausschließlich im stochastischen Sinne übernommen. [51] Heute wird sie meist noch enger definiert, was den Stichprobenfehler betrifft, [52] obwohl diese enge Definition nicht universell ist. [53] [54] Wright schrieb, dass die "Beschränkung der "zufälligen Drift" oder sogar der "Drift" auf nur eine Komponente, die Auswirkungen von Stichprobenunfällen, zu Verwirrung führt. [50] Sewall Wright betrachtete den Prozess der zufälligen genetischen Drift mittels Stichprobenfehler als äquivalent zu dem mittels Inzucht, aber spätere Arbeiten haben gezeigt, dass sie unterschiedlich sind. [55]

In den frühen Tagen der modernen evolutionären Synthese begannen Wissenschaftler, die neue Wissenschaft der Populationsgenetik mit Charles Darwins Theorie der natürlichen Selektion zu verbinden. In diesem Rahmen konzentrierte sich Wright auf die Auswirkungen von Inzucht auf kleine, relativ isolierte Populationen. Er führte das Konzept einer adaptiven Landschaft ein, in der Phänomene wie Kreuzungen und genetische Drift in kleinen Populationen sie von adaptiven Gipfeln wegschieben könnten, was wiederum die natürliche Selektion ermöglicht, sie zu neuen adaptiven Gipfeln zu treiben. [56] Wright dachte, kleinere Populationen seien besser für die natürliche Selektion geeignet, weil „Inzucht ausreichend intensiv war, um durch zufällige Drift neue Interaktionssysteme zu schaffen, aber nicht intensiv genug, um eine zufällige nichtadaptive Fixierung von Genen zu verursachen“. [57]

Wrights Ansichten über die Rolle der genetischen Drift im evolutionären Schema waren fast von Anfang an umstritten. Einer der lautesten und einflussreichsten Kritiker war Kollege Ronald Fisher. Fisher räumte ein, dass die genetische Drift eine gewisse Rolle in der Evolution gespielt habe, aber eine unbedeutende. Fisher wurde vorgeworfen, Wrights Ansichten missverstanden zu haben, weil Fisher in seiner Kritik zu argumentieren schien, dass Wright die Auswahl fast vollständig abgelehnt habe. Für Fisher war die Betrachtung des Evolutionsprozesses als langer, stetiger, adaptiver Fortschritt die einzige Möglichkeit, die ständig zunehmende Komplexität aus einfacheren Formen zu erklären. Aber die Debatten zwischen den "Gradualisten" und denen, die sich mehr dem Wright-Modell der Evolution zuneigen, wo Selektion und Drift zusammen eine wichtige Rolle spielen, wurden fortgesetzt. [58]

1968 entfachte Motoo Kimura die Debatte mit seiner neutralen Theorie der molekularen Evolution, die behauptet, dass die meisten genetischen Veränderungen durch genetische Drift verursacht werden, die auf neutrale Mutationen einwirkt. [6] [7]

Die Rolle der genetischen Drift durch Stichprobenfehler in der Evolution wurde von John H. Gillespie [59] und William B. Provine kritisiert, die argumentieren, dass die Selektion auf verlinkten Seiten eine wichtigere stochastische Kraft ist.


Neutrale Theorie setzt die „Erhaltungspriorität“

Die neutrale Theorie dient als Nullhypothese für die molekulare Evolutionstheorie und insbesondere für den Koaleszenzprozess ( Wakeley 2003 Duret 2008), doch „der Wert der neutralen Theorie in der Erhaltung wurde nicht erkannt“ ( Rosindell et al. 2011, S. 346). ). Obwohl Rosindell et al. (2011) beziehen sich in diesem Fall auf die ökologische Theorie von Hubbell, der Punkt gilt auch für die neutrale Theorie der molekularen Evolution. Rosindell et al. (2011) legen besonderes Augenmerk auf Austauschbarkeit als gemeinsames konzeptionelles Thema. Unabhängig davon, ob es sich um genomische Loci oder Individuen innerhalb einer Gemeinschaft handelt, bedeutet Neutralität, dass die Ersetzung eines Allels oder Individuums durch ein anderes die evolutionäre Eignung von beiden nicht beeinflusst. Wenn wir also Abweichungen von der Austauschbarkeit beobachten, werden wir vor aktiven Prozessen wie dem vom Menschen verursachten Klimawandel, der Entwaldung, der Einführung chemischer Schadstoffe usw Konnektivität und Genfluss.

Es ist an der Zeit, dass die Konservierungsgenetik einen expliziten hypothesengetriebenen Rahmen übernimmt, der auf Kimuras neutraler Theorie der molekularen Evolution beruht. Shaferet al. (2015) haben die Notwendigkeit beschrieben, „Erhaltungsprioritäten“ (S. 84) festzulegen, um die Gestaltung von Forschungsfragen zu leiten, die umsetzbar und erreichbar sind, um die Lebensfähigkeit von Populationen und Arten zu verbessern. Unsere Erwartungen an die Variation auf molekularer Ebene als Funktion von ne und Migration können bei der Planung experimenteller Designs der genetischen Erhaltungsforschung verwendet werden, die modellbasierte Hypothesentests verwenden, um wahrscheinliche Migrationskorridore zu erkennen ( Aguillon et al. 2017), Populationsrückgänge ableiten, die die heute reduzierte genetische Variation erklären können ( Figueiró et al. 2017) oder die Wirksamkeit von Restaurationsprogrammen evaluieren (Li et al. 2014). Diese umsetzbaren Hypothesen können durch eine Synthese von inventarischer, funktioneller und insbesondere prozessgesteuerter Konservierungsgenomik vorangetrieben werden, eine Synthese, die die Kraft der vielen molekularevolutionären Erkenntnisse nutzt, die Kimura vor 50 Jahren auf diesem Gebiet vermittelte.


Fixierung eines schädlichen Allels an einem von zwei "duplizierten" Loci durch Mutationsdruck und zufällige Drift

Wir betrachten eine diploide Population und gehen von zwei Genloci mit jeweils zwei Allelen aus, A und a an einem Locus und B und b am zweiten Locus. Mutationen von Wildtyp-Allelen A und B zu schädlichen Allelen a und b treten mit Mutationsraten va bzw. vb auf. Wir gehen davon aus, dass Allele vollständig rezessiv sind und nur der doppelrezessive Genotyp aabb mit relativer Fitness 1-epsilon einen schädlichen Effekt zeigt. Dann kann gezeigt werden, dass, wenn va größer als vb ist, die Mutante a durch den Mutationsdruck in der Population fixiert wird und letztendlich ein Mutations-Selektions-Gleichgewicht bezüglich des B/b-Locus allein erreicht wird. Das Hauptziel dieser Arbeit ist es, die Situation zu untersuchen, in der va = vb genau ist. In diesem Fall wird ein neutrales Gleichgewicht erreicht und jeder Locus kann zur Fixierung für das mutierte Allel driften. Diffusionsmodelle werden entwickelt, um den beteiligten stochastischen Prozess zu behandeln, bei dem die schädliche Mutante schließlich in einem der beiden duplizierten Loci durch zufällige Abtastdrift in endlichen Populationen fixiert wird. Insbesondere wird die Gleichung für die durchschnittliche Zeit bis zur Fixierung von Mutante a oder b abgeleitet und diese numerisch für einige Kombinationen der Parameter 4Nev und 4Ne epsilon gelöst, wobei v die Mutationsrate (va = vb = v) und Ne ist die effektive Bevölkerungsgröße. Monte-Carlo-Experimente wurden durchgeführt (unter Verwendung eines Geräts, das als "Pseudo-Sampling-Variable" bezeichnet wird), um die numerische Analyse zu ergänzen.


1. Einleitung

Die Beziehung zwischen Genotyp und Phänotyp, die Art und Weise, wie diese Karte die Anpassungsdynamik von Populationen bedingt, oder die Spuren, die Lebensgeschichten im Genom von Organismen hinterlassen, sind wesentliche Fragen, die gelöst werden müssen, bevor eine vollständige Evolutionstheorie erreicht werden kann.Genotypen, die einen Großteil der zur Konstruktion von Organismen erforderlichen Informationen kodieren, werden gelegentlich von Mutationen beeinflusst, die den Phänotyp, ihre sichtbare Expression und das Ziel der natürlichen Selektion verändern. Viele Mutationen sind stattdessen neutral [1], variieren die Regionen des Genotypraums, auf die die Bevölkerung zugreifen kann [2] und konditionieren ihre Entwicklungsfähigkeit [3], lassen aber den Phänotyp unverändert. Die Beziehung zwischen Genotyp und Phänotyp ist nicht eins-zu-eins, sondern viele-zu-viele. Insbesondere Genotypen, die für einen bestimmten Phänotyp kodieren, können riesige, verbundene Netzwerke bilden, die oft den gesamten Raum möglicher Genotypen umfassen. Die Existenz dieser Netzwerke bei Proteinen wurde von Maynard Smith [4] als Voraussetzung für die Evolution durch natürliche Selektion postuliert. Spätere Forschungen haben gezeigt, dass diese Netzwerke für funktionelle Proteine ​​[5], für andere Makromoleküle wie RNA [6] existieren und generisch in einfachen Modellen der Genotyp-Phänotypkarte nachahmen, die regulatorische Gennetzwerke [7], metabolische Reaktionsnetzwerke []. 8] oder die Selbstorganisation der quartären Proteinstruktur [9].

Dennoch wurden erst vor kurzem systematische Untersuchungen der topologischen Struktur neutraler Netzwerke (NNs) durchgeführt, obwohl einige der Auswirkungen der NN-Struktur auf die Sequenzentwicklung schon vor langer Zeit identifiziert wurden. Zum Beispiel postulierte Kimuras neutrale Theorie [1], dass die Anzahl der neutralen Substitutionen in einem gegebenen Zeitintervall Poisson-verteilt war. Dieser Annahme lag eine Hypothese zugrunde, die damals nicht ausdrücklich formuliert wurde, nämlich dass die Zahl der für jeden Genotyp verfügbaren neutralen Mutationen konstant war, unabhängig vom genauen Genotyp, der Zeit oder dem exprimierten Phänotyp. Mit anderen Worten, NNs wurden als homogen im Grad angenommen. Eine Konsequenz war, dass die Varianz der Anzahl der akkumulierten Mutationen dem Mittelwert und dem Streuungsindex (R, das Verhältnis zwischen Varianz und Mittelwert) muss dann gleich 1 sein. Sehr früh wurde jedoch beobachtet, dass R war in fast allen analysierten Fällen signifikant größer als 1 [10�]. Das Auftreten kurzer Ausbrüche schneller Evolution wurde Episoden positiver Darwinscher Selektion zugeschrieben [12], die Schwankungen der Populationsgröße in quasi-neutralen Umgebungen widerspiegeln könnten, in denen epistatische Wechselwirkungen relevant werden würden [13].

Tatsache ist, dass NNs sehr heterogen sind. Einige Genotypen sind brüchig und ergeben unter Mutation leicht einen anderen Phänotyp. Sie haben einen oder wenige Nachbarn innerhalb des NN. Andere Genotypen hingegen sind robust und können eine sehr große Anzahl von Mutationen aushalten, während sie ihre biologische oder chemische Funktion beibehalten. Als mögliche Erklärung für die Überdispersion der molekularen Uhr wurde bald die Existenz von Variationen im Neutralitätsgrad von Genotypen (in ihrer Robustheit) angeführt [13]. Heutzutage wurden die Robustheitsverteilungen der Genotypen in mehreren verschiedenen NNs gemessen und erwiesen sich als bemerkenswert breit [14�]. Die Auswirkungen fluktuierender neutraler Räume auf die Überdispersion der molekularen Uhr wurden in realistischen Evolutionsmodellen für Proteine ​​[17] und Quasi-Spezies [18] sowie aus theoretischer Sicht [19] untersucht.

In diesem Beitrag untersuchen wir drei Merkmale von NNs, deren Auswirkungen auf die Fixierungsrate von Mutationen nicht systematisch untersucht wurden. Dies sind (i) die Korrelationen der Neutralität zwischen benachbarten Genotypen, (ii) der Redundanzgrad der Phänotypen (die Größe von NN) und (iii) die Eignung des aktuellen Phänotyps in Bezug auf zugängliche Alternativen. Erstens ist der Neutralitätsgrad im NN nicht zufällig verteilt. Thermodynamische Argumente [20,21] und Analysen von vollständigen NNs [22] weisen darauf hin, dass Genotypen als Funktion ihrer Robustheit zu Clustern neigen, was bedeutet, dass NNs zur Klasse der sogenannten assortativen Netzwerke gehören. Es ist bekannt, dass Populationen, die sich auf NNs entwickeln, dazu neigen, maximal verbundene Regionen zu besetzen, um die Anzahl von Mutationen zu minimieren, die ihren Phänotyp ändern [2]. In assortativen Netzwerken führt die neutrale Drift zu einer Kanalisierung in Richtung des Mutationsselektionsgleichgewichts, wodurch die Fixierungsrate neutraler Mutationen durch einen dynamischen Prozess, den wir benennen, schrittweise erhöht wird phänotypische Einklemmung. Zweitens gibt es zahlreiche Beweise aus rechnergestützten Genotyp-–Phänotyp-Karten [9,23�] und empirischen Rekonstruktionen von NNs [25], dass die durchschnittliche Robustheit eines bestimmten Phänotyps mit der Größe des zugehörigen NN wächst: Hier quantifizieren wir die Wirkung eines systematischen Unterschieds im durchschnittlichen Grad auf die Wahrscheinlichkeit der Fixierung neutraler Mutationen. Drittens beeinflusst der Fitnessunterschied zwischen Genotypen im aktuellen NN und ihren Mutationsnachbarn die Wahrscheinlichkeit, dass eine Mutation (sei es neutral, vorteilhaft oder schädlich) in der Population fixiert wird, und damit, wie wir explizit zeigen, die Rate der molekulare Uhr während Intervallen streng neutraler Drift.

Unter Berücksichtigung der ersten Ziele entwickeln wir einen formalen Rahmen außerhalb des Gleichgewichts, um die Dynamik homogener, unendlicher Populationen auf generischen NNs zu beschreiben. Wir zeigen, dass sich die Population an ihre Vorgeschichte erinnert, weil die Wahrscheinlichkeit, dass sie Genotypen mit immer höherer Robustheit besucht, im Laufe der Zeit auf eine von uns berechnete präzise Weise zunimmt. Dies ist eine Folge der Assortativität und eine dynamische Manifestation des in sozialen Netzwerken beschriebenen 𠆏reundschaftsparadoxons’ [26] (Ihre Freunde haben mehr Freunde als Sie). Als Ergebnis hängt die Wahrscheinlichkeit, dass die Population das Netzwerk verlässt, explizit von der verstrichenen Zeit ab. Außerdem führt die Abnahme dieser Wahrscheinlichkeit mit der Zeit zu einer systematischen Beschleunigung der Akkumulationsrate neutraler Mutationen. Der Einschlussgrad ist umso höher, je größer die NN und je größer der Unterschied zwischen der Fitness des aktuellen Phänotyps und der von zugänglichen Alternativen ist. Diese Ergebnisse sind ziemlich allgemein und haben Auswirkungen auf die Ableitung effektiver Modelle phänotypischer Veränderungen und auf die Kalibrierung molekularer Uhren.


Methoden

Simulationen

Ich habe 200 replizierte Vorwärtszeitsimulationen einer Metapopulation durchgeführt, die sich an eine heterogene räumliche Umgebung anpasst (Abbildung 1) mit SLiM v. 3.2 (Haller und Messer 2017), um SNP-Daten für jedes Individuum zu erstellen. Die Simulationen ergaben eine Population mit einer Isolations-nach-Abstands-Struktur entlang eines Umweltgradienten (z.B., Isolation nach Umgebung, Wang und Bradburd 2014). Zur Vereinfachung der Interpretation der Ergebnisse wurde auf jedem LG nur eine Art von genomischer Heterogenität simuliert, so dass sich jedes LG ungefähr unabhängig entwickelte. Jedes der 9 LGs hatte eine Länge von 50.000 Basen und eine Länge von 50 cm. Die Basisrekombinationsrate neR = 0,01 (sofern nicht wie unten beschrieben manipuliert) ergab eine Auflösung von 0,001 cM zwischen benachbarten Basen. Die Rekombinationsrate wurde skaliert, um den Fall nachzuahmen, in dem SNPs über eine größere genetische Karte als die simulierte gesammelt wurden (ähnlich einem SNP-Chip), aber immer noch niedrig genug, um das Auftreten von Selektionssignaturen in neutralen Loci zu ermöglichen, die mit ausgewählten Loci verknüpft sind (in die Simulationen 50.000 Basen / (R = 1e-05) * 100 = 50 cM beim Menschen 50.000 bp würden 0,05 cM entsprechen). Somit hatten SNPs an den gegenüberliegenden Enden von Verknüpfungsgruppen wahrscheinlich eine Rekombinationsrate zwischen ihnen von 0,5 (unverknüpft), aber ansonsten würde es einen gewissen Grad an Verknüpfung zwischen SNPs innerhalb von Verknüpfungsgruppen geben. Für alle LGs ist die bevölkerungsskalierte Mutationsrate neμ entsprach 0,001. Aus Gründen der Recheneffizienz wurden 1000 Individuen mit Skalierung der Mutationsrate und Rekombinationsrate wie oben beschrieben simuliert (Fisher 1930 Wright 1931, 1938 Crow und Kimura 1970 Bürger 2000). In der ersten Generation wurden die Individuen zufällig auf einer räumlichen Karte zwischen den Koordinaten 0 und 1 platziert. Die Individuen verteilten sich über eine Distanz, die durch eine bivariate Normalverteilung mit Nullmittelwert und Varianz gegeben ist (Tabelle 2).

Beispiel Landschaftssimulation. Jede Box ist ein Individuum, gefärbt nach ihrem phänotypischen Wert. Hintergrund ist das selektive Umfeld. Dieser Output wurde nach 1900 Selektionsgenerationen durch die Umwelt erzeugt, was zu einer Korrelation von 0,52 zwischen dem Phänotyp und der Umwelt führte.


Schau das Video: papeando na hora do serviço (August 2022).