Information

Wo finde ich eine Liste von Genen, die für Protein beim Menschen kodieren?

Wo finde ich eine Liste von Genen, die für Protein beim Menschen kodieren?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Ich habe rohe Lesezahlen, die von htseq aus der STAR-Ausrichtung extrahiert wurden

Ich habe beide Daten mit Ensembl-IDs und Gensymbolen, aber ich brauche nur eine aktuelle Liste von Protein-kodierenden Genen beim Menschen; ich habe gegoogelt aber nicht gefunden

Irgendein Vorschlag bitte?


Senden Sie Ihre Ensemble-IDs an biomart und erhalten Sie den "Genbiotyp". "Protein-Kodierung" ist eine der Optionen dort.


10 Beispiele für Proteine: In Lebensmitteln und Biologie

Computergeneriertes Bild des Proteins RLBP1. Bildnachweis: WikiCommons CC0 1.0

Proteine ​​sind eine Art biologisches Molekül, das hauptsächlich aus Aminosäuren besteht. Proteine ​​erfüllen eine Vielzahl von Funktionen im menschlichen Körper, darunter:

  • katalysieren Stoffwechselreaktionen
  • synthetisieren und kopieren Sie DNA
  • Transportmoleküle innerhalb der Zelle
  • Signalwege im Körper
  • aktiv im Immunsystem
  • bilden physikalische Strukturen von Zellen

Proteine ​​bestehen aus Polypeptidketten, das sind Ketten von Aminosäuren, die in einer bestimmten Reihenfolge angeordnet sind. Die Reihenfolge der Aminosäuren in der Polypeptidkette bestimmt die Form und Funktion des Proteins. Der Körper baut Proteine ​​gemäß den in der DNA gespeicherten Informationen auf. Die Sequenz der Nukleotidbasen in der DNA repräsentiert eine bestimmte Sequenz von Aminosäuren. Während der Transkription und Translation wird diese Information in Form von RNA kopiert und von Ribosomen gelesen, um das kodierte Protein herzustellen.

Insgesamt kodiert die menschliche DNA für 21 verschiedene Aminosäuren, was zu einem großen Pool an möglichen Proteinen führt. Die menschliche DNA enthält etwa 20.000 Gene, die für funktionelle Proteine ​​kodieren. Die genaue Anzahl der verschiedenen Arten von Proteinen im menschlichen Körper ist nicht bekannt, obwohl Spekulationen die Zahl von 100.000 auf 1 Million beziffern. Der Mensch benötigt auch 9 Aminosäuren, die der Körper nicht synthetisieren kann, daher sind wir auf externe Proteinquellen in unserer Nahrung angewiesen, um diesen Bedarf zu decken.


Genetischer Code: Entartung und Universalität | Protein

Die in der DNA gespeicherte Information liegt in Form von Code vor. DNA enthält 4 Basen, A, T, G und C, während Proteine ​​aus 20 verschiedenen Aminosäuren bestehen. Daher muss der genetische Code mehr als eine Basen enthalten, um die 20 verschiedenen Arten von Aminosäuren zu spezifizieren.

Durch die Arbeit einer Reihe von Wissenschaftlern wurde der Code und die Beziehung von Aminosäuren zu verschiedenen Codes bestimmt. Es wurde festgestellt, dass der Code aus 3 Buchstaben (3 Basen) besteht, d.h. der Code ist
ein “Triplett”-Code. Die Anzahl der aus den 4 Basen gebildeten Triplettcodes beträgt 4 3 = 64.

Die Basensequenz in der DNA, die eine Aminosäure spezifiziert, wird als “code” bezeichnet, während ihre vollständige Basensequenz in der mRNA als “codon” bezeichnet wird. In der tRNA wird die Basensequenz, die eine Aminosäure spezifiziert, genannt “anticodon”. Wenn man also in 5′-»3’Richtung liest, ist der Code für Methionin 5′ CAT3′-, das Codon ist 5′ AUG3′ und das Anticodon ist 5′ CAU3′.

Da die mRNA direkt an der Proteinsynthese beteiligt ist, “codons” werden häufig anstelle von “code” (DNA) verwendet, um die Aminosäuren zu spezifizieren. Alle 64 Codons mit ihren Bedeutungen bilden das “coding Dictionary” (Tabelle 4.3). Von ihnen spezifizieren 61 Codons Aminosäuren, daher werden sie “sense” “codons” oder “sense Wörter” genannt.

Die restlichen 3 Kondons, UAA, UAG und UGA, spezifizieren keine Aminosäure und werden “unsinnige Codons” oder “unsinnige Wörter” (in Bezug auf Aminosäuren) genannt. Sie sind jedoch sehr wichtige und notwendige Codons, da sie verwendet werden, um die wachsende Polypeptidkette zu stoppen oder zu beenden.

Daher werden diese Codons als “stop-Codons” oder bezeichnet “Kettenterminationscodons.” Die Aminosäuren Methionin und Trytophan werden durch die einzelnen Codons AUG bzw. UGG spezifiziert.

Das Codon AUG ist ein mehrdeutiges Codon, da es N-Formylmethionin und Methionin, beides Aminosäuren, spezifiziert. Andere sind “degenerate” oder synonyme” Codons, d. h. dieselbe Aminosäure wird von mehr als einem Codon spezifiziert (Tabelle 4.3).

Entartung des genetischen Codes:

Es gibt zwei Methoden, mit denen dieselbe Aminosäure durch zwei oder mehr Codons spezifiziert wird:

1. Die tRNAs, die dieselbe Aminosäure akzeptieren, sind für verschiedene synonyme Codons unterschiedlich. Solche tRNAs werden “isoacceptortRNAs” genannt und unterscheiden sich in Anticodons. Eine der Leucin-tragenden tRNAs ist beispielsweise die tRNA1 leu mit Anticodon 3′ GAC5′, während das andere tRNA ist2 leu mit Anticodon 3′ GAG5′.

2. Ein einzelner tRNA-Typ paart sich mit zwei oder mehr synonymen Codons. Zum Beispiel tRNA. das Akzeptieren der Aminosäure Alanin in Hefe (tRNA aIa) trägt das Anticodon 3′ CGI5′, das sich mit den Codons 5′ GCU3′, 5′ GCC3 und 5′ GCA3′ auf mRNA Crick im Jahr 1966 paaren kann die “wobble-Hypothese”, um die Paarung eines einzelnen Anticodons mit synonymen Codons zu erklären.

Nach der Wobble-Hypothese ist die Basisposition am 5′-Ende des Anticodons die “Wackelposition”. Zwei Basen des Anticodons vom 3′-Ende sind komplementär zu den beiden Basen des Codons (in mRNA). Die Base in der Wobble-Position kann mit verschiedenen Bases gepaart werden. Zum Beispiel kann ein einzelner tRNA-Gly-Typ mit dem Anticodon 3′ CCI5′ mit den Codons 5’GGU3′, 5’GGC3′ und 5’GGA3′ paaren, die die Aminosäure Glycin spezifizieren.

Somit kann sich Inosin (I) an der Wobble-Position mit U, C und A im Codon paaren. Ebenso kann U mit A und G gepaart werden, während G in der Wobble-Position mit C und/U gepaart werden kann.

Universalität des genetischen Codes:

Die Universalität des genetischen Codes bedeutet, dass derselbe genetische Code von allen Organismen verwendet wird. Zum Beispiel funktioniert das lac + -Gen, das das Enzym P-Galactosidase in E. coli produziert, zur Produktion desselben Enzyms in menschlichen Fibroblasten-Gewebekulturzellen, denen dieses Enzym fehlt.

Wenn die Hämoglobin-mRNA-Moleküle in die Xenopus-Eier injiziert werden, findet eine Proteinsynthese statt und die α- und β-Polypeptidketten werden produziert. In Mitochondrien wurde jedoch eine Variation des genetischen Codes beobachtet, wo einige der Kondons unterschiedlich übersetzt sind.

UGA (Termination Codon in Universal Code) spezifiziert Tryptophan, während AUA (für Isoleucin in Universal Code) Methionin in Mitochondrien spezifiziert. Zum Teil unterscheiden sich die Mitochondrien verschiedener Organismen auch im genetischen Code. CUA ist beispielsweise ein Codon für Threonin in Hefemitochondrien, während es Leucin in Drosophila und Säugetiermitochondrien spezifiziert.


Wo finde ich eine Liste von Genen, die für Protein im Menschen kodieren - Biologie

8 Stunden wegen Wartungsarbeiten in unserem Rechenzentrum. Dieses Intervall kann je nach Arbeitsfortschritt möglicherweise kürzer sein. Wir bitten um Entschuldigung für die Unannehmlichkeiten. *** --> *** DAVID wird von Freitag, den 24.06.2011 um 17:00 Uhr EST bis Sonntag, den 26.06.2011 um 15:00 Uhr EST aufgrund von Wartungsarbeiten in unserem Rechenzentrum nicht verfügbar sein. Dieses Intervall kann je nach Arbeitsfortschritt möglicherweise kürzer sein. Wir bitten um Entschuldigung für die Unannehmlichkeiten. *** --> *** Wir akzeptieren derzeit Beta-Benutzer für unseren neuen DAVID-Webservice, der den Zugriff auf DAVID aus verschiedenen Programmiersprachen ermöglicht. Bitte kontaktieren Sie uns für den Zugang. *** --> *** Die Gensymbol-Zuordnung für das Hochladen und Konvertieren von Listen hat sich geändert. Weitere Informationen finden Sie in der Ankündigung des DAVID-Forums. --> *** Ankündigung des neuen DAVID Web Service, der den Zugriff auf DAVID aus verschiedenen Programmiersprachen ermöglicht. Mehr Info. *** --> *** DAVID 6.8 wird am Donnerstag, den 23.02.2016, von 9:00 bis 13:00 Uhr EST wegen Wartungsarbeiten nicht verfügbar sein *** -->
*** Willkommen bei DAVID 6.8 ***
*** Wenn Sie nach DAVID 6.7 suchen, besuchen Sie bitte unsere Entwicklungsseite. ***
-->
*** Willkommen bei DAVID 6.8 mit aktualisierter Wissensdatenbank (weitere Informationen). ***
*** Wenn Sie nach DAVID 6.7 suchen, besuchen Sie bitte unsere Entwicklungsseite. ***
-->
*** Willkommen bei DAVID 6.8 mit aktualisierter Wissensdatenbank (weitere Informationen). ***
*** Der DAVID 6.7 Server ist derzeit wegen Wartungsarbeiten ausgefallen. ***
--> *** Bitte lesen Sie: Aufgrund von Wartungsarbeiten im Rechenzentrum wird DAVID von Freitag, den 17. Juni um 16 Uhr EST bis Sonntag, den 19. Juni offline sein, mit der Möglichkeit, früher wieder online zu sein. *** -->


Auswahl des RefSeq Select-Transkripts

NCBI hat eine Pipeline entwickelt, die das RefSeq Select-Transkript basierend auf mehreren hierarchisch bewerteten Kriterien auswählt. Einige der Kriterien sind spezifisch für das menschliche Genom, zum Beispiel die vorherige Zuordnung des Transkripts als „Referenzstandard“ im RefSeqGene-Set für ein Gen, das auch im öffentlichen LRG-Set (Locus Reference genomic) enthalten ist. Andere Kriterien wie der Expressions-Score, der aus RNA-Seq-Intron-übergreifenden Alignments berechnet wird, gelten für alle Taxa im Geltungsbereich. Abbildung 1 bietet einen vereinfachten Überblick über die RefSeq Select-Pipeline. Die rechnerische Pipeline wird durch Input und QA von erfahrenen Kuratoren der RefSeq-Gruppe ergänzt, die dazu beitragen, die Qualität der RefSeq Select-Transkripte aufrechtzuerhalten und die Transkriptauswahl in komplexen Loci und anderen Genen zu treffen, bei denen die Pipeline-Auswahl möglicherweise nicht ideal ist.

Abbildung 1. Workflow zur Auswahl des RefSeq Select-Transkripts


Von der Sequenz zum Protein und Gen

Objekt: Beginnen Sie mit einer Sequenz, identifizieren Sie das Protein oder Gen und die Quelle.

Beispiel: Identifizieren Sie anhand der folgenden Sequenz (verfügbar unter http://tinyurl.com/blastp-sequence oder kopieren Sie die Sequenz unten) das wahrscheinlichste Protein und den wahrscheinlichsten Organismus:

MSKRKAPQET LNGGITDMLT ELANFEKNVS QAIHKYNAYR KAASVIAKYP HKIKSGAEAK
KLPGVGTKIA EKIDEFLATG KLRKLEKIRQ DDTSSSINFL TR VSGIGPSA AR KFVDEGI K
TLEDLRKNED KLNHHQRIGL KYFGDFEKRI PRE EMLQMQ D IVLNEVKKVD S EYIATVCG S
FRRGAESSGD MDVLLTHPSF TSE STKQPKL L HQVVEQL QK VHFITDTLS K G ETKFMGV CQ
L  PSKNDEKEY PH RRIDIRLI PKDQYYCGVL Y FTGSDIF NK NMRAHAL EKG FTINEYTIR P
LGVT GVAGEP L PVDSEKD IF DYIQWKYRE P KDRSE

Abfrage einer Sequenz

Protein- und Gensequenzvergleiche erfolgen mit SPRENGEN (Grundlegendes Suchwerkzeug für die lokale Ausrichtung).

Um auf BLAST zuzugreifen, gehen Sie zu Ressourcen > Sequenzanalyse > BLAST:

Dies ist eine Proteinsequenz, und so Protein BLAST sollte aus dem BLAST-Menü ausgewählt werden:

Geben Sie die Abfragesequenz Geben Sie im Suchfeld ein Berufsbezeichnung, wähle ein Datenbank abfragen und klicken SPRENGEN:

Anzeigen Ihrer Ergebnisse

Unter dem Ausrichtungen Tab neben Ausrichtungsansicht auswählen Paarweise mit Punkten für Identitäten.

Sieh den Beschreibungen Registerkarte, um eine Liste der wichtigen Ausrichtungen anzuzeigen. Beachten Sie, dass die erste Übereinstimmung ein synthetisches Konstrukt ist (d. h. die Sequenz wurde rechnerisch abgeleitet und ist keinem Organismus zugeordnet):

Taste für Standardanzeige:

  • Max[maximal] Punktzahl: der höchste Alignment-Score, der aus der Summe der Belohnungen für übereinstimmende Nukleotide und Strafen für Fehlpaarungen und Lücken berechnet wird.
  • GesamtPunktzahl: die Summe der Alignment-Scores aller Segmente aus derselben Themensequenz.
  • Anfrageabdeckung[Alter]: Der Prozentsatz der Abfragelänge, der in den ausgerichteten Segmenten enthalten ist.
  • E[voraussichtlich] Wert: die Anzahl der zufällig erwarteten Ausrichtungen mit der berechneten Punktzahl oder besser. Der Expect-Wert ist die Standard-Sortierungsmetrik für signifikante Ausrichtungen, der E-Wert sollte sehr nahe bei Null liegen.
  • Ident[ity]: die höchste prozentuale Identität für einen Satz ausgerichteter Segmente mit derselben Subjektsequenz.
  • Acc[Ausgabe] Len[gth]: die Anzahl der Nukleotide oder Aminosäuren in der Ergebnissequenz, identifiziert durch die Zugangsnummer
  • Beitritt [Nummer]: eine eindeutige Kennung, die Datensätzen in den NCBI-Datenbanken zugewiesen wird

Wenn Sie auf einen Proteinnamen klicken, werden das paarweise Sequenz-Alignment und Links zu zusätzlichen Informationen über das Protein und das zugehörige Gen (sofern verfügbar) angezeigt.

Bei der paarweisen Anzeige mit Punkten für Identitäten werden alle abweichenden Aminosäuren in der betreffenden Sequenz rot angezeigt:

Ergebnisse speichern

Um Ihre Suchanfragen und Einstellungen zu speichern, klicken Sie auf das Sichere Suche Link, dann melden Sie sich bei My NCBI an, indem Sie die Einloggen oder Registrieren Link oben rechts. Sobald Sie dies tun, sollten Ihre Suchstrategien im Gespeicherte Suchstrategien Tab.


Ein benutzerdefiniertes Java-Skript, das für die Drei-Frame-In-Silico-Übersetzung von zusammengestellten Transkripten verwendet wird, ist als Ergänzungsdaten 4 enthalten.

Basrai, M. A., Hieter, P. &. Boeke, J. D. Kleine offene Leserahmen: schöne Nadeln im Heuhaufen. Genom-Res. 7, 768–771 (1997).

Ochman, H. Unterscheidung der ORFs von den ELFs: kurze bakterielle Gene und die Annotation von Genomen. Trends Genet. 18, 335–337 (2002).

Lawrence, J. Wenn ELFs ORFs sind, sich aber nicht wie sie verhalten. Trends Genet. 19, 131–132 (2003).

Dujon, B. et al. Vollständige DNA-Sequenz des Hefechromosoms XI. Natur 369, 371–378 (1994).

Goffeau, A. et al. Leben mit 6000 Genen. Wissenschaft 274, 563–567 (1996).

Saghatelian, A. & Couso, J.P. Entdeckung und Charakterisierung von smORF-kodierten bioaktiven Polypeptiden. Nat. Chem.-Nr. Biol. 11, 909–916 (2015).

Couso, J. P. &. Patraquim, P. Klassifizierung und Funktion kleiner offener Leserahmen. Nat. Pfr. Mol. Zellbiol. 18, 575–589 (2017).

Galindo, M. I., Pueyo, J. I., Fouix, S., Bishop, S. A. & Couso, J. P. Peptides encoded by short ORFs kontrollieren die Entwicklung und definieren eine neue eukaryotische Genfamilie. PLoS Biol. 5, e106 (2007).

Kondo, T. et al. Kleine Peptidregulatoren der Aktin-basierten Zellmorphogenese, kodiert durch eine polycistronische mRNA. Nat. Zellbiol. 9, 660–665 (2007).

Arnoult, N. et al. Regulierung der Wahl des DNA-Reparaturwegs in der S- und G2-Phase durch den NHEJ-Inhibitor CYREN. Natur 549, 548–552 (2017).

Rathore, A. et al. Das MIEF1-Mikroprotein reguliert die mitochondriale Translation. Biochemie 57, 5564–5575 (2018).

Stein, C. S. et al. Mitoregulin: ein lncRNA-kodiertes Mikroprotein, das mitochondriale Superkomplexe und die Atmungseffizienz unterstützt. Zellvertreter 23, 3710–3720.e8 (2018).

D’Lima, N.G. et al. Ein menschliches Mikroprotein, das mit dem mRNA-Decapping-Komplex interagiert. Nat. Chem.-Nr. Biol. 13, 174–180 (2017).

Zhang, Q. et al. Das Mikroprotein Minion steuert die Zellfusion und den Muskelaufbau. Nat. Komm. 8, 15664 (2017).

Ma, J. et al. Verbesserte Identifizierung und Analyse von Polypeptiden, die von einem kleinen offenen Leserahmen kodiert werden. Anal. Chem.-Nr. 88, 3967–3975 (2016).

Slavoff, S. A. et al. Peptidomische Entdeckung von kurzen offenen Leserahmen-kodierten Peptiden in menschlichen Zellen. Nat. Chem.-Nr. Biol. 9, 59–64 (2013).

Ingolia, N. T., Ghaemmaghami, S., Newman, J. R. S. &. Weissman, J. S. Genomweite Analyse in vivo der Translation mit Nukleotidauflösung unter Verwendung von Ribosomen-Profiling. Wissenschaft 324, 218–223 (2009).

Aspden, J.L.et al. Umfangreiche Translation kleiner offener Leserahmen, die durch Poly-Ribo-Seq. eLife 3, e03528 (2014).

Bazzini, A. A. et al. Identifizierung kleiner ORFs in Wirbeltieren mittels Ribosomen-Footprinting und evolutionärer Konservierung. EMBO J. 33, 981–993 (2014).

Hao, Y. et al. SmProt: eine Datenbank kleiner Proteine, die durch annotierte kodierende und nicht-kodierende RNA-Loci kodiert werden. Knapp. Bioinformatik 19, 636–643 (2018).

Olexiouk, V., Van Criekinge, W. & Menschaert, G. Ein Update auf sORFs.org: ein Repository für kleine ORFs, die durch Ribosomen-Profiling identifiziert wurden. Nukleinsäuren Res. 46, D497–D502 (2018).

Ji, Z., Song, R., Regev, A. &. Struhl, K. Viele lncRNAs, 5′UTRs und Pseudogene werden translatiert und einige exprimieren wahrscheinlich funktionelle Proteine. eLife 4, e08890 (2015).

Hsu, P.Y. et al. Hochauflösendes Ribosomen-Profiling zeigt nicht kommentierte Translationsereignisse in Arabidopsis. Proz. Natl Acad. Wissenschaft Vereinigte Staaten von Amerika 113, E7126–E7135 (2016).

Calviello, L. et al. Nachweis von aktiv translatierten offenen Leserastern in Ribosomen-Profiling-Daten. Nat. Methoden 13, 165–170 (2016).

Raj, A. et al. Tausende neuer übersetzter offener Leserahmen beim Menschen, die durch Ribosomen-Fußabdruck-Profiling abgeleitet werden. eLife 5, e13328 (2016).

Diament, A. & Tuller, T. Estimation of Ribosom-Profiling-Leistung und Reproduzierbarkeit bei verschiedenen Auflösungsstufen. Biol. Direkte 11, 24 (2016).

Robasky, K., Lewis, N.E. & Church, G.M. Die Rolle von Replikaten für die Fehlerminderung bei der Sequenzierung der nächsten Generation. Nat. Rev. Genet. 15, 56–62 (2014).

Ma, J., Saghatelian, A. & Shokhirev, M.N. Der Einfluss der Transkript-Assemblierung auf die proteogenomische Entdeckung von Mikroproteinen. Plus eins 13, e0194518 (2018).

Oslowski, C. M. &. Urano, F. Messung des ER-Stresses und der entfalteten Proteinantwort unter Verwendung eines Säugetiergewebekultursystems. Methoden Enzymol. 490, 71–92 (2011).

Liu, C.-L. et al. Genomweite Analyse der Tunicamycin-induzierten Stressreaktion des endoplasmatischen Retikulums und der protektiven Wirkung von Inhibitoren des endoplasmatischen Retikulums in neugeborenen Rattenkardiomyozyten. Mol.-Nr. Zelle. Biochem. 413, 57–67 (2016).

Xu, J. &. Zhang, J. Sind vom Menschen übersetzte Pseudogene funktionsfähig? Mol.-Nr. Biol. Entwicklung 33, 755–760 (2016).

Gjymishka, A., Su, N. &, Kilberg, M.S. Die transkriptionelle Induktion des humanen Asparaginsynthetase-Gens während der entfalteten Proteinantwort erfordert nicht die ATF6- und IRE1/XBP1-Arme des Weges. Biochem. J. 417, 695–703 (2009).

Andreev, D.E. et al. Die Translation von 5'-Leadern ist in Genen, die gegen eIF2-Repression resistent sind, weit verbreitet. eLife 4, e03971 (2015).

Sidrauski, C., McGeachy, A. M., Ingolia, N. T. & Walter, P. Das kleine Molekül ISRIB kehrt die Wirkungen der eIF2α-Phosphorylierung auf die Translation und den Zusammenbau von Stressgranulaten um. eLife 4, e05033 (2015).

Xiao, Z., Zou, Q., Liu, Y. & Yang, X. Genomweite Bewertung differentieller Translationen mit Ribosomen-Profiling-Daten. Nat. Komm. 7, 11194 (2016).

Guan, B.J. et al. Translationale Kontrolle während des Stresses des endoplasmatischen Retikulums über die Phosphorylierung des Translationsinitiationsfaktors eIF2α hinaus. J. Biol. Chem.-Nr. 289, 12593–12611 (2014).

C. Zhao, S. Datta, P. Mandal, S. Xu und T. Hamilton. J. Biol. Chem.-Nr. 285, 8552–8562 (2010).

Sundaram, A., Plumb, R., Appathurai, S. &. Mariappan, M. Das Sec61-Translokon begrenzt die IRE1α-Signalgebung während der ungefalteten Proteinantwort. eLife 6, e27187 (2017).

ENCODE-Projektkonsortium Eine integrierte Enzyklopädie von DNA-Elementen im menschlichen Genom. Natur 489, 57–74 (2012).

Chew, G. L., Pauli, A. & Schier, A. F. Conservation of uORF repressiveness and sequence features in mouse, human and Zebrafish. Nat. Komm. 7, 11663 (2016).

Delcourt, V. et al. Das Protein, das von einem kurzen offenen Leserahmen kodiert wird, nicht von der annotierten Kodierungssequenz, ist das Hauptgenprodukt des dualkodierenden Gens MIEF1. Mol.-Nr. Zelle. Proteomik 17, 2402–2411 (2018).

Brocchieri, L. &. Karlin, S. Proteinlänge in eukaryotischen und prokaryotischen Proteomen. Nukleinsäuren Res. 33, 3390–3400 (2005).

Lin, M. F., Jungreis, I. & Kellis, M. PhyloCSF: eine vergleichende Genomikmethode zur Unterscheidung von Protein-kodierenden und nicht-kodierenden Regionen. Bioinformatik 27, i275–i282 (2011).

Ingolia, N. T., Brar, G. A., Rouskin, S., McGeachy, A. M. & Weissman, J. S. Genomweite Annotation und Quantifizierung der Translation durch Ribosomen-Profiling. Curr. Protokoll Mol.-Nr. Biol. 103, 4.18.1–4.18.19 (2013).

MacLean, J. A. 2nd & Wilkinson, M. F. Die Rhox-Gene. Reproduktion 140, 195–213 (2010).

Bassani-Sternberg, M., Pletscher-Frankild, S., Jensen, L. J. & Mann, M. Massenspektrometrie von humanen Leukozyten-Antigen-Klasse-I-Peptidomen zeigt starke Auswirkungen der Proteinhäufigkeit und des Proteinumsatzes auf die Antigenpräsentation. Mol.-Nr. Zelle. Proteomik 14, 658–673 (2015).

Erhard, F. et al. Verbessertes Ribo-seq ermöglicht die Identifizierung von kryptischen Übersetzungsereignissen. Nat. Methoden 15, 363–366 (2018).

Calviello, L. & Ohler, U. Beyond Read-Counts: Riboseq-Datenanalyse zum Verständnis der Funktionen des Transkriptoms. Trends Genet. 33, 728–744 (2017).

Cenik, C. et al. Die integrative Analyse von RNA-, Translations- und Proteinspiegeln zeigt deutliche regulatorische Variationen beim Menschen. Genom-Res. 25, 1610–1621 (2015).

Gerashchenko, M. V. & Gladyshev, V. N. Ribonuklease-Selektion für Ribosomen-Profiling. Nukleinsäuren Res. 45, e6 (2017).

Dobin, A. et al. STAR: ultraschneller universeller RNA-seq-Aligner. Bioinformatik 29, 15–21 (2013).

Wang, H., McManus, J. &. Kingsford, C. Abschätzung der Ribosomenbelegung auf Isoform-Ebene anhand der Transkripthäufigkeit mit Ribomap. Bioinformatik 32, 1880–1882 (2016).

Anders, S., Pyl, P.T. & Huber, W. HTSeq – ein Python-Framework für die Arbeit mit Hochdurchsatz-Sequenzierungsdaten. Bioinformatik 31, 166–169 (2015).

Love, M.I., Huber, W. & Anders, S. Moderierte Schätzung der Faltungsänderung und Dispersion für RNA-seq-Daten mit DESeq2. Genom Biol. 15, 550 (2014).

Krogh, A., Larsson, B., von Heijne, G. & Sonnhammer, E.L. Vorhersage der Transmembranproteintopologie mit einem Hidden-Markov-Modell: Anwendung auf vollständige Genome. J.Mol. Biol. 305, 567–580 (2001).

Marchler-Bauer, A. et al. CDD/SPARCLE: Funktionelle Klassifizierung von Proteinen über Unterfamiliendomänenarchitekturen. Nukleinsäuren Res. 45, D200–D203 (2017).

Xu, T. et al. ProLuCID: ein verbesserter SEQUEST-ähnlicher Algorithmus mit verbesserter Sensitivität und Spezifität. J. Proteom. 129, 16–24 (2015).

Cociorva, D., Tabb, D.L. & Yates, J.R. Validierung der Suchergebnisse der Tandem-Massenspektrometrie-Datenbank mit DTASelect. Curr. Protokoll Bioinformatik 16, 13.4.1–13.4.14 (2006).

Chi, H. et al. Umfassende Identifizierung von Peptiden in Tandem-Massenspektren mit einer effizienten offenen Suchmaschine. Nat. Biotechn. 36, 1059–1061 (2018).

Kessler, J. H. et al. Kompetitionsbasierter zellulärer Peptidbindungsassay für HLA Klasse I. Curr. Protokoll Immunol. 61, 18.12.1–18.12.15 (2004).


Ergebnisse

Phylogenetische Analysen

NJ-Bäume von L, M, und S Gene sind jeweils in den Abbildungen 1–3 dargestellt. In jedem Baum gab es separate Cluster, die Isolate enthielten, deren Nagetierwirte Mitglieder der Unterfamilien Arvicolinae, Sigmodontinae und Murinae sind. Diese Cluster werden in den Abbildungen 1–3 als Unterfamilien Arv, Sig bzw. Mur bezeichnet. In den verwurzelten Bäumen von L und m Sequenzen bildete die Mur-Unterfamilie eine Fremdgruppe zu den Arv- und Sig-Unterfamilien, dieses Muster erhielt in beiden Fällen hochsignifikante (100%) Bootstrap-Unterstützung (Abb. 1 und 2). Im Fall der S Sequenzbaum war keine Außengruppe zum Rooten des Baums verfügbar. Der Baum wurde also mit der Wurzel in der Mitte des längsten inneren Astes gezeichnet, diese Wurzelung platzierte Mur wiederum als Fremdgruppe zu Arv und Sig (Abb. 3).

Im Fall der L Genen gab es einen einzigen MP-Baum, dessen Topologie mit der des NJ-Baums identisch war ( Abb. 1 ). Im Falle des m Genen gab es 132 gleichermaßen sparsame Bäume, der Konsensusbaum (nicht gezeigt) war dem NJ-Baum ähnlich ( Abb. 2 ) und zeigte wie dieser die Mur-Unterfamilie als Fremdgruppe zu den Arv- und Sig-Unterfamilien. Im Falle des S Genen gab es wieder acht gleichermaßen sparsame Bäume, der Konsensusbaum (nicht gezeigt) ähnelte stark dem NJ-Baum ( Abb. 3 ).

Während die natürliche Verbreitung der Murinae auf die Alte Welt und die der Sigmodontinae auf die Neue Welt beschränkt ist, kommen Arvicolinae natürlicherweise sowohl in der Neuen Welt als auch in der Alten Welt vor (Hoffmann und Koeppl 1985). Im NJ-Baum von S Genen gab es zwei Hauptuntercluster innerhalb des Arv-Clusters: (1) ein Cluster, dessen Wirte in der Gattung Mikrotus, die sowohl die Alte Welt als auch die Neue Welt bewohnen (Tula-, Isla Vista-, Prairie Vole- und Prospect Hill-Viren) und (2) ein Cluster ausschließlich von Altwelt-Viren, einschließlich Puumala, mit Wirten in der Gattung Clethroonomys, und Chabarowsk, deren Wirt zur Gattung Microtus gehört (Tabelle 1 und Abb. 3). Der ehemalige Subcluster repräsentiert die einzige bekannte Gruppe eng verwandter Hantaviren mit Vertretern der Neuen Welt und der Alten Welt.

In phylogenetischen Bäumen von Nagetier-Mitochondrien cyt b Gene, Arvicolinae und Sigmodontinae gruppierten sich als Schwestertaxa, mit Murinae außerhalb. Im NJ-Baum, der auf DNA-Sequenzen basiert, erhielt der Zweig, der diese Topologie unterstützte, eine signifikante (95%) Bootstrap-Unterstützung (Abb. 4). Im NJ-Baum basierend auf Aminosäuresequenzen (nicht gezeigt) war die Bootstrap-Unterstützung für den entsprechenden Zweig niedriger (73%). In MP-Analysen wurde ein einzelner am sparsamsten Baum für die DNA-Sequenzen gefunden (nicht gezeigt), und darin waren Arvicolinae und Sigmodontinae Schwestertaxa (d. h. das am engsten verwandte Paar monophyletischer Gruppen Wiley 1981). Drei gleichermaßen sparsame Bäume wurden für Aminosäuresequenzen gefunden (nicht gezeigt), und in allen drei waren Arvicolinae und Sigmodontinae Schwestertaxa. Diese Ergebnisse stimmten mit denen von MP- und Maximum-Likelihood-Analysen von Pankreas-Ribonuklease-Genen von Dubois, Catzeflis und Beintema (1999) überein, auch bei diesen Bäumen, Arvicolinae und Sigmodontinae waren Schwestertaxa, obwohl die statistische Unterstützung gering war.

Nukleotidsubstitution

Tabelle 2 zeigt den Mittelwert Dn Werte in Regionen von m Gene, die innerhalb und zwischen den Unterfamilien Arv, Sig und Mur berechnet werden. Allgemein, Dn im AbE und im Rest von G1 höher als in G2 gefunden wurde, und Dn im AbE tendenziell etwas höher als im Rest von G1 (Tabelle 3). Zum S Gene, das Mittel Dn war im CTLE im Allgemeinen viel niedriger als im Rest des Gens für die Arv-Unterfamilie, jedoch nicht für andere Unterfamilien, einschließlich Mur, für die diese Epitope identifiziert wurden (Van Epps, Schmaljohn und Ennis 1999) (Tabelle 3). Dn im AbE war im Allgemeinen höher als im Rest des Gens bei Vergleichen zwischen Unterfamilien, aber nicht bei Vergleichen innerhalb der Unterfamilie (Tabelle 4). Im Gegensatz, Dn in der HV-Region war in allen Vergleichen konsistent und signifikant größer als im Rest des Gens.

Wenn die Rate der nicht-synonymen Substitution in einer Region eines Gens ungewöhnlich hoch ist, deutet dies darauf hin, dass entweder die Region eine geringe funktionelle Einschränkung auf Aminosäureebene aufweist oder dass eine positive Selektion den Aminosäureaustausch in der Region begünstigt hat. Eine Möglichkeit, zwischen diesen Hypothesen zu entscheiden, ist der Vergleich DS und Dn letztere wird bei positiver Selektion voraussichtlich über erstere liegen ( Hughes und Nei 1988 Hughes 1999 ). Im Fall von Hantavirus-Isolaten sind jedoch synonyme Stellen bei Vergleichen zwischen entfernt verwandten Isolaten gesättigt, beispielsweise bei Vergleichen zwischen den Arv-, Sig- und Mur-Unterfamilien (Daten nicht gezeigt). Deshalb haben wir verglichen DS und Dn in 11 phylogenetisch unabhängigen Vergleichen eng verwandter S Sequenzen (siehe Materialen und Methoden). Bedeuten DS war deutlich größer als der Mittelwert Dn in allen analysierten Regionen mit Ausnahme des AbE (Tabelle 4). Das Fehlen eines signifikanten Unterschieds im AbE wurde jedoch nicht durch eine erhöhte verursacht Dn in dieser Region, aber um einen geringeren als üblich DS (Tabelle 4). Vergleiche von eng verwandten S Gensequenzen zeigten keinen Hinweis auf eine positive Selektion auf dem AbE oder einer anderen Region.

Andererseits ist es möglich, dass in der Vergangenheit eine positive Selektion in der HV-Region stattgefunden hat, insbesondere bei der Differenzierung am Nukleokapsidprotein zwischen Hantavirus-Unterfamilien. Um diese Hypothese zu testen, haben wir die modifizierte Methode von Hughes, Ota und Nei (1990) zum Vergleich verwendet PNC und PNR bezüglich der Aminosäurerestladung. Wir haben uns entschieden, die Restladung zu berücksichtigen, da Beweise dafür vorliegen, dass das Muster der Restladungen bei der Bestimmung von Epitopen für Antikörper wichtig ist ( Hopp und Woods 1981 ). Rückstände wurden als positiv geladen (H, K, R), negativ geladen (D, E) und neutral kategorisiert, wobei jede Mutation, die eine Änderung der Kategorie verursachte, als radikal gezählt wurde.

Im CTLE, dem AbE und dem Rest der S Gen, PNC allgemein überschritten PNR oder die beiden Mengen waren ungefähr gleich. Für alle paarweisen Vergleiche gilt: PNC war deutlich größer als PNR sowohl im AbE als auch im Rest (Tabelle 5). Im HV-Bereich hingegen ist der Mittelwert PNR für alle paarweisen Vergleiche war signifikant größer als PNC (Tabelle 5). Dieses Muster schien hauptsächlich durch Vergleiche zwischen Unterfamilien und nicht innerhalb von Unterfamilien zu erklären. Es gab keinen signifikanten Unterschied zwischen Mittelwert PNC und gemein PNR für Vergleiche innerhalb der Unterfamilie (Tabelle 5). Bedeutet jedoch PNR war deutlich größer als der Mittelwert PNC in Nettovergleichen zwischen den Unterfamilien Arv und Sig sowie zwischen diesen beiden Unterfamilien und der Unterfamilie Mur (Tabelle 5). Diese Ergebnisse weisen somit darauf hin, dass nicht-synonyme Unterschiede zwischen den Unterfamilien von Hantaviren derart aufgetreten sind, dass sie Ladungsänderungen in der HV-Region in größerem Ausmaß verursachen als bei zufälliger Substitution erwartet.

Um das Muster der Aminosäureänderung in der HV-Region weiter zu untersuchen, rekonstruierten wir Aminosäureänderungen im Nukleokapsidprotein unter Verwendung der MP-Methode. Unter den rekonstruierten Veränderungen, die an den großen inneren Ästen der Phylogenie (dh den Ästen, die die Arv-, Sig- und Mur-Cluster verbinden) aufgetreten sind, beinhalteten 15 von 24 (62,5%) Veränderungen in der HV-Region eine Ladungsänderung, während nur 41 von 136 (30,1%) Änderungen, die im Rest des Proteins auftraten, beinhalteten eine Ladungsänderung. Der Unterschied zwischen diesen Anteilen war signifikant (χ 2 = 7,01, df = 1 P < 0,01). Somit zeigte diese Analyse auch eine signifikante Neigung zu Ladungsänderungen in der HV-Region unter Hantavirus-Unterfamilien.


Wo finde ich eine Liste von Genen, die für Protein im Menschen kodieren - Biologie

DNA ist ein lebenswichtiges Molekül. Es wirkt wie ein Rezept, das die Anweisungen enthält, die unserem Körper sagen, wie er sich entwickeln und funktionieren soll.

Wofür steht DNA?

DNA ist die Abkürzung für Desoxyribonukleinsäure.

Verschiedene Zellen im Körper

Unser Körper hat etwa 210 verschiedene Zelltypen. Jede Zelle hat eine andere Aufgabe, um unserem Körper zu helfen, zu funktionieren. Es gibt Blutzellen, Knochenzellen und Zellen, die unsere Muskeln bilden.

Woher wissen Zellen, was zu tun ist?

Zellen erhalten ihre Anweisungen, was sie tun sollen, von der DNA. DNA verhält sich wie ein Computerprogramm. Die Zelle ist der Computer oder die Hardware und die DNA ist das Programm oder der Code.

Der DNA-Code wird von den verschiedenen Buchstaben der Nukleotide gehalten. Während die Zelle die Anweisungen auf der DNA "liest", stellen die verschiedenen Buchstaben Anweisungen dar. Alle drei Buchstaben bilden ein Wort namens Codon. Eine Reihe von Codons kann wie folgt aussehen:

Obwohl es nur vier verschiedene Buchstaben gibt, sind DNA-Moleküle Tausende von Buchstaben lang. Dies ermöglicht Milliarden und Abermilliarden verschiedener Kombinationen.

In jedem DNA-String befinden sich Anweisungen, die Gene genannt werden. Ein Gen sagt einer Zelle, wie sie ein bestimmtes Protein herstellen soll. Proteine ​​werden von der Zelle verwendet, um bestimmte Funktionen auszuführen, zu wachsen und zu überleben.

Form des DNA-Moleküls

Obwohl DNA unter dem Mikroskop wie sehr dünne lange Fäden aussieht, stellt sich heraus, dass DNA eine bestimmte Form hat. Diese Form wird Doppelhelix genannt. Auf der Außenseite der Doppelhelix befindet sich das Rückgrat, das die DNA zusammenhält. Es gibt zwei Sätze von Rückgraten, die sich miteinander verdrehen. Zwischen den Rückgraten befinden sich die Nukleotide, die durch die Buchstaben A, T, C und G dargestellt werden. Ein anderes Nukleotid verbindet sich mit jedem Rückgrat und dann mit einem anderen Nukleotid in der Mitte.

Nur bestimmte Nukleotidsätze können zusammenpassen. Man kann sie sich wie Puzzleteile vorstellen: A verbindet sich nur mit T und G nur mit C.


Schau das Video: Wo finde ich die Liste der Ehemaligen (Kann 2022).