Information

Ausgewogene vs. maximierte Codon-Optimierung

Ausgewogene vs. maximierte Codon-Optimierung



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Ich habe mit der Optimierung mehrerer viraler Proteine ​​aus verschiedenen Viren/Familien mit unterschiedlichen Ergebnissen gearbeitet.

Als Menzella, 2011 veröffentlicht wurde, habe ich diese Methode ausprobiert. Ich fand das ganz gegenteilige Ergebnis, da die Randomisierung weitaus schlechter war als die reine Maximierung der Codon-Nutzung. Ich habe dies auf die Arbeit im Zusammenhang mit Virusinfektionen geschoben (obwohl dies auch bei der transienten Expression durch Plasmidtransfektion unter CMV-Promotion zutraf).

Ich war ziemlich begeistert von dem Nature-Artikel von Pechmann und Frydman, der die Bedeutung der Position des Codons innerhalb des Proteins in Bezug auf die optimale vs. suboptimale Codon-Selektion hervorhob. Seltsamerweise konnten wir diese Information mit der gezielten Deoptimierung eines Proteins am erfolgreichsten einsetzen.

Die Kombination aus Standortbewusstsein, Screening auf Sekundärstruktur und anschließender Maximierung der Codon-Optimierung hat seit mehr als einem Jahr die besten Ergebnisse erzielt. Mit Maximierung meine ich die Wahl des optimalsten Codons in jedem Fall, der nicht gegen Folgendes verstößt:

  1. Benötigte Restriktionsstellen
  2. Prädizierte Sekundärstruktur
  3. Standortgradient in geringerem Maße (ebenda.)

Das ist alles schön und gut, aber wir hatten Probleme mit meinem bevorzugten Anbieter für die Gensynthese. Ein Postdoc, der gerade in mein Labor kam, empfahl mir ein Unternehmen, von dem ich noch nie zuvor gehört hatte, und sie schlugen eine Optimierungsstrategie vor, die ich noch nie zuvor in Betracht gezogen hatte. Anstatt die Codon-Optimierung zu maximieren, schlagen sie eine "ausgewogene" Codon-Optimierung vor, die der normalen Verteilung der Codons im Zielorganismus entspricht.

Zum Beispiel gliedert sich der Codon-Bias für Alanin beim Menschen (ungefähr) wie folgt auf:

  1. GCC 65 %
  2. GCT 20 %
  3. GCA 11%
  4. GCG 4%

Im Gegensatz zu einer Maximierungsstrategie, die versuchen würde, „GCC“ zu verwenden, wann immer möglich und nur, wenn eine Ausgabe auf „GCT“ umgestellt wurde, würde die ausgewogene Strategie versuchen, die obige Verteilung so genau wie möglich zu replizieren.

Hat jemand einen ausgewogenen Codon-Ansatz ausprobiert, insbesondere im Vergleich zu einer Maximierungstechnik? Mein übergeordnetes Ziel ist es, die Expression von natürlich schlecht exprimierendem Protein zu maximieren. Ich weiß, dass eine gerade Maximierung aus verschiedenen Gründen gelegentlich zu einer schlechten Expression führen kann (oft tödliche Sekundärstruktur), aber dies scheint die Expression kaum zu erhöhen.

Mich würde weiterhin interessieren, ob noch jemand Erfahrungen in einem viralen Kontext gemacht hat.

Ich weiß, dass es ein paar verwandte Fragen gab, meistens im Zusammenhang mit E. Coli. Ich glaube nicht, dass dies ein Duplikat ist, wäre aber bereit, es zu entfernen, wenn es als solches angesehen wird. Wenn ich auf zusätzliches Geld stoße, kann ich dies empirisch testen, aber oft, wenn ich einen solchen Test versuche, ist es nur in Bezug auf 2-3 Proteine, was möglicherweise nicht repräsentativ ist.


Die Optimierung der Codon-Nutzung ist immer noch ziemlich heurestisch. Der häufigste Faktor, den wir bei E. Coli für wichtig halten, sind:

  • Optimierung auf stark exprimierte Gene, d.h. Maximierung des Codon Adaptation Index http://www.ncbi.nlm.nih.gov/pubmed/19359587/
  • Beibehaltung des optimalen GC-Inhalts http://www.plosone.org/article/info%3Adoi%2F10.1371%2Fjournal.pone.0107319
  • keine Motive einführen, die irgendwie nachteilig sind, z.B. Restriktionsenzyme oder einige Dinukleotide http://www.plosone.org/article/info%3Adoi%2F10.1371%2Fjournal.pone.0056642
  • Anpassung an verfügbare tRNA http://www.plosone.org/article/info:doi/10.1371/journal.pone.0007002
  • Minimierung der Faltungsenergie (in den ersten ca. 30 Codons) und Minimierung der Anzahl der Haarnadeln am 5'-Ende http://www.sciencedirect.com/science/article/pii/S0014579305010719
  • Optimierung des 'Codon-Kontexts', z.B. Dicodons, aber auch nicht optimale Codons zwischen Sekundärstrukturen für eine genauere Faltung verwenden http://www.ncbi.nlm.nih.gov/pubmed/15772378
  • Optimierung des Codon-Gleichgewichts und vielleicht auch die Einführung einer "Rampe von langsamen Codons" am Anfang eines Gens, um später "Traffic Staus" von Ribosomen zu vermeiden. http://www.ncbi.nlm.nih.gov/pubmed/20403329

Höchstwahrscheinlich ist es eine Mischung aus all dem.

Haftungsausschluss: Wir arbeiten an einer Codon-Optimierungsstrategie für e.coli/yeast/hela und sie funktioniert in e. coli, wurde aber noch nicht in menschlichen Zellen getestet. Wenn Sie eine lange Aufnahme machen möchten, senden Sie mir einfach eine Nachricht und wir können es versuchen. Abgesehen davon würde ich Ihnen auch anbieten, einen Blick auf Ihre Sequenz zu werfen und zu sehen, ob es aus der Sicht der Codon-Nutzung etwas "Seltsames" gibt und was meiner Meinung nach die beste Optimierungsstrategie ist.


In einem direkten Vergleich von 3 viralen Proteinen (2 von Paramyxoviridae, 1 von Caliciviridae) mit jeweils sowohl einer "maximierenden" als auch einer "übereinstimmenden" Codon-Bias, stellten wir fest, dass die "maximierte" Version mehr Protein produziert als die "übereinstimmende" Version in jedem Fall. Die Proteinspiegel wurden über Western und Flow quantifiziert, getestete Zelllinien waren 293T, HEp2 (HeLa-Kontaminierung) und Vero.

Dies ist sicherlich nicht umfassend genug, um eine allgemeine Aussage zu treffen, es ist genau das, was wir gefunden haben. Ich denke, dies wird ein Zellbio- oder reines Mikrobiolabor benötigen, um vollständig zu studieren. Wir sind in Infektionskrankheiten, und diese Frage wäre für das Papier nicht zulässig und nicht Thema. Wenn wir einen Weg finden, es in eine Publikation zu quetschen, werden wir es tun.

Ich werde Jans Antwort akzeptieren, weil sie mehr Informationen zur Optimierung enthält, aber mit dieser Antwort an:

  1. Sprechen Sie an, was wir beobachtet haben.
  2. Beachten Sie, dass Jan's keine Informationen zum "Abgleichen" des Codon-Bias des Zielwirts bietet (außer vielleicht, dass die Optimierung heuristisch ist).

Omics! Omics!

Es gibt einen sehr interessanten Artikel in Science von vor einer Woche, der auf meine Gensynthese-Tage bei Codon zurückgeht. Aber zuerst einige Hintergründe.

Der genetische Code (in erster Näherung) verwendet 64 Codons, um 21 verschiedene Signale zu codieren, daher gibt es einige Wahlmöglichkeiten, welches Codon verwendet werden soll. Aminosäuren und Stop können im Standardschema 1,2,3,4 oder 6 Codons haben. Diese Codons werden jedoch selten mit gleicher Häufigkeit verwendet. Leucin hat zum Beispiel 6 Codons und einige werden selten verwendet, andere oft. Welche Codons bevorzugt und nicht bevorzugt werden und inwieweit dies zutrifft, hängt vom Organismus ab. Im Extremfall kann ein Codon tatsächlich so in Ungnade fallen, dass es ausgestorben ist und nicht mehr verwendet werden kann, und manchmal wird es später etwas anderem zugewiesen, daher einige der saubereren Codes in bestimmten Organismen.

Eine weitere Beobachtung ist, dass die bevorzugteren Codons häufigeren tRNAs entsprechen und weniger bevorzugte Codons weniger häufigen tRNAs. Darüber hinaus sind stark exprimierte Gene oft reich an bevorzugten Codons und niedrig exprimierte Gene verwenden viel eher seltene. Um das Bild zu vervollständigen, gibt es in Organismen wie E. coli Gene, die nicht dem üblichen Muster zu folgen scheinen – und diese werden oft mit mobilen Elementen und Phagen in Verbindung gebracht oder haben andere Hinweise darauf, dass sie kürzlich von einer anderen Spezies erworben wurden .


  • CAI-Maximierung. CAI ist ein Maß für die Verwendung bevorzugter Codons. Diese Strategie versucht, die Statistik durch Verwendung der am meisten bevorzugten Codons zu maximieren. Logik: Wenn dies die am meisten bevorzugten Codons sind und hochexprimierte Gene reich an ihnen sind, warum nicht dasselbe tun?
  • Codon-Probenahme. Diese Strategie (die Codon Devices angeboten hat) Proben aus einer Reihe von Codons mit Wahrscheinlichkeiten proportional zu ihrer Verwendung im Organismus, nachdem zuerst die sehr seltenen Codons auf Null gesetzt und die Tabelle renormalisiert wurde. Logik: vermeide die seltenen, aber hämmere nicht die besseren, auch die Balance ist immer gut
  • Dicodon-Optimierung. Zusätzlich zu Codons, die Präferenzen zeigen, gibt es auch ein Muster, bei dem benachbarte Codons leicht nicht zufällig paaren. Es ist sehr unwahrscheinlich, dass auf ein bestimmtes Beispiel sehr seltener Codons ein weiteres sehr seltenes Codon folgt. Logik: Noch besserer Ansatz für "wenn in Rom".
  • Codon-Frequenz-Matching. Grob gesagt bedeutet dies, dass man sich die native mRNA und ihre Verwendung von Codons anschaut und diese in der Zielspezies nachahmen sollte. Logik: Einige seltene Codons können nur helfen, die Dinge richtig zu falten

Es gibt viel Literatur zur Codon-Optimierung, und das meiste davon leidet unter dem gleichen Fehler. Die meisten Papiere beschreiben, dass man einen ORF nimmt, ihn mit einem bestimmten Optimierungsschema neu synthetisiert und dann die beiden vergleicht. Ein Problem dabei ist das kleine N und das Potenzial für einen Publikationsbias (veröffentlichen die Leute seltener, wenn dies nicht funktioniert?). Außerdem könnte es sein, dass sich durch das resynthetisierte Design noch etwas verändert hat und die Codon-Optimierung wirklich unwichtig ist. Einige Veröffentlichungen weichen von diesem Plan ab und es gab einen Hinweis von der Strukturgenomik-Community, ihre Daten zu untersuchen (da sie oft Codon-optimiert sind), aber systematische Studien sind nicht üblich.

Jetzt kommt in der Wissenschaft die Art von Papier, das beginnt, systematisch zu sein

Kurz gesagt, erzeugten sie eine Bibliothek von GFP-Varianten, in denen das jeweils verwendete Codon zufällig variiert wurde, und exprimierten diese dann von einem Standard-Expressionsvektor in E. coli. Die Zusammenfassung ihrer Ergebnisse ist, dass die Codon-Nutzung nicht mit der GFP-Helligkeit (Expression) korreliert, sondern dass der Schlüsselfaktor die Vermeidung der Sekundärstruktur am Anfang des ORF ist.

Es ist ein guter Ansatz, aber die Frage ist, wie allgemein das Ergebnis ist. Ist GFP in irgendeiner Weise ein spezielles Protein? Warum helfen die seltenen tRNA-exprimierenden Stämme manchmal bei der Proteinexpression? Und vor allem: Gilt dies allgemein oder ist es spezifisch für E.coli und Verwandte?

Dieser letzte Punkt ist im Zusammenhang mit bestimmten Projekten wichtig. E. coli und Saccharomyces haben ihre Codon-Präferenzen, aber wenn Sie eine extreme Präferenz sehen möchten, schauen Sie sich Streptomyces und seine Verwandten an. Dies sind wichtige Hersteller von Antibiotika und anderen Naturstoff-Medikamenten, und es stellt sich heraus, dass die Codon-Verwendungstabelle leicht zu merken ist: Verwenden Sie einfach G oder C an dritter Stelle. Bei einer Spezies, die ich mir ansah, befolgten etwa 95 % aller Codons diese Regel.

Dies hat zur Folge, dass der G+C-Anteil des gesamten ORF recht hoch wird, was weitere Probleme mit sich bringt. DNA mit hohem G+C-Gehalt kann über PCR schwierig zu montieren (oder zu amplifizieren) sein und sie sequenziert schlecht. Darüber hinaus bedeutet eine so begrenzte Auswahl an Codons, dass alles, was auf Proteinebene einer Wiederholung ähnelt, auf DNA-Ebene eine Wiederholung erzeugt, und selbst sehr kurze Wiederholungen können für die Gensynthese problematisch sein. Lange Serien von Gs können auch für Oligonukleotid-Synthesizer problematisch sein (so wurde mir zumindest gesagt). Aus Unternehmenssicht ist dies auch ein Problem, weil sich die Kunden nicht wirklich darum kümmern und nicht verstehen, warum man manche Gene höher bewertet als andere.

Würde die gleiche Strategie also bei Streptomyces funktionieren? Wenn dies der Fall ist, könnte man die Synthese von Hyper-G+C-Genen vermeiden und ausgewogenere Gene verwenden, was die Kosten und die Zeit für die Herstellung der Gene reduziert. Aber jemand müsste den Sprung wagen und die Strategie von Kudla et al. in einigen dieser Zielorganismen wiederholen.


Warum GenSmart™ Codon-Optimierung

  • Barrierefreiheit: Kostenloses Online-Tool mit nur einem Klick zur optimalen Reihenfolge
  • Umfassende Faktorenanalyse: Über 200 geprüfte und validierte Faktoren
  • Fortgeschrittene Computer: Patentierter Populations-Immunalgorithmus, um die beste Leistung zu gewährleisten
  • Individuelle Sequenzbasiert: Hochgradig angepasstes Computing, um Verzerrungen bei der Gewichtungsverteilung bei Schlüsselfaktoren zu vermeiden
  • Einfache Bestellung: Nahtlose Integration mit GenSmart™ Instant Quote System

Wir machen mehr als Codon-Optimierung

Was ist Genoptimierung?

Die Genoptimierung nutzt die Degeneration des genetischen Codes. Aufgrund der Degeneration kann ein Protein von vielen alternativen Nukleinsäuresequenzen kodiert werden. Die Codon-Präferenz (Codon-Usage-Bias) ist in jedem Organismus unterschiedlich und kann die Expression rekombinanter Proteine ​​in heterologen Expressionssystemen erschweren, was zu einer geringen und unzuverlässigen Expression führt. Dies kann auch für die autologe Expression zutreffen, da Wildtypsequenzen nicht unbedingt auf Expressionsausbeute, sondern auch auf Abbau, Regulation und andere Eigenschaften optimiert sind.

Die Codon-Optimierung ist jedoch nicht der einzige relevante Faktor für eine effiziente Proteinexpression.

Unser GeneOptimizer-Algorithmus ermöglicht eine echte multiparametrische Optimierung und befasst sich mit einer großen Anzahl von sequenzbezogenen Parametern, die an verschiedenen Aspekten der Genexpression beteiligt sind, wie Transkription, Spleißen, Translation und mRNA-Abbau. Es berücksichtigt alle relevanten Optimierungsparameter in einem Arbeitsgang und liefert eine nach Ihren Vorgaben konfigurierte DNA-Sequenz, optimiert für die maximale Performance in Ihrem System (Tabelle 1).

Rationales Abwägen der Kombination der Optimierungsparameter (z. B. Codon-Adaption, mRNA de novo Synthese und Stabilität, Transkriptions- und Translationseffizienz) ist wichtig, um die effizienteste Expression eines gegebenen Proteins zu erreichen.

Abbildung 1. Schematische Darstellung der Proteinexpression.

  • GC-Inhalt
  • Konsens-Spleißseiten
  • Kryptische Spleißstellen
  • SD-Sequenzen
  • TATA-Boxen
  • Abschlusssignale
  • Künstliche Rekombinationsstellen
  • RNA-Instabilitätsmotive
  • Ribosomale Eintrittsstellen
  • Wiederholte Sequenzen
  • Codon-Nutzung
  • Vorzeitige Poly(A)-Stellen
  • Ribosomale Eintrittsstellen
  • Sekundärstrukturen

Ein weiterer Vorteil synthetischer Sequenzen ist, dass Sie nicht auf verfügbare DNA-Templates angewiesen sind und Ihre Sequenz exakt nach Ihren Wünschen gestalten können. Fügen Sie Restriktionsstellen, Start-/Stopp-Codons, Tags und weitere Motive nach Bedarf hinzu oder entfernen Sie sie.

Die Sequenzoptimierung mit der GeneOptimizer-Software ist als optionaler Schritt in allen GeneArt™-Gensynthese- und DNA-Fragment-Diensten enthalten. Um diesen Service in Anspruch zu nehmen, wählen Sie Ihren Expression-Host beim Einrichten einer Anfrage über unser Online-Kundenportal aus. Die Online-Software führt Sie dann durch den Projekteinrichtungsprozess, einschließlich der Ablaufoptimierung. Die daraus resultierende optimierte Leistung, die unten beschrieben wird, ist nur ein zusätzlicher Mehrwert von GeneArt DNA.

Wie funktioniert es?

Die Genoptimierung mit der GeneOptimizer-Technologie erfolgt einfach innerhalb weniger Minuten über unser Online-Kundenportal. Entwerfen Sie Ihr synthetisches Gen, indem Sie Ihre Sequenz hochladen, Ihr Expressionssystem auswählen und Ihren Klonierungsvektor und Ihre Sequenzdetails angeben (einschließlich offener Leseraster, untranslatierter Regionen und Klonierungsstellen). Nach dem Absenden Ihrer Anfrage generiert die GeneOptimizer-Software unter Berücksichtigung aller für den jeweiligen Wirtsorganismus relevanten Parameter sowie Ihrer individuellen Sequenzanforderungen die DNA-Sequenz, die am besten zu Ihren Forschungsanforderungen passt.

Beweis, dass es funktioniert

Wir haben mehrere interne Studien durchgeführt und viele Kunden haben unabhängig voneinander berichtet, dass die Codon- und Sequenzoptimierung von GeneArt zu einer höheren Proteinexpression führt, ohne die Proteinfunktion zu verlieren.

In einer ersten Studie ihrer Art [1] wurden fünf wichtige Proteinklassen zur Optimierung ausgewählt: Proteinkinasen, Transkriptionsfaktoren, ribosomale Proteine, Zytokine und Membranproteine. Dann wurden 50 menschliche Gene aus der NCBI-Datenbank ausgewählt, um die fünf Proteinklassen darzustellen. Die ausgewählten Gene wurden mit dem GeneOptimizer-Algorithmus [2] individuell optimiert. Zum Vergleich wurden die entsprechenden Wildtyp-Gene unter Verwendung von nativen Sequenzen, die aus der NCBI-Datenbank erhältlich sind, subkloniert. Jedes Gen wurde dann dreifach in HEK293T-Zellen exprimiert. Nach der Optimierung zeigten alle 50 Gene eine zuverlässige Expression und 86% zeigten eine erhöhte Expression (Beispiel in Abbildung 2). Eine weitere Analyse zeigte keine nachteilige Wirkung auf die Proteinlöslichkeit, und die Funktionalität war unverändert, wie für JNK1, JNK3 und CDC2 gezeigt (Daten nicht gezeigt).

Mit dem GeneOptimizer-Algorithmus in dieser Studie:

  • 86% der optimierten Gene zeigten eine signifikant erhöhte Proteinexpression
  • Bis zu 15-fache Proteinausbeute mit optimierten Genen
  • 100 % der optimierten Gene wurden exprimiert, im Vergleich zu 88 % der Wildtyp-Gene

Abbildung 2. Vergleichende Expressionsanalyse von Wildtyp- vs. optimierten Genen, die verschiedene Proteinklassen repräsentieren. (A) Zellkulturüberstände (für sekretierte Proteine) oder Zelllysate (alle anderen Proteine) wurden durch Western-Blot unter Verwendung eines Anti-His-Antikörpers analysiert. Ein Beispiel für jede Proteinklasse wird gezeigt. Ein 60 kDa Protein, das verwendet wurde, um die Proteinmenge zu standardisieren, ist sichtbar, einschließlich in den negativen Kontrollen des leeren Vektors. Links von jedem Bild: Molekulargewichtswerte in kDa. Rechts neben jedem Bild: Identifikatoren für spezifische Proteinbanden. (B) Relative Expressionsniveaus wurden für Wildtyp- oder optimierte Konstrukte abgeleitet (Mittelwert von drei unabhängigen Transfektionen). Für jedes Protein ist die Expressionssteigerung um dasfache für das optimierte Konstrukt angegeben. Es gab keine nachweisbare Expression für IL-2 unter Verwendung des Wildtyp-Konstrukts. (Abbildung nach Fath et al., 2011 [1]).

Figur 3 veranschaulicht ein weiteres Beispiel für beobachtete Steigerungen sowohl der mRNA- als auch der Proteinausbeute des HIV-gag-Proteins nach der Sequenzoptimierung unter Verwendung der GeneOptimizer-Software.

Um den Wert der GeneOptimizer-Software zu demonstrieren, haben wir die Proteinexpression von Sequenzen verglichen, die von verschiedenen Anbietern optimiert wurden. Gene für drei verschiedene menschliche Kinasen wurden im eigenen Haus optimiert und synthetisiert oder in ähnlicher Weise von fünf verschiedenen Wettbewerbern optimiert und synthetisiert. Dreifache Expressionsstudien in HEK293-Zellen zeigten nicht nur, dass die GeneArt-Optimierung die Expression gegenüber Wildtyp-Genen erhöht, sondern auch, dass sie in jedem Fall besser abschneidet als die Optimierungsalgorithmen der fünf Konkurrenten (Figur 4).

Abbildung 4. Expressionsniveaus von Wildtyp-Genen und denselben Genen, die durch die GeneArt-Technologie und fünf Konkurrenten optimiert wurden. Relative Proteinexpressionswerte werden auf die jeweilige GeneArt-Sequenz normalisiert.


Diskussion

Erfassen der bevorzugten Codon-Nutzungsmuster

Frühere Codon-Optimierungsstudien haben die Verwendung von Genen mit hoher Expression empfohlen, um das rekombinante Gen für eine effiziente heterologe Expression zu entwerfen [12, 13, 34]. Bei der Analyse von Codon-Verwendungsmustern bestätigte der signifikante Unterschied in den ICU- und CC-Verteilungen zwischen stark exprimierten und anderen Genen die Relevanz der Identifizierung von stark exprimierten Genen, um die bevorzugten Codon-Verwendungsmuster zu charakterisieren. Es wird darauf hingewiesen, dass, obwohl in der Codon Usage Database (http://www.kazusa.or.jp/codon/) [35] leicht Informationen zur Codon-Nutzung verfügbar sind, diese Daten möglicherweise nicht für die vorherige Filterung von stark exprimierten Genen nützlich sind wurde nicht durchgeführt. Solche Codon-Nutzungsdaten können eine gewisse Präferenz für „seltene“ Codons widerspiegeln, was zu einer geringen Genexpression führt [36].

Zur Quantifizierung der Codon-Nutzungsmuster stehen mehrere Optionen zur Verfügung. In dieser Studie haben wir die Methode der Behandlung der ICU- und CC-Verteilungen als Vektor von Häufigkeitswerten übernommen, um die relative Häufigkeit einzelner Codons und Codon-Paare zu erfassen. Ein früher bekanntes Verfahren zur Quantifizierung des Codon-Usage-Bias ist der Codon-Adaptation-Index (CAI). Der CAI wurde aufgrund seiner beobachteten Korrelation mit der Genexpression häufig für die Codon-Optimierung verwendet [34]. Durch das Entwerfen eines Gens durch die Maximierung von CAI wird die resultierende codierende Sequenz jedoch zu einem „Eine Aminosäure – ein Codon“-Design mit CAI = 1,0. Dieses Sequenzdesign ist möglicherweise nicht wünschenswert, da die Überexpression dieses Gens zu einer sehr schnellen Verarmung der spezifischen verwandten tRNAs führen kann, was zu einem Ungleichgewicht des tRNA-Pools führt, was wiederum zu einer Zunahme von Translationsfehlern führen kann [37]. In diesem Aspekt ist das Fitnessmaß auf der Intensivstation ein besseres Leistungskriterium als CAI, da ersteres die Aufnahme einer kleinen Anzahl seltener Codons in die endgültige Sequenz ermöglicht. Darüber hinaus basiert die Berechnung von CAI, wie in der Originalarbeit [34] beschrieben, intrinsisch auf der individuellen Codon-Nutzung und hat nicht die Möglichkeit, Codon-Paarungen zu berücksichtigen. Daher können die durch die CC-Fitness erfassten Informationen nicht im CAI-Wert widergespiegelt werden.

Daher ist der vorgeschlagene Ansatz der Optimierung von Codons gemäß der vollständigen ICU- und CC-Verteilungen von stark exprimierten Genen geeignet, das Problem des Ungleichgewichts des tRNA-Pools zu lindern, wenn die Zelle zur Überexpression des Zielgens induziert wird. Daher wurde das Konzept der CAI in dieser Studie nicht berücksichtigt, da dieser einzelne Wert die Details in den Verteilungen auf Intensivstation und CC nicht erfasst.

Andere potenzielle Probleme bei der Wirksamkeit von CCO

Es wurde gezeigt, dass die Verwendung von Codons die Genauigkeit und Geschwindigkeit der Translation beeinflusst [38, 39]. Daher besteht das Konzept der CCO-Implementierung darin, günstige Codon-Paarungen zu identifizieren, die zu einem effizienteren Proteinsyntheseprozess führen können. Insbesondere wurde kürzlich ein Optimierungs-Framework basierend auf der dynamischen Modellierung der Proteintranslation entwickelt, um geeignete Codon-Platzierungen zu identifizieren, um die Translations-Elongationsgeschwindigkeit zu verbessern [40]. Obwohl diese Methode ein mechanistisches Verständnis dafür liefert, wie sich die Codonwahl auf die Translationseffizienz auswirkt, erfordert sie ein kinetisches Modell der Proteintranslation und codonspezifische Elongationsraten, die für andere Organismen als nicht ohne weiteres verfügbar sind E coli wie in früheren Studien gezeigt [32, 41]. Daher kann CCO eine bessere Alternative sein, da es das Ziel der Steigerung der Translationseffizienz erreichen kann und gleichzeitig den Vorteil hat, Informationen zu nutzen, einschließlich Genomsequenz- und Genexpressionsdaten, die in öffentlichen Datenbanken wie dem Gene Expression Omnibus (http: //www.ncbi.nlm.nih.gov/geo/) und GenBank (http://www.ncbi.nlm.nih.gov/genbank/). Übrigens gab es Hinweise darauf, dass die Translationsinitiation und nicht die Elongation der geschwindigkeitsbestimmende Schritt ist [42]. Nichtsdestotrotz können CCO-generierte Sequenzen die Translationsinitiation indirekt erhöhen, indem sie mehr Ribosomen durch erhöhte Translationselongationsraten freisetzen. Der erhöhte Pool an freien Ribosomen kann dann dazu beitragen, die Translationsinitiation durch Massenwirkungseffekt zu verbessern.

Andererseits kann die Translationsinitiation auch durch die mRNA-Struktur der Initiationsstelle beeinflusst werden. Auf der Ebene der Primärstruktur sollten die Shine-Dalgarno-Sequenz und die Kozak-Sequenz am 5'-Ende der kodierenden Sequenz hinzugefügt werden, da frühere Studien gezeigt haben, dass sie für die Erkennung des AUG-Startcodons erforderlich sind, um die Translation in Prokaryoten bzw. Eukaryoten zu initiieren , [43]. Auf der Sekundärstrukturebene wurde festgestellt, dass Hairpin-, Stem-Loop- und Pseudoknot-mRNA-Strukturen die Proteintranslation unterdrücken können [44]. Obwohl dies darauf hindeutet, dass die rechenintensive Bewertung der mRNA-Sekundärstruktur für das Design synthetischer Gene erforderlich sein könnte, wurde auch berichtet, dass die Helikaseaktivität von Ribosomen in der Lage ist, die Sekundärstrukturen für die mRNA-Translation zu stören [45]. Daher schlagen wir vor, die mRNA-Sekundärstrukturanalyse nur als ergänzenden Schritt für die CC-optimierten Sequenzen zu verwenden, so dass dem Haupt-CCO-Verfahren kein signifikanter Rechenaufwand hinzugefügt wird.

CCO-Tool für die synthetische Biologie

Um CCO zu einem Softwarewerkzeug für das Design synthetischer Gene weiterzuentwickeln, müssen möglicherweise mehrere andere Faktoren berücksichtigt werden. Aus experimenteller Sicht sollte die Genoptimierung die Typen von Restriktionsenzymen berücksichtigen, die für die Vektorkonstruktion verwendet werden, so dass die DNA-Motive der Restriktionsstellen vermieden werden, um eine unnötige Spaltung der kodierenden Sequenz zu verhindern. In bestimmten Fällen, in denen die optimierte kodierende Sequenz dazu neigt, Nukleotidwiederholungen aufzuweisen, können zusätzliche Schritte erforderlich sein, um die Wiederholungen oder invertierten Wiederholungen zu vermeiden, die zur DNA-Rekombination bzw. zur Bildung von mRNA-Haarnadelschleifen führen können, die die heterologe Expressivität des Ziels reduzieren Protein [46, 47]. Darüber hinaus kann auch eine Sequenzhomologie in Betracht gezogen werden, um Gene zu entwerfen, die gegen RNA-Interferenz resistent sind, so dass komplementäre Sequenzen der stummschaltenden RNAs in der kodierenden Sequenz vermieden werden [48]. Mögliche Strategien, um die oben genannten Probleme bei der Genoptimierung anzugehen, wurden in einer früheren Studie diskutiert [20].

Die von CCO erzeugten optimalen Sequenzen finden sich in keinem natürlichen Organismus. Daher sollte das CCO-Softwaretool auch Herausforderungen bei der Synthese dieser künstlichen Gene berücksichtigen. Die aktuelle Technologie für de novo Die Gensynthese beinhaltet die chemische Synthese kurzer Oligonukleotide, gefolgt von einem Ligations- oder PCR-vermittelten Zusammenbau der Oligonukleotide, um das vollständige Gen zu bilden [49]. Die Art und Weise, wie eine lange kodierende Sequenz in kurze Oligonukleotide zerlegt wird, muss richtig gestaltet werden, um die Fehlerrate der Oligonukleotidsynthese zu minimieren und die Einheitlichkeit der Annealing-Temperaturen der Oligonukleotide für einen effizienten Zusammenbau zu maximieren. Mehrere Methoden wie DNAWorks [50], Gene2Oligo [51] und TmPrime [52] wurden für diese Ziele bei der Optimierung des Oligonukleotiddesigns für die Gensynthese vorgeschlagen. Obwohl diese Oligonukleotid-Optimierungsverfahren unabhängig vom Codon-Optimierungsverfahren durchgeführt werden können, können diese beiden Prozesse integriert werden, um den „Design-to-Synthesis“-Workflow zu erleichtern. Solange das aktuelle Gensynthese-Paradigma vorherrscht, können Forscher die Möglichkeit der Entwicklung eines integrierten Softwaretools zur Codon- und Oligonukleotid-Optimierung weiter untersuchen, um effektiv und systematisch synthetische Hochleistungsgene für die Proteinexpression zu entwickeln.

Mögliche Anwendungen von CCO

Die Motivation hinter der Codon-Optimierung besteht normalerweise darin, die Expression fremder Gene in Expressionswirten wie z E coli, P. pastoris und S.cerevisiae. Darüber hinaus kann die Codon-Optimierung auch verwendet werden, um synthetische Designs nativer Gene für metabolische Engineering-Anwendungen zu generieren. Während die konventionelle Überexpression nativer Stoffwechselgene durch die Erhöhung der Genkopienzahl durch die Einführung von Plasmiden erreicht wird, bietet die Codon-Optimierung einen alternativen Ansatz zur Verbesserung der Signalwegnutzung durch die Insertion hochexprimierender synthetischer Gene der jeweiligen Stoffwechselenzyme in das Genom des Wirts. Letztere Technik kann von Vorteil sein, da sie die mit der Plasmiderhaltung verbundene metabolische Belastung vermeidet [53–55] und den Zellen somit mehr Ressourcen für Wachstum und biochemische Produktion zur Verfügung stellt.

Neben biotechnologischen Anwendungen kann die Codon-Optimierung auch in der biomedizinischen Forschung eingesetzt werden, wo eine Modulation der Proteinexpression erforderlich ist, um die physiologische Reaktion zu verändern. Beispielsweise besteht bei der Entwicklung von Impfstoffen gegen Viren ein Ansatz darin, das Virus genetisch zu manipulieren, um als Impfstoff einen „lebenden attenuierten“ Stamm zu erhalten. Ein solcher Impfstoff wird bei Verabreichung an den Wirt eine Immunantwort für den Wirt auslösen, um ein immunologisches Gedächtnis und eine spezifische Immunität gegen das Virus zu entwickeln, ohne die gesamte Physiologie ernsthaft zu stören. Einige konventionelle Methoden zur Entwicklung attenuierter Lebendimpfstoffe umfassen die Laboradaptation des Virus in nicht-menschlichen Wirten und die zufällige/ortsgerichtete Mutagenese [56]. Da das Wildtyp-Virus in der Lage ist, die Genexpressionsmaschinerie des Wirts für die Replikation zu kapern, kann die Deoptimierung der viralen Codon-Nutzung zur Entwicklung von abgeschwächten Lebendimpfstoffen führen, wie in einer kürzlich durchgeführten Studie gezeigt wurde [19]. Daher kann das in dieser Studie entwickelte CCO-Framework leicht modifiziert werden, um synthetische Viren zu entwickeln, die aus selteneren Codons bestehen und als Impfstoffe verwendet werden können. Insbesondere können wir entweder die Zielfunktion invertieren, um die CC-Fitness zu minimieren, oder die Ziel-CC-Verteilung während der Ausführung des Optimierungsverfahrens ändern, um die Sequenz des abgeschwächten Virus zu entwerfen.


Verweise

Ladisch MR, Kohlmann KL. Rekombinantes Humaninsulin. Biotechnol. Prog. 19928(6):469–78.

Lieuw K. Viele Faktor-VIII-Produkte zur Behandlung von Hämophilie A: eine Peinlichkeit des Reichtums? J Blut Med. 20178:67–73.

Andersen DC, Krummen L. Rekombinante Proteinexpression für therapeutische Anwendungen. Curr Opin Biotechnol. 200213:117–23.

Dumont J, Euwart D, Mei B, Estes S, Kshirsagar R. Humane Zelllinien für die biopharmazeutische Herstellung: Geschichte, Status und Zukunftsperspektiven. Crit Rev. Biotechnol. 201636(6): 1110–22.

Lagasse HA, Alexaki A, Simhadri VL, Katagiri NH, Jankowski W, Sauna ZE, et al. Jüngste Fortschritte bei der Entwicklung von (therapeutischen Proteinen) Arzneimitteln. F1000Res. 20176:113.

Kim JY, Kim YG, Lee GM. CHO-Zellen in der Biotechnologie zur Herstellung rekombinanter Proteine: aktueller Stand und weiteres Potenzial. Appl Microbiol Biotechnol. 201293(3):917–30.

Davami F, Eghbalpour F, Barkhordari F, Mahboudi F. Wirkung der Peptonfütterung auf den transienten Genexpressionsprozess in CHO DG44. Avicenna J Med Biotechnol. 20146(3):147–55.

Delafosse L, Xu P, Durocher Y. Vergleichende Studie von Polyethyleniminen für die transiente Genexpression in HEK293- und CHO-Zellen von Säugetieren. J Biotechnol. 201610(227):103–11.

Lattenmayer C, Loeschel M, Schriebl K, Steinfellner W, Sterovsky T, Trummer E, et al. Proteinfreie Transfektion von CHO-Wirtszellen mit einem IgG-Fusionsprotein: Selektion und Charakterisierung von stabilen Hochproduzenten und Vergleich mit konventionell transfizierten Klonen. Biotechnologie Bioeng. 200796(6):1118–26.

Kramer O, Klausing S, Noll T. Methoden im Säugerzelllinien-Engineering: von der Zufallsmutagenese zu sequenzspezifischen Ansätzen. Appl Microbiol Biotechnol. 201088(2):425–36.

Harrison RG. Beobachtungen an der lebenden sich entwickelnden Nervenfaser. Proc Soc Exptl Biol Med. 19074:140–3.

Chain E, Florey HW, Adelaide MB, Gardner AD, Oxfd DM, Heatley NG, et al. Penicillin als Chemotherapeutikum. Lanzette. 1940236:226–8.

Schatz A, Bugie E, Waksman SA. Streptomycin, eine Substanz mit antibiotischer Wirkung gegen grampositive und gramnegative Bakterien. Proc Soc Exp Biol Med. 194455:66–9.

Eagle H. Nahrungsbedarf von Säugerzellen in Gewebekulturen. Wissenschaft. 1955122:501-14.

Thyagarajan B, Calos MP. Ortsspezifische Integration für die High-Level-Proteinproduktion in Säugerzellen. Methoden Mol Biol. 2005308:99–106.

Wirth D, Gama-Norton L, Riemer P, Sandhu U, Schucht R, Hauser H. Weg zur Präzision: Rekombinase-basierte Targeting-Technologien für das Genom-Engineering. Curr Opin Biotechnol. 200718(5):411–9.

Campbell M, Corisdeo S, McGee C, Kraichely D. Nutzung der ortsspezifischen Rekombination zur Erzeugung therapeutischer Protein produzierender Zelllinien. Mol Biotechnologie. 201045(3):199–202.

Suzuki T, Kazuki Y, Oshimura M, Hara T. Ein neues System für die gleichzeitige oder sequentielle Integration mehrerer Gen-Ladevektoren in eine definierte Stelle eines menschlichen künstlichen Chromosoms. Plus eins. 20149(10):e110404.

Ahmadi M, Damavandi N, Akbari Eidgahi MR, Davami F. Nutzung der ortsspezifischen Rekombination in der biopharmazeutischen Produktion. Iran Biomed J. 201620(2):68–76.

Nakamura T, Omasa T. Optimierung der Zelllinienentwicklung im GS-CHO-Expressionssystem unter Verwendung eines einzelzellbasierten Klonselektionssystems mit hohem Durchsatz. J Biosci Bioeng. 2015120(3):323–9.

Priola J. J., Calzadilla N., Baumann M., Borth N., Tate CG, Betenbaugh MJ. Hochdurchsatz-Screening und Selektion von Säugerzellen für eine verbesserte Proteinproduktion. Biotechnol. J. 201611(7):853–65.

Kim M, O’Callaghan PM, Droms KA, James DC. Ein mechanistisches Verständnis der Produktionsinstabilität in CHO-Zelllinien, die rekombinante monoklonale Antikörper exprimieren. Biotechnologie Bioeng. 2011108(10):2434–46.

Pilbrough W, Munro TP, Gray P. Intraklonale Proteinexpressionsheterogenität in rekombinanten CHO-Zellen. Plus eins. 20094(12):e8432.

Dharshanan S, Chong H, Hung CS, Zamrod Z, Kamal N. Rapid automated selection of mammalian cell line secreting high level of humanized monoclonal antibody using Clone Pix FL system and the correlation between exterior median intensity and antibody productivity. Electron J Biotechnol. 201114(2). https://doi.org/10.2225/vol14-issue2-fulltext-7.

Tsuruta LR, Lopes Dos Santos M, Yeda FP, Okamoto OK, Moro AM. Genetic analyses of Per. C6 cell clones producing a therapeutic monoclonal antibody regarding productivity and long-term stability. Appl Microbiol Biotechnol. 2016100(23):10031–41.

Wurm FM. Production of recombinant protein therapeutics in cultivated mammalian cells. Nat. Biotechnologie. 200422:1393–8.

Kunert R, Reinhart D. Advances in recombinant antibody manufacturing. Appl Microbiol Biotechnol. 2016100(8):3451–61.

Kinch MS. An overview of FDA-approved biologics medicines. Drogen-Discover heute. 201520(4):393–8.

Jayapal KP, Wlaschin KF, Hu WS, Yap MG. Recombinant protein therapeutics from CHO cells—20 years and counting. CHO Consortium SBE Special Section 2007:40–7.

Kretzmer G. Industrial processes with animal cells. Appl Microbiol Biotechnol. 200259:135–42.

Ayyar BV, Arora S, Ravi SS. Optimizing antibody expression: the nuts and bolts. Methoden. 201701(116):51–62.

Brown AJ, James DC. Precision control of recombinant gene transcription for CHO cell synthetic biology. Biotechnol-Adv. 201634(5):492–503.

Wang W, Jia YL, Li YC, Jing CQ, Guo X, Shang XF, et al. Impact of different promoters, promoter mutation, and an enhancer on recombinant protein expression in CHO cells. Sci Rep. 20177(1):10416.

Ebadat S, Ahmadi S, Ahmadi M, Nematpour F, Barkhordari F, Mahdian R, et al. Evaluating the efficiency of CHEF and CMV promoter with IRES and Furin/2A linker sequences for monoclonal antibody expression in CHO cells. Plus eins. 201712(10):e0185967.

Majocchi S, Aritonovska E, Mermod N. Epigenetic regulatory elements associate with specific histone modifications to prevent silencing of telomeric genes. Nukleinsäuren Res. 201442(1):193–204.

Kaufman RJ. Overview of vector design for mammalian gene expression. Methoden Mol Biol. 199762:287–300.

Gu MB, Kern JA, Todd P, Kompala DS. Effect of amplification of dhfr and lac Z genes on growth and beta-galactosidase expression in suspension cultures of recombinant CHO cells. Zytotechnologie. 19929:237–45.

Payne SH. The utility of protein and mRNA correlation. Trends Biochem Sci. 201540(1):1–3.

Vogel C. Evolution. Protein expression under pressure. Wissenschaft. 2013342(6162):1052–3.

Wurm FM, Pallavicini MG, Arathoon R. Integration and stability of CHO amplicons containing plasmid sequences. Dev Biol Stand. 199276:69–82.

Kim SJ, Lee GM. Cytogenetic analysis of chimeric antibody-producing CHO cells in the course of dihydrofolate reductase-mediated gene amplification and their stability in the absence of selective pressure. Biotechnol Bioeng. 199964:741–9.

Gallegos JE, Rose AB. The enduring mystery of intron-mediated enhancement. Pflanze Sci. 2015237:8–15.

Chappell SA, Edelman GM, Mauro VP. A 9-nt segment of a cellular mRNA can function as an internal ribosome entry site (IRES) and when present in linked multiple copies greatly enhances IRES activity. Proc Natl Acad Sci USA. 200097:1536–41.

Chappell SA, Edelman GM, Mauro VP. Ribosomal tethering and clustering as mechanisms for translation initiation. Proc Natl Acad Sci USA. 2006103(48):18077–82.

Matoulkova E, Michalova E, Vojtesek B, Hrstka R. The role of the 3′ untranslated region in post-transcriptional regulation of protein expression in mammalian cells. RNA Biol. 20129(5):563–76.

Gouse BM, Boehme AK, Monlezun DJ, Siegler JE, George AJ, Brag K, et al. New thrombotic events in ischemic stroke patients with elevated factor VIII. Thrombosis. 20142014:302861.

Kumar SR. Industrial production of clotting factors: challenges of expression, and choice of host cells. Biotechnol J. 201510(7):995–1004.

Williams JA. Improving DNA vaccine performance through vector design. Curr Gene Ther. 201414(3):170–89.

Gustafsson C, Minshull J, Govindarajan S, Ness J, Villalobos A, Welch M. Engineering genes for predictable protein expression. Protein Expr Purif. 201283(1):37–46.

Van Der Kelen K, Beyaert R, Inze D, De Veylder L. Translational control of eukaryotic gene expression. Crit Rev Biochem Mol Biol. 200944(4):143–68.

Ling C, Ermolenko DN. Structural insights into ribosome translocation. Wiley Interdiscip Rev RNA. 20167(5):620–36.

Welch M, Villalobos A, Gustafsson C, Minshull J. You’re one in a googol: optimizing genes for protein expression. J R Soc Interface. 20096(6 Suppl 4):S467–76.

Itakura K, Hirose T, Crea R, Riggs AD, Heyneker HL, Bolivar F, et al. Expression in Escherichia coli of a chemically synthesized gene for the hormone somatostatin. Wissenschaft. 1977198(4321):1056–63.

Athey J, Alexaki A, Osipova E, Rostovtsev A, Santana-Quintero LV, Katneni U, et al. A new and updated resource for codon usage tables. BMC Bioinform. 201718(1):391.

Supek F. The code of silence: widespread associations between synonymous codon biases and gene function. J. Mol. Evol. 201682(1):65–73.

Gardin J, Yeasmin R, Yurovsky A, Cai Y, Skiena S, Futcher B. Measurement of average decoding rates of the 61 sense codons in vivo. eLife. 20143. https://doi.org/10.7554/eLife.03735.

Dana A, Tuller T. The effect of tRNA levels on decoding times of mRNA codons. Nukleinsäuren Res. 201442(14):9171–81.

Dana A, Tuller T. Mean of the typical decoding rates: a new translation efficiency index based on the analysis of ribosome profiling data. G3. 20145(1):73–80.

Yu CH, Dang Y, Zhou Z, Wu C, Zhao F, Sachs MS, et al. Codon usage influences the local rate of translation elongation to regulate co-translational protein folding. Mol Zelle. 201559(5):744–54.

Paulet D, David A, Rivals E. Ribo-seq enlightens codon usage bias. DNA Res Int J Rapid Publ Rep Genes Genom. 201724(3):303–10.

Pouyet F, Mouchiroud D, Duret L, Semon M. Recombination, meiotic expression and human codon usage. eLife. 20176. https://doi.org/10.7554/eLife.27344.

Dittmar KA, Goodenbour JM, Pan T. Tissue-specific differences in human transfer RNA expression. PLoS Genet. 20062(12):e221.

Schmitt BM, Rudolph KL, Karagianni P, Fonseca NA, White RJ, Talianidis I, et al. High-resolution mapping of transcriptional dynamics across tissue development reveals a stable mRNA-tRNA interface. Genom-Res. 201424(11):1797–807.

Kirchner S, Cai Z, Rauscher R, Kastelic N, Anding M, Czech A, et al. Alteration of protein function by a silent polymorphism linked to tRNA abundance. PLoS Biol. 201715(5):e2000779.

Mauro VP, Chappell SA. A critical analysis of codon optimization in human therapeutics. Trends Mol Med. 201420(11):604–13.

Richardson SM, Wheelan SJ, Yarrington RM, Boeke JD. GeneDesign: rapid, automated design of multikilobase synthetic genes. Genom-Res. 200616(4):550–6.

Villalobos A, Ness JE, Gustafsson C, Minshull J, Govindarajan S. Gene designer: a synthetic biology tool for constructing artificial DNA segments. BMC Bioinf. 20067:285.

Angov E, Hillier CJ, Kincaid RL, Lyon JA. Heterologous protein expression is enhanced by harmonizing the codon usage frequencies of the target gene with those of the expression host. Plus eins. 20083(5):e2189.

Wang E, Wang J, Chen C, Xiao Y. Computational evidence that fast translation speed can increase the probability of cotranslational protein folding. Sci Rep. 201521(5):15316.

Bali V, Bebok Z. Decoding mechanisms by which silent codon changes influence protein biogenesis and function. Int J Biochem Cell Biol. 201564:58–74.

Diederichs S, Bartsch L, Berkmann JC, Frose K, Heitmann J, Hoppe C, et al. The dark matter of the cancer genome: aberrations in regulatory elements, untranslated regions, splice sites, non-coding RNA and synonymous mutations. EMBO Mol Med. 20168(5):442–57.

Hanson G, Coller J. Codon optimality, bias and usage in translation and mRNA decay. Nat Rev Mol Cell Biol. 201819(1):20–30.

Rudolph KL, Schmitt BM, Villar D, White RJ, Marioni JC, Kutter C, et al. Codon-driven translational efficiency is stable across diverse mammalian cell states. PLoS Genet. 201612(5):e1006024.

Gingold H, Tehler D, Christoffersen NR, Nielsen MM, Asmar F, Kooistra SM, et al. A dual program for translation regulation in cellular proliferation and differentiation. Zelle. 2014158(6):1281–92.

Ingolia NT, Lareau LF, Weissman JS. Ribosome profiling of mouse embryonic stem cells reveals the complexity and dynamics of mammalian proteomes. Zelle. 2011147(4):789–802.

Park JH, Kwon M, Yamaguchi Y, Firestein BL, Park JY, Yun J, et al. Preferential use of minor codons in the translation initiation region of human genes. Hum Genet. 2017136(1):67–74.

Stadler M, Fire A. Wobble base-pairing slows in vivo translation elongation in metazoans. RNA. 201117(12):2063–73.

Wang H, McManus J, Kingsford C. Accurate recovery of ribosome positions reveals slow translation of wobble-pairing codons in yeast. J Comput Biol. 201724(6):486–500.

Gamble CE, Brule CE, Dean KM, Fields S, Grayhack EJ. Adjacent codons act in concert to modulate translation efficiency in yeast. Zelle. 2016166(3):679–90.

Harigaya Y, Parker R. The link between adjacent codon pairs and mRNA stability. BMC Genom. 201718(1):364.

McCarthy C, Carrea A, Diambra L. Bicodon bias can determine the role of synonymous SNPs in human diseases. BMC Genom. 201718(1):227.

Lorenz FK, Wilde S, Voigt K, Kieback E, Mosetter B, Schendel DJ, et al. Codon optimization of the human papillomavirus E7 oncogene induces a CD8 + T cell response to a cryptic epitope not harbored by wild-type E7. Plus eins. 201510(3):e0121633.

Saikia M, Wang X, Mao Y, Wan J, Pan T, Qian SB. Codon optimality controls differential mRNA translation during amino acid starvation. RNA. 201622(11):1719–27.

Gotea V, Gartner JJ, Qutob N, Elnitski L, Samuels Y. The functional relevance of somatic synonymous mutations in melanoma and other cancers. Pigm Cell Melanoma Res. 201528(6):673–84.

Hunt RC, Simhadri VL, Iandoli M, Sauna ZE, Kimchi-Sarfaty C. Exposing synonymous mutations. Trends Genet. 201430(7):308–21.

Firth AE. Mapping overlapping functional elements embedded within the protein-coding regions of RNA viruses. Nukleinsäuren Res. 201442(20):12425–39.

Fahraeus R, Marin M, Olivares-Illana V. Whisper mutations: cryptic messages within the genetic code. Onkogen. 201635(29):3753–9.

Cheong DE, Ko KC, Han Y, Jeon HG, Sung BH, Kim GJ, et al. Enhancing functional expression of heterologous proteins through random substitution of genetic codes in the 5′ coding region. Biotechnol Bioeng. 2015112(4):822–6.

Martinez MA, Jordan-Paiz A, Franco S, Nevot M. Synonymous virus genome recoding as a tool to impact viral fitness. Trends Mikrobiol. 201624(2):134–47.

de Fabritus L, Nougairede A, Aubry F, Gould EA, de Lamballerie X. Attenuation of tick-borne encephalitis virus using large-scale random codon re-encoding. PLoS Pathog. 201511(3):e1004738.

Wang B, Yang C, Tekes G, Mueller S, Paul A, Whelan SP, et al. Recoding of the vesicular stomatitis virus L gene by computer-aided design provides a live, attenuated vaccine candidate. MBio. 20156(2):1–10.

Magistrelli G, Poitevin Y, Schlosser F, Pontini G, Malinge P, Josserand S, et al. Optimizing assembly and production of native bispecific antibodies by codon de-optimization. mAbs. 20179(2):231–9.

Perez-De-Lis M, Retamozo S, Flores-Chavez A, Kostov B, Perez-Alvarez R, Brito-Zeron P, et al. Autoimmune diseases induced by biological agents. A review of 12,731 cases (BIOGEAS Registry). Expert Opin Drug Saf. 201716(11):1255–71.

Strand V, Balsa A, Al-Saleh J, Barile-Fabris L, Horiuchi T, Takeuchi T, et al. Immunogenicity of biologics in chronic inflammatory diseases: a systematic review. BioDrugs. 201731(4):299–316.

Piga M, Chessa E, Ibba V, Mura V, Floris A, Cauli A, et al. Biologics-induced autoimmune renal disorders in chronic inflammatory rheumatic diseases: systematic literature review and analysis of a monocentric cohort. Autoimmun Rev. 201413(8):873–9.

Zucchelli E, Pema M, Stornaiuolo A, Piovan C, Scavullo C, Giuliani E, et al. Codon optimization leads to functional impairment of RD114-TR envelope glycoprotein. Mol Ther Methods Clin Dev. 201717(4):102–14.

Casadevall N, Nataf J, Viron B, Kolta A, Kiladjian JJ, Martin-Dupont P, et al. Pure red-cell aplasia and antierythropoietin antibodies in patients treated with recombinant erythropoietin. N Engl J Med. 2002346(7):469–75.

Cournoyer D, Toffelmire EB, Wells GA, Barber DL, Barrett BJ, Delage R, et al. Anti-erythropoietin antibody-mediated pure red cell aplasia after treatment with recombinant erythropoietin products: recommendations for minimization of risk. J Am Soc Nephrol. 200415(10):2728–34.

Katsnelson A. Breaking the silence. Nat. Med. 201117(12):1536–8.

Derdeyn CA, Moore PL, Morris L. Development of broadly neutralizing antibodies from autologous neutralizing antibody responses in HIV infection. Curr Opin HIV AIDS. 20149(3):210–6.

McCoy LE, Burton DR. Identification and specificity of broadly neutralizing antibodies against HIV. Immunol Rev. 2017275(1):11–20.

Kimchi-Sarfaty C, Schiller T, Hamasaki-Katagiri N, Khan MA, Yanover C, Sauna ZE. Building better drugs: developing and regulating engineered therapeutic proteins. Trends Pharmacol Sci. 201334(10):534–48.

Chen S, Li K, Cao W, Wang J, Zhao T, Huan Q, et al. Codon-resolution analysis reveals a direct and context-dependent impact of individual synonymous mutations on mRNA level. Mol Biol Evol. 201734(11):2944–58.

Zhou Z, Dang Y, Zhou M, Li L, Yu CH, Fu J, et al. Codon usage is an important determinant of gene expression levels largely through its effects on transcription. Proc Natl Acad Sci USA. 2016113(41):E6117–25.

Newman ZR, Young JM, Ingolia NT, Barton GM. Differences in codon bias and GC content contribute to the balanced expression of TLR7 and TLR9. Proc Natl Acad Sci USA. 2016113(10):E1362–71.

Gustafsson C, Vallverdu J. The best model of a cat is several cats. Trends Biotechnologie. 201634(3):207–13.

Kaur P, Kiselar J, Yang S, Chance MR. Quantitative protein topography analysis and high-resolution structure prediction using hydroxyl radical labeling and tandem-ion mass spectrometry (MS). Mol-Zell-Proteomik. 201514(4):1159–68.


Synthesizing proteins in heterologous hosts is an important tool in biotechnology. However, the genetic code is degenerate and the codon usage is biased in many organisms. Synonymous codon changes that are customized for each host organism may have a significant effect on the level of protein expression. This effect can be measured by using metrics, such as codon adaptation index, codon pair bias, relative codon bias and relative codon pair bias. Codon optimization is designing codons that improve one or more of these objectives. Currently available algorithms and software solutions either rely on heuristics without providing optimality guarantees or are very rigid in modeling different objective functions and restrictions.

We develop an effective mixed integer linear programing (MILP) formulation, which considers multiple objectives. Our numerical study shows that this formulation can be effectively used to generate (Pareto) optimal codon designs even for very long amino acid sequences using a standard commercial solver. We also show that one can obtain designs in the efficient frontier in reasonable solution times and incorporate other complex objectives, such as mRNA secondary structures in codon design using MILP formulations.


We do more than codon optimization

What is gene optimization?

Gene optimization takes advantage of the degeneracy of the genetic code. Because of degeneracy, one protein can be encoded by many alternative nucleic acid sequences. Codon preference (codon usage bias) differs in each organism, and it can create challenges for expressing recombinant proteins in heterologous expression systems, resulting in low and unreliable expression. This may also be true for autologous expression, since wild type sequences are not necessarily optimized for expression yield but also for degradation, regulation, and other properties.

However, codon optimization is not the only relevant factor for efficient protein expression.

Our GeneOptimizer algorithm enables true multiparametric optimization, dealing with a large number of sequence-related parameters involved in different aspects of gene expression, such as transcription, splicing, translation, and mRNA degradation. It considers all relevant optimization parameters in a single operation and delivers a DNA sequence configured with your specifications, optimized for maximum performance in your system (Tabelle 1).

Rationally weighing the combination of the optimization parameters (e.g., codon adaptation, mRNA de novo synthesis and stability, transcription and translation efficiency) is important in order to achieve the most efficient expression of a given protein.

Figure 1. Schematic presentation of protein expression.

  • GC content
  • Consensus splice sites
  • Cryptic splice sites
  • SD sequences
  • TATA boxes
  • Termination signals
  • Artificial recombination sites
  • RNA instability motifs
  • Ribosomal entry sites
  • Repetitive sequences
  • Codon usage
  • Premature poly(A) sites
  • Ribosomal entry sites
  • Secondary structures

One further advantage of synthetic sequences is that you won’t be dependent on available DNA templates, and you can design your sequence exactly according to your requirements. Add or remove restriction sites, start/stop codons, tags, and further motifs as needed.

Sequence optimization using the GeneOptimizer software is included as an optional step with all GeneArt™ Gene Synthesis and DNA fragments services. To take advantage of this service, select your expression host when setting up a request using our online customer portal. The online software will then guide you through the project setup process, including sequence optimization. The resulting optimized performance, described below, is just one additional added value of GeneArt DNA.

Wie funktioniert es?

Gene optimization with GeneOptimizer technology is easily performed within a few minutes using our online customer portal. Design your synthetic gene by uploading your sequence, selecting your expression system, and specifying your cloning vector and your sequence details (including open reading frames, untranslated regions, and cloning sites). Once you submit your request, the GeneOptimizer software generates the DNA sequence that best suits your research requirements, based on consideration of all parameters that are relevant for the given host organism plus your individual sequence requirements.

Proof that it works

We have conducted several internal studies, and many customers have reported independently that GeneArt codon and sequence optimization results in higher protein expression without losing protein function.

In a first-of-its-kind study [1], five important protein classes were selected for optimization: protein kinases, transcription factors, ribosomal proteins, cytokines, and membrane proteins. Then 50 human genes were chosen from the NCBI database to represent the five protein classes. The selected genes were individually optimized using the GeneOptimizer algorithm [2]. For comparison, the corresponding wild type genes were subcloned using native sequences available from the NCBI database. Each gene was then expressed in triplicate in HEK293T cells. Following optimization, the 50 genes all showed reliable expression and 86% exhibited elevated expression (example in Figure 2). Further analysis showed no detrimental effect on protein solubility, and functionality was unaltered, as demonstrated for JNK1, JNK3, and CDC2 (data not shown).

Using the GeneOptimizer algorithm, in this study:

  • 86% of optimized genes showed significantly increased protein expression
  • Protein yields increased up to 15-fold with optimized genes
  • 100% of optimized genes were expressed, versus 88% of wild type genes

Figure 2. Comparative expression analysis of wild type vs. optimized genes representing different protein classes. (A) Cell culture supernatants (for secreted proteins) or cell lysates (all other proteins) were analyzed by western blot using an anti-His antibody. One example of each protein class is shown. A 60 kDa protein used to standardize protein amount is visible, including in the empty vector negative controls. Left of each image: molecular mass values in kDa. Right of each image: identifiers for specific protein bands. (B) Relative expression levels were derived for wild type or optimized constructs (mean of three independent transfections). The fold increase in expression for the optimized construct is indicated for each protein. There was no detectable expression for IL-2 using the wild type construct. (Figure adapted from Fath et al., 2011 [1]).

Figur 3 illustrates another example of observed increases in both mRNA and protein yields of the HIV gag protein after sequence optimization using GeneOptimizer software.

To demonstrate the value of the GeneOptimizer software, we compared protein expression of sequences optimized by different vendors. Genes for three different human kinases were optimized and synthesized in-house or similarly optimized and synthesized by five different competitors. Triplicate expression studies in HEK293 cells showed not only that GeneArt optimization raises expression over wild type genes, but also that it performs better than any of the five competitors’ optimization algorithms in every case (Figur 4).

Figure 4. Expression levels from wild type genes and the same genes optimized by GeneArt technology and five competitors. Relative protein expression values are normalized to the respective GeneArt sequence.


Protein Production and Purification

Protein yield and activity can be maximized by selecting the right lysis reagents and appropriate purification resin. Most recombinant proteins are expressed as fusion proteins with short affinity tags, such as polyhistidine or glutathione S-transferase, which allow for selective purification of the protein of interest.

Protein Production is a complex system of biotechnologies that each step influences with each other process. The recombinant protein purification method are mostly depend on the characteristics of the recombinant protein and the expression system applied. Sino Biological offers one-stop service from gene to purified protein with many years' experience of protein expression and multiple protein purification and refolding technologies. We have got multiple protein expression systems such as bacterial, yeast, baculovirus-insect and mammalian expression system and 30+ purification systems to handle from 2 to 1000 L to meet high-throughput and large-scale protein expression and production.

Protein Production Platform

Protein production is the biotechnological process of generating a specific protein. Commonly used protein production systems include those derived from bacteria, baculovirus/insect cells, mammalian cells and yeast.

Using the right expression system for your specific application is the key to success. Protein solubility, functionality, purification speed, and yield are often crucial factors to consider when choosing an expression system. Additionally, each system has its own strengths and challenges, which are important when choosing an expression system.

Protein Purification Methods

Protein purification means protein fractionation which is also called downstream processing. Protein purification involves a number of processes, including pumping and ultrafiltration, which involve significant shear environments. More importantly, protein tags are a useful and convenient tool for improving solubility of recombinant proteins, streamlining protein purification, and allowing an easy way to track proteins during protein expression and purification.

A wide variety of protein purification methods that can be combined to generate a suitable purification scheme are available. Usually, one executes a series of purification steps, and only rarely proteins can be purified in a single step.

Early steps combine low-resolution and high-capacity methods at later stages of purification scheme. For low-resolution protein purification, methods such as fractional precipitation and two-phase partition systems usually employed. For applications requiring the highest purity and relatively small Protein Purification amounts of protein, chromatography can be chosen to selectively purify the target protein.

Main Chromatography Methods Used in Protein Purification


Mitgliedschaften

Institut für Chemie, Humboldt Universität zu Berlin, 12489, Berlin, Germany

Center for Biotechnology, Rensselaer Polytechnic Institute, Troy, NY, USA

Department of Chemical and Biological Engineering, Rensselaer Polytechnic Institute, Troy, NY, USA

Department of Biological Sciences, Rensselaer Polytechnic Institute, Troy, NY, USA

Sie können auch in PubMed Google Scholar nach diesem Autor suchen

Sie können auch in PubMed Google Scholar nach diesem Autor suchen

Beiträge

G.N. conceived and developed the review. G.N. and M.K. schrieb das Papier.

Korrespondierende Autoren


Schau das Video: Decode from DNA to mRNA to tRNA to amino acids (August 2022).