Künstliche Intelligenz erkennt eine neue Klasse von Mutationen hinter Autismus

Künstliche Intelligenz erkennt eine neue Klasse von Mutationen hinter Autismus

Viele Mutationen in der DNA, die dazu beitragen, Krankheiten sind nicht in der tatsächlichen Gene, sondern liegen in der 99% des Genoms einst als „junk.“ Obwohl Wissenschaftler haben in jüngster Zeit kommen zu verstehen, dass diese weiten Strecken der DNA in der Tat spielen eine entscheidende Rolle, dechiffrieren diese Effekte auf einer breiten Skala wurde bisher unmöglich.

Die Verwendung von künstlicher Intelligenz, eine Princeton-Universität-geführtes team hat dekodiert die funktionellen Auswirkungen solcher Mutationen bei Menschen mit Autismus. Die Forscher glauben, dass diese kraftvolle Methode ist allgemein anwendbar, um zu entdecken, wie genetische Beiträge zu einer Krankheit.

Publishing-27. Mai in der Fachzeitschrift Nature Genetics, die Wissenschaftler analysierten die Genome von 1,790 Familien, in denen ein Kind hat Autismus-Spektrum-Störung, aber auch die anderen Mitglieder nicht. Die Methode sortiert unter 120,000 Mutationen zu finden, die Einfluss auf das Verhalten der Gene, die bei Menschen mit Autismus. Obwohl die Ergebnisse nicht zu offenbaren genauen Ursachen der Fälle von Autismus zeigen Sie tausenden der möglichen Teilnehmer für die Forscher, um zu studieren.

Viel früheren Forschung konzentrierte sich auf die Identifizierung von Mutationen in den Genen selbst. Gene sind im wesentlichen Anweisungen für die Herstellung der vielen Proteine, die den Aufbau und die Kontrolle des Körpers. Mutationen in Genen, die das Ergebnis in mutierten Proteinen, deren Funktionen gestört sind. Andere Arten von Mutationen, jedoch stören, wie die Gene reguliert werden. Mutationen in diesen Bereichen betreffen nicht das, was die Gene machen, aber Wann und wie viel Sie verdienen.

Bis jetzt war es nicht möglich sich über das gesamte Genom für die Schnipsel der DNA, die die Gene regulieren und voraussagen, wie sich die Mutationen in diesem regulatorischen DNA sind wahrscheinlich dazu beitragen, komplexe Erkrankung, die Forscher sagte. Diese Studie ist die erste Beweis dafür, dass Mutationen in regulatorischen DNA kann die Ursache für eine komplexe Erkrankung.

„Diese Methode bietet einen Rahmen für diese Analyse mit einer Krankheit,“ sagte Olga Troyanskaya, professor für informatik und Genomik und ein senior-Autor der Studie. Der Ansatz könnte besonders hilfreich sein für neurologische Störungen, Krebs, Herz-Krankheit und viele andere Bedingungen, entzog Identifizierung der genetischen Ursachen.

„Damit verwandelt sich der Weg, wir müssen denken über die möglichen Ursachen dieser Krankheiten,“ sagte Troyanskaya, die auch der stellvertretende Direktor für Genomik an der Simons-Stiftung Flatiron-Institut in New York, wo Sie führte eine Gruppe von co-Autoren.

Dem team gehörte auch eine Arbeitsgruppe von Neurowissenschaftler Robert Darnell von Der Rockefeller-Universität. Die ersten Autoren des Papiers sind, Jian Zhou und Christopher Park, wer verdient Ph. D. s in Princeton und jetzt sind Sie Mitarbeiter am Lewis-Sigler Institute for Integrative Genomics und Forscher des Flatiron-Institut und Chandra Theesfeld an der Princeton s Lewis-Sigler Institute for Integrative Genomics.

Die meisten bisherigen Untersuchungen über die genetische basis der Krankheit konzentriert sich auf die etwa 20.000 Gene bekannt und die umliegenden Abschnitte der DNA, welche die Gene. Aber auch diese enorme Menge an genetischer information macht nur etwas mehr als 1% von den 3,2 Milliarden chemischen-Paare im menschlichen Genom. Die anderen 99% konventionell gedacht, wie „dunkel“ oder „junk“, obwohl die neuere Forschung hat begonnen zu stören, die Idee.

In Ihrem neuen zu finden, die Forschungs-team bietet eine Methode, um Einblick in diese Vielzahl von genomischen Daten. Das system verwendet eine künstliche Intelligenz-Technik namens deep learning, in dem ein Algorithmus führt die aufeinander folgenden Ebenen der Analyse zu lernen, um Muster, die sonst unmöglich wäre, Sie zu erkennen. In diesem Fall hat der Algorithmus lernt, wie zu identifizieren, die biologisch relevante DNA-Abschnitte und der vorhersagt, ob diese snippets eine Rolle spielen, in jedem der mehr als 2.000-protein-Wechselwirkungen, die bekannt sind, um Einfluss auf die regulation von Genen. Das system sagt auch, ob die Unterbrechung eines einzigen Paares von DNA-Einheiten haben einen wesentlichen Einfluss auf die protein-Interaktionen.

Der Algorithmus „gleitet entlang des Genoms“ Analyse jede einzelne Chemische pair in den Kontext der 1.000 Chemische Paaren um ihn herum, bis er gescannt hat alle Mutationen, Troyanskaya, sagte. Das system lässt sich daher voraussagen, die Wirkung von mutierend jeder und jede Chemische Einheit, die das gesamte Genom. Am Ende, es zeigt sich eine priorisierte Liste von DNA-Sequenzen, die wahrscheinlich regulieren die Gene und Mutationen, die wahrscheinlich zu stören, dass bei der Regulierung.

Vor dieser rechnerische Leistung, die herkömmliche Art zu Lesen solcher Informationen wäre sorgfältigen Laborexperimenten auf jede Sequenz und jede mögliche mutation in dieser Sequenz. Diese Anzahl von möglichen Funktionen und Mutationen ist zu groß, um es zu betrachten—ein experimenteller Ansatz würde erfordern, die Prüfung jeder mutation vor mehr als 2.000 Arten von protein-Interaktionen und wiederholen die Experimente über und über über Gewebe-und Zelltypen, in Höhe von Hunderten von Millionen von Experimenten. Andere Forschergruppen haben versucht, zu beschleunigen diese Entdeckung durch die Anwendung des maschinellen Lernens, um gezielt DNA-Abschnitte, hatte aber nicht die Fähigkeit erlangt, jede DNA-Einheit, und jede mögliche mutation und die Auswirkungen auf die jeweils von mehr als 2.000 regulatorische Interaktionen über das gesamte Genom.

„Was unser Papier wirklich ermöglicht es Ihnen, zu tun ist, nehmen Sie alle diese Möglichkeiten, und ordnen Sie Sie,“ sagte Park. „Dass die Priorisierung selbst ist sehr nützlich, denn jetzt können Sie auch gehen Sie vor und machen Sie die Experimente in der gerade die höchste Priorität-Fälle.“

Schließlich hat das system kalibriert die basiert auf bekannten Krankheit-verursachenden Mutationen und entwickelt eine „Krankheit Auswirkungen Partitur,“ eine Einschätzung, wie wahrscheinlich eine bestimmte mutation einen Effekt auf die Krankheit.

Im Fall von Autismus, die Forscher analysierten die Genome von 1,790 Familien mit „simplex“ Autismus-Spektrum-Störung, was bedeutet, die Bedingung ist offensichtlich, bei einem Kind, aber nicht in anderen Mitglieder der Familie. (Diese Daten wurden aus der Simons-Simplex-Sammlung von mehr als 2.000 Autismus Familien.) Bei diesem Beispiel weniger als 30% der Menschen, die von Autismus-Spektrum-Störung hatten zuvor identifizierten genetischen Ursache. Die neu gefundenen Mutationen sind wahrscheinlich deutlich erhöhen, der Anteil, sagte der Forscher.

Die Fähigkeit zur Vorhersage der funktionellen Auswirkungen der einzelnen mutation war die wichtigste innovation in dieser neuen Studie. Frühere Studien hatten gefunden es schwierig zu erkennen, keinen Unterschied in der Anzahl der regulatorischen Mutationen bei Menschen mit Autismus im Vergleich zur unberührt Menschen. Die neue Methode sah jedoch auf Mutationen vorhergesagt haben einen hohen funktionalen Auswirkungen, und fanden eine deutlich höhere Anzahl solcher Mutationen in den betroffenen Menschen.

Als die Forscher dann angeschaut, welche Gene betroffen waren, die durch diese Mutationen, Sie stellte sich heraus, dass die Gene eng mit Funktionen des Gehirns. Diese neu entdeckte Mutationen betroffen sind ähnliche Gene und Funktionen, wie die zuvor identifizierten Mutationen.

„Jetzt öffnen wir das Feld zu verstehen, alle Faktoren, die beteiligt sein können, in Autismus,“ sagte Theesfeld.

Diese information ist auch wichtig, Familien und Ihre ärzte besser diagnostizieren die Erkrankung und vermeiden Sie zu Allgemeine Annahmen, wie eine person, die Autismus sein könnte, klassifiziert mit anderen. „Sie sagen, dass, wenn Sie eine person mit Autismus, die Sie getroffen haben, eine person mit Autismus, weil kein Fall dem anderen gleicht,“ sagte Theesfeld. „Genetisch, es scheint der gleiche Weg.“