Skip to content. | Skip to navigation

Personal tools
Log in
Sections
You are here: Home Blog Topics bioinformatik

bioinformatik

whole genome shotgun sequencing simulator

by Bastian Blank — last modified Jun 16, 2007 09:04 PM
Filed Under:

Die Bioinformatik baut zum lösen von biologischen Problemen gerne Simulationen. Ein "whole genome shotgun sequencing simulator" ist so einer. Erst wird ein Genom auseiner geschnitten, durch die Mangel gedreht (1-5% Fehlerrate sind normal) und dann wieder zusammen geflickt.

Das Sequenzieren von kompletten Genomen, wie dasjenige des Menschen, ist ein immer noch problematisches Feld. Der Input besteht aus DNA mit seinen 4 Bausteinen und einer Länge von vielen Millionen Basenparen. Es gibt keine Technik die diesen Strang am Stück sequenzieren könnte. Also kloniert man das Genom (Genetiker verstehen unter klonieren das vervielfältigen von DNA-Stücken, nicht von Organismen) und schneidet dieses anschließend in kleine Stücke, die sequenziert werden können.

Aus diesen einzelnen Stücken versucht man jetzt ein komplettes Genom zusammen zu basteln. Bei den kodierenden Bereichen, also denen wo wirklich Informationen stehen, klappt das auch so einigermassen. Bei den nicht-kodierenden Bereichen, z.B. den langen Ketten aus lauter kurzen Wiederholungen, funktioniert das viel weniger gut oder gar nicht.

Der Simulator generiert jetzt diese Bruchstücke um den Schritt des Zusammensetzens testen zu können. Der ganze Schritt ist natürlich herlich randomisiert, so das man nie auch nur ähnliches rausbekommt, auch wenn am Schluss des zusammensetzens jedesmal wieder das selbe stehen soll.