L'assemblage de génome se réfère au processus de prise de nombreux petits morceaux de séquence génétique et en les fusionnant en un ensemble cohérent qui représente génome d'un organisme. C'est un axe majeur du domaine de la bioinformatique, et une variété de projets sur le génome existent à cette fin. L'assemblage de génome a été utilisé pour commencer à analyser les génomes de plusieurs espèces, y compris les humains, les plantes, les animaux et les bactéries.
.L’analyse des gènes d'un organisme est un processus long, et l'assemblage du génome est l'une des premières étapes. Beaucoup d'autres méthodes d'analyse sont construites sur l'assemblage de succès, et l'identification des gènes ne peut pas progresser sans elle. Même avant que les gènes se trouvent un assemblage du génome de succès peut encore générer beaucoup d'informations utiles pour une analyse ultérieure, y compris la taille du génome, sa structure et sa composition générale.
Le processus d'assemblage du génome, c'est comme mettre un puzzle sans avoir une image ou des formes utiles en tant que guide. Lorsqu'ils sont confrontés à des morceaux du génome première, appelée première lecture, il y a rarement des indications où une pièce particulière va, ou même comment il est orienté. Chaque pièce est codée de même avec les quatre bases de l'ADN, en abrégé A, C, G et T. Le génome peut être compacté en un seul grand chromosome ou divisé en plusieurs. Il n'y a également aucune garantie que certaines des lectures brutes ne sont pas des copies de la région même génome, ce qui signifie que moins d'information unique existe qu'il n'y paraît à première vue.
La connaissance générale de la structure du génome est inestimable lors du démarrage du processus d'assemblage. Bien que les génomes entre espèces sont très différentes, il y a certaines règles que les types génomiques spécifiques suivent, et elles peuvent être appliquées lors de la mise un autre génome de ce même type ensemble. Par exemple, si un certain type d'organisme a toujours un modèle particulier à proximité où les gènes sont trouvés, on peut raisonnablement supposer, lors de l'assemblage d'un autre organisme semblable, que trouver un tel modèle serait le signal d'un gène voisin. À plus grande échelle, de nombreux génomes bactériens ont un chromosome circulaire, de sorte qu'il serait raisonnable de s'attendre à ce que toutes les matières premières se lit d'une bactérie nouvelles serait en quelque sorte s'emboîtent sur un chromosome. Appliquer les connaissances générales génétique de cette manière peut permettre à un chercheur de commencer à faire sens de potentiellement des centaines de milliers de morceaux de données.
Il existe de nombreuses autres méthodes qui peuvent être utilisées dans l'assemblage du génome de calcul, y compris les prévisions et les comparaisons manuelles. Peu importe la méthode, le génome d'assemblage est un travail important qui est souvent longue et difficile. Comme il est la base pour de futures analyses génétiques sur l'organisme, il ya peu de place pour l'erreur.