Une séquence consensus est un ensemble de protéines, ou les nucléotides dans l'acide désoxyribonucléique (ADN), qui apparaît régulièrement. L’acide aminée adénine, la guanine, la cytosine, la thymine et forment des séquences génétiques dans l'ADN. Les biologistes moléculaires ont souvent recours à des statistiques de prédire où une certaine séquence d'entre eux seront, ou de comprendre d'où notamment des molécules tendent à se lier. Où les séquences d'acides aminés sont les mêmes et où elles ont tendance à varier peuvent être représentés par la formule. Dans le cas d'une séquence promotrice consensus, un type particulier d'enzyme peut se lier à des sites de protéines séquencées même. Les généticiens, comme les chercheurs de nombreuses disciplines scientifiques, ont souvent recours à des substitutions de simplifier les systèmes complexes. Il y a tellement de bases d'acides aminés et de gènes dans le corps que les scientifiques ne peuvent pas les compter moins qu'il y ait un système général de le faire. Une séquence consensus peut apparaître dans de nombreux endroits de l'ADN ainsi que dans divers êtres vivants. Les similitudes et les différences qui ont tendance à se produire peut être indiquée par une formule.
Statistiquement, les scientifiques peuvent classer les séquences génétiques pour rechercher des modèles. Les motifs répétitifs, appelés motifs de séquence, sont généralement utilisés pour représenter des zones génétiques qui contrôlent des processus biologiques. Les séquences consensus peut également permettre de mieux comprendre comment les protéines sont synthétisées ou comment les molécules sont guidés à l'intérieur d'une cellule.
Dans la notation d'une séquence consensus, l'emplacement de certains nucléotides peuvent montrer qu'ils sont toujours dans l'emplacement représenté. Il peut également être indiqué que l'un nucléotide ou d'une autre peut être là. Dans ce cas, à quelle fréquence un acide aminé apparaît à la place d'un autre, n'est généralement pas indiqué. Un modèle graphique est parfois utilisé pour indiquer la fréquence, en augmentant ou en diminuant la taille des symboles. Certains logiciels peuvent générer des logos séquence automatiquement.
Souvent, une séquence consensus correspond avec un site de liaison protéine reconnue. Pour brosser un tableau exact des séquences sur le génome, les formules mathématiques sont souvent utilisés. Il s'agit notamment des formules statistiques telles que les logarithmes et les valeurs numériques, qui peuvent être positifs ou négatifs, pour représenter l'emplacement de l'information génétique. Processus dans le génome de fonctions biologiques normales, ainsi que celles liées à des maladies, peuvent être analysés de cette façon.
Les représentations mathématiques d'une séquence consensus fournissent généralement un modèle de l'ADN et les modes d'acides aminés. Une image exacte n'est généralement pas fournie. Les séquences, cependant, peut aider les scientifiques rapportent les aspects fonctionnels de différentes parties du génome à des schémas d'évolution des organismes.