télécharger 0.63 Mb.
|
2.3.1 CAS DE LA CONSTRUCTION D'UNE BANQUE GENOMIQUE L'ADN est préparé à partir du tissu le mieux adapté, puis découpé d'une façon la plus aléatoire possible (par cassures mécaniques ou par digestion incomplète par une nucléase de restriction). La construction d'une banque génomique implique le clonage de la totalité du génome, le seul moyen d'y parvenir est de partir de fragments chevauchants. Tous les fragments de taille admissible par le vecteur choisi auront la possibilité d'être clonés, tout le génome pourra être représenté. Le nombre minimum de clones nécessaires pour qu'une séquence quelconque, appartenant à un génome de taille donnée soit présent dans la banque (qui, théoriquement, contient l'ensemble des séquences d'ADN de l'espèce considérée) peut se calculer par :
N : nombre de clones constituant la banque (ou bibliothèque) P : probabilité pour qu'une séquence donnée soit présente dans la banque (une valeur de 0,99 est acceptable) L : taille moyenne des fragments insérés X : taille de la séquence souhaitée M : taille du génome Quelle que soit la prétention de cette formule, ceci veut dire qu'une banque génomique réalisée dans un vecteur dérivé du phage lambda devra comprendre environ 40 000 clones différents pour un génome de drosophile et 800 000 pour celui du maïs ou de l'homme. Ces banques sont donc très lourdes et dans bien des cas on constitue un autre type de banque. 2.3.2 CAS DE LA CONSTRUCTION D'UNE BANQUE D'ADN COMPLEMENTAIRES Elles reposent sur une découverte qui a bouleversé le dogme central de la biologie moléculaire : pour certains virus dont le matériel génétique est de l'ARN, il existe un flux d'information de l'ARN vers l'ADN. Cette étape obligatoire pour leur reproduction est assurée par une enzyme particulière : la transcriptase réverse. Elle permet une synthèse d'ADN double brin (c'est donc une ADN polymérase) à partir d'une molécule d'ARN. Elle représente également un outil très utilisé en génétique moléculaire. On peut en effet synthétiser in vitro des molécules d'ADN dont l'un des brins a une séquence parfaitement complémentaire de celle d'un ARN donné, appelé ADNc . N ![]() Les banques dites d'ADN complémentaire présentent les avantages suivants :
2.4 PREPARATION DES VECTEURS RECOMBINES D ![]() L'utilisation de nucléases de restriction produisant des extrémités cohésives simplifie cette étape mais le découpage mécanique et la synthèse d'ADNc ne procurent pas de molécules à extrémités cohésives. P ![]() Après hybridation et ligation partielle, les cellules hôtes sont transformées, elles opèrent elles-mêmes une réparation et la ligation recréant du même coup deux sites Pst I qui pourront être utilisés, après amplification, pour récupérer l'ADN cible à partir des clones transformés. U ![]() 2.5 EXPLOITATION DES BANQUES Plusieurs techniques éprouvées permettent de construire des banques. Il reste à les exploiter, même avec une banque d'ADNc, le nombre de clones est important et le tri représente la partie la plus délicate des expériences de clonage, il existe de nombreuses stratégies mais aucune n'est universelle. * Remarque : les termes de cribler et de sélectionner n'ont pas la même signification: lors de la sélection, on élimine tous les clones non intéressants, le criblage permet de repérer le clone intéressant. Le tri peut se faire par sélection lorsque le gène intéressant confère un phénotype particulier à l'hôte tel qu'une résistance à un antibiotique particulier auxquel les cellules sauvages sont sensibles : la culture sur un milieu contenant cet antibiotique ne fera apparaître que les clones transformés contenant ce gène précis. Le tri par criblage reste le plus courant. La détection immunologique du produit du gène représente un crible intéressant si le gène recherché est exprimé dans la cellule transgénique ce qui n'est pas toujours le cas. L ![]() Le problème est déplacé vers celui de l'obtention de la sonde spécifique, correspondant au gène recherché.
Analyse bioinformatique des séquences 1. - Introduction La bioinformatique est la discipline de l'analyse de l'information biologique, en majorité sous la forme de séquences génétiques et de structures de protéines. C'est une branche théorique de la Biologie, largement antérieure à la récente "révolution génomique". Malgré son nom, la "bioinformatique" ne doit pas être confondue avec une simple application aux données biologiques des concepts et des outils de l'informatique traditionnelle. 1. - Historique et situation française 2. - Qu'est-ce que la bioinformatique ? 3. - Les différentes facettes de la bioinformatique ![]() Analyse bioinformatique des séquences 1. - Introduction 1.1 - Historique et situation française Le terme de 'Bioinformatics' n'est apparu dans la littérature scientifique qu'au tout début des années 90. Cependant, ce domaine de recherche ne vient pas d'émerger. Bien avant que cette discipline ne soit mise sous les feux de la rampe par l'essor de la génomique, quelques dizaines de laboratoires dans le monde travaillaient depuis longtemps en 'biomathématique', une discipline constituée pour répondre aux besoins précoces (dès 1965 !) de la phylogénie moléculaire. Le tableau I retrace les grandes étapes de la bioinformatique, et montre à quel point cette discipline a accompagné et souvent précédé le développement des concepts biologiques et des outils informatiques sur laquelle elle est fondée. Une partie du retard pris en Europe continentale (et en France) dans ce domaine (la bioinformatique, publique ou privée, est à 90% anglo-saxonne) peut être attribué à une méconnaissance de l'origine et de l'histoire déjà longue des biomathématiques, et à la confusion associée au nouveau terme de 'Bioinformatique'. Les quelques actions en faveur de cette discipline ont été exercées dans un contexte multidisciplinaire Informatique/Biologie, qui n'a jamais collé à la réalité d'un domaine de recherche déjà bien structuré autour de concepts et techniques spécifiques. Analyse bioinformatique des séquences 1. - Introduction 1.2 - Qu'est-ce que la Bioinformatique ? La bioinformatique est constituée par l'ensemble des concepts et des techniques nécessaires à l'interprétation de l'information génétique (séquences) et structurale (repliement 3-D). C'est le décryptage de la 'bio-information' ('Computational Biology' en anglais). La bioinformatique est donc une branche théorique de la Biologie. Son but, comme tout volet théorique d'une discipline, est d'effectuer la synthèse des données disponibles (à l'aide de modèles et de théories), d'énoncer des hypothèses généralisatrices (ex. : comment les protéines se replient ou comment les espèces évoluent), et de formuler des prédictions (ex. : localiser ou prédire la fonction d'un gène). Depuis son origine, la Bioinformatique a accompagné et/ou précédé l'acquisition de l'information génétique. Elle n'est donc pas un 'produit' de la génomique mais, comme la biologie moléculaire, elle en est un domaine fondateur. La bioinformatique a aussi accompagné et encouragé l'utilisation des ordinateurs en biologie depuis leur origine. La bioinformatique n'est pas pour autant dérivée de la 'science' informatique ; elle n'est (comme l'aéronautique, la banque ou la physique) qu'utilisatrice des ordinateurs et de leurs langages. Un véritable 'bioinformaticien' n'est donc pas le simple croisement d'un biologiste et d'un informaticien (pas plus qu'un neurochirurgien n'est celui d'un psychiatre et d'un anatomiste). Il manipule et conçoit des notions originales et doit être familier avec certains domaines mathématiques liés à l'origine de l'informatique (théorie de l'information, théorie des graphes, probabilités et processus stochastiques). En statistiques, par exemple, la bioinformatique a contribué à l'essor de l'approche bayésienne et à celle de l'analyse des valeurs extrêmes. Le suffixe 'Informatique' doit donc être compris comme renvoyant à l'interprétation de 'l'information' biologique, et non pas à l'utilisation de l'ordinateur. Le bioinformaticien qui formule des prédictions fonctionnelles ou structurales, joue ainsi un rôle croissant dans l'argumentaire des demandes de brevets (ex : 'ce gène partage tel motif avec tel autre, a donc telle fonction probable, et peut donc être à la base de telle application pharmacologique'). 1. - Introduction 1.3 - Les différentes facettes de la bioinformatique Pour l'analyse des données expérimentales que représentent les séquences biologiques, l'apport informatique concerne principalement quatre aspects : Compilation et organisation des données Cet aspect concerne essentiellement la création de bases de données. Certaines ont pour vocation de réunir le plus d'informations possible sans expertise particulière de l'information déposée alors que d'autres sont spécialisées dans un domaine considéré avec l'intervention d'experts. Ces dernières bases sont généralement construites autour de thèmes précis comme l'ensemble des séquences d'une même espèce ou les facteurs de transcription. Incontestablement, toutes ces banques de données constituent une source de connaissance d'une grande richesse que l'on peut exploiter dans le développement de méthodes d'analyse ou de prédiction. Traitements systématiques des séquences L'objectif principal est de repérer ou de caractériser une fonctionnalité ou un élément biologique intéressant. Ces programmes représentent les traitements couramment utilisés dans l'analyse des séquences comme l'identification de phases codantes sur une molécule d'ADN ou la recherche de similitudes d'une séquence avec l'ensemble des séquences d'une base de données. Elaboration de stratégies Le but est d'apporter des connaissances biologiques supplémentaires que l'on pourra ensuite intégrer dans des traitements standard. On peut donner comme exemples la mise au point de nouvelles matrices de substitution des acides aminés, la détermination de l'angle de courbure d'un segment d'ADN en fonction de sa séquence primaire, ou encore la détermination de critères spécifiques dans la définition de séquences régulatrices. Evaluation des différentes approches dans le but de les valider Très souvent, tous ces aspects se confondent ou sont étroitement imbriqués pour donner naissance à un ensemble d'outils, d'études ou de méthodes qui convergent vers un but commun que l'on appelle l'analyse informatique des séquences. Il est maintenant facile et courant d'effectuer certaines opérations plus ou moins complexes à l'aide de logiciels plutôt que manuellement. Pourtant, ces pratiques ne sont pas toujours systématiques car il est souvent difficile pour certains utilisateurs de savoir quel programme utiliser en fonction d'une situation biologique déterminée ou d'exploiter les résultats fournis par une méthode. C'est pourquoi ce cours contient la présentation d'un certain nombre d'outils ou de méthodes couramment utilisés et reconnus dans l'analyse informatique des séquences. Cependant, cette présentation ne constitue en aucun cas un exposé exhaustif de tout ce qui existe. |
![]() | ![]() | ||
![]() | ![]() | ||
![]() | ![]() | «*. univ-lr fr» pour éviter d’utiliser le proxy pour les adresses internes à l’ulr | |
![]() | «des vertus lustrales à l’eau du bain». Les défenseurs d’un positivisme tempéré empruntent une voie médiane et affirment la vocation... | ![]() | «création intellectuelle» : invention, solution technique, œuvre littéraire ou artistique, marque, dessins et modèles industriels,... |
![]() | «Santé publique» et est destiné aux étudiants en deuxième année de graduat en Sciences Infirmières pour toute les orientations | ![]() | «Entreprises étendues» aux partenaires, aux fournisseurs ou aux clients conduit |