Introduction aux protéines








télécharger 0.63 Mb.
titreIntroduction aux protéines
page14/25
date de publication09.09.2018
taille0.63 Mb.
typeDocumentos
ar.21-bal.com > comptabilité > Documentos
1   ...   10   11   12   13   14   15   16   17   ...   25

2.3.1 CAS DE LA CONSTRUCTION D'UNE BANQUE GENOMIQUE

L'ADN est préparé à partir du tissu le mieux adapté, puis découpé d'une façon la plus aléatoire possible (par cassures mécaniques ou par digestion incomplète par une nucléase de restriction). La construction d'une banque génomique implique le clonage de la totalité du génome, le seul moyen d'y parvenir est de partir de fragments chevauchants.
Tous les fragments de taille admissible par le vecteur choisi auront la possibilité d'être clonés, tout le génome pourra être représenté. Le nombre minimum de clones nécessaires pour qu'une séquence quelconque, appartenant à un génome de taille donnée soit présent dans la banque (qui, théoriquement, contient l'ensemble des séquences d'ADN de l'espèce considérée) peut se calculer par :

             ln(1-P)
N = ---------------
                 L-X
         ln 1- ------
                  M

N : nombre de clones constituant la banque (ou bibliothèque)
P : probabilité pour qu'une séquence donnée soit présente dans la banque (une valeur de 0,99 est acceptable) L : taille moyenne des fragments insérés
X : taille de la séquence souhaitée
M : taille du génome

   Quelle que soit la prétention de cette formule, ceci veut dire qu'une banque génomique réalisée dans un vecteur dérivé du phage lambda devra comprendre environ  40 000 clones différents pour un génome de drosophile et 800 000 pour celui du maïs ou de l'homme. Ces banques sont donc très lourdes et dans bien des cas on constitue un autre type de banque.

2.3.2 CAS DE LA CONSTRUCTION D'UNE BANQUE D'ADN COMPLEMENTAIRES

Elles reposent sur une découverte qui a bouleversé le dogme central de la biologie moléculaire : pour certains virus dont le matériel génétique est de l'ARN, il existe un flux d'information de l'ARN vers l'ADN. Cette étape obligatoire pour leur reproduction est assurée par une enzyme particulière : la transcriptase réverse. Elle permet une synthèse d'ADN double brin (c'est donc une ADN polymérase) à partir d'une molécule d'ARN. Elle représente également un outil très utilisé en génétique moléculaire. On peut en effet synthétiser in vitro des molécules d'ADN dont l'un des brins a une séquence parfaitement complémentaire de celle d'un ARN donné, appelé ADNc .

NB: in vitro, l'activité ribonucléasique de la transcriptase réverse est difficile à maîtriser et l'on utilise souvent d'autres stratégies enzymatiques pour synthétiser le deuxième brin d'ADN.

Les banques dites d'ADN complémentaire présentent les avantages suivants :

  • sachant que dans toute cellule, une très faible partie du génome est transcrit en ARN, quel que soit la catégorie cellulaire qui va servir de point de départ, la banque nécessitera beaucoup moins de clones et l'enrichissement en clones recherchés pourra être considérable si l'on choisitbien un organe, son stade de développement...

  • on ne collectionne que des séquences codantes (sans introns) qui pourront s'exprimer dans un hôte procaryote même si elles sont d'origine eucaryote.

  • elles sont obligatoires pour cloner les gènes des virus à ARN (la majorité des virus des végétaux).

2.4 PREPARATION DES VECTEURS RECOMBINES

Dans les deux cas : découpage mécanique d'ADN génomique ou synthèse d'ADN complémentaire, l'étape suivante est l'insertion dans un vecteur.

L'utilisation de nucléases de restriction produisant des extrémités cohésives simplifie cette étape mais le découpage mécanique et la synthèse d'ADNc ne procurent pas de molécules à extrémités cohésives.

Pour palier cet inconvénient, une technique encore largement utilisée consiste à greffer des "queues" homopolymériques sur le vecteur et leurs complémentaires sur les fragments d'ADN. On utilise un site Pst I du vecteur car elle laisse des extrémités 3' débordantes, ces extrémités vont être allongées par un oligo dG grâce à la transférase terminale (enzyme qui polymérise, de façon non spécifique, des nucléotides à une extrémité 3' libre, elle n'utilise pas de modèle comme l'ADN polymérase). De la même manière, on greffe une queue oligo dC aux extrémités 3' de l'ADN à insérer.
Après hybridation et ligation partielle, les cellules hôtes sont transformées, elles opèrent elles-mêmes une réparation et la ligation recréant du même coup deux sites Pst I qui pourront être utilisés, après amplification, pour récupérer l'ADN cible à partir des clones transformés.

Une autre méthode consiste à greffer, à l'aide d'une ligase, des oligonucléotides (4 ou 6 paires de nucléotides) représentant des sites de reconnaissance pour une nucléase de restriction aux extrémités franches des fragments d'ADN à cloner. Après ligation de ces petites molécules adaptatrices, la digestion par l'enzyme appropriée va créer des extrémités cohésives. On aura la précaution d'avoir protégé au préalable d'éventuels sites internes de reconnaissance (par méthylation par exemple).

2.5 EXPLOITATION DES BANQUES

Plusieurs techniques éprouvées permettent de construire des banques. Il reste à les exploiter, même avec une banque d'ADNc, le nombre de clones est important et le tri représente la partie la plus délicate des expériences de clonage, il existe de nombreuses stratégies mais aucune n'est universelle.

* Remarque : les termes de cribler et de sélectionner n'ont pas la même signification: lors de la sélection, on élimine tous les clones non intéressants, le criblage permet de repérer le clone intéressant.

Le tri peut se faire par sélection lorsque le gène intéressant confère un phénotype particulier à l'hôte tel qu'une résistance à un antibiotique particulier auxquel les cellules sauvages sont sensibles : la culture sur un milieu contenant cet antibiotique ne fera apparaître que les clones transformés contenant ce gène précis.

Le tri par criblage reste le plus courant.

La détection immunologique du produit du gène représente un crible intéressant si le gène recherché est exprimé dans la cellule transgénique ce qui n'est pas toujours le cas.

Le criblage par hybridation de l'ADN des clones transformés avec une sonde spécifique constitue une méthode de choix. L'hybridation peut se faire in situ : on effectue des répliques de clones bactériens cultivés en boîte de Pétri sur des disques de nitrocellulose, après un temps de culture suffisant, les bactéries de ces répliques sont ensuite lysées par la soude qui, en même temps, dénature l'ADN, les molécules simple brin correspondantes se trouvent immobilisées à l'emplacement de chaque clone. Après hybridation, avec la sonde radioactive, l'autoradiographie révélera les clones positifs.

Le problème est déplacé vers celui de l'obtention de la sonde spécifique, correspondant au gène recherché.

  • s'il s'agit d'un gène peu évolué, on peut utiliser une sonde "hétérologue" (en fait une séquence homologue mais provenant d'un autre organisme) en comptant sur une homologie de séquence suffisante pour s'hybrider dans des conditions qui ne donnent pas de faux positifs.

  • lorsqu'une lignée cellulaire synthétise, à un moment donné du développement, un messager majoritaire, on peut tenter sa purification et réaliser un ADN complémentaire qui, une fois cloné servira de sonde pour une banque génomique.

  • si l'on connaît très bien le produit du gène, c'est à dire la séquence, même partielle, en acides aminés, on pourra construire des oligonucléotides selon les codes possibles et "partir à la pèche" avec ces sondes artificielles.

  • Dans les cas désespérés, c'est à dire lorce que l'on ne possède pas de sonde et que l'on n'a aucune idée du produit du gène, connu uniquement par la manifestation phénotypique d'un allèle muté, il reste d'autres solutions, par exemple, la "marche sur chromosome" (chromosome walking) : Par des méthodes faisant appel à des croisement traditionnels et à l'analyse mendélienne, on va essayer d'associer des marqueurs RFLP au locus considéré. L'idèal étant d'encadrer le locus par des marqueurs distants de moins d'un centiMorgan. Le premier marqueur constitue une sonde pour identifier un clone (parmi une banque génomique) qui servira de départ. La cartographie de restriction nous permettra d'identifier un segment situé à une extrémité qui sera, à son tour utilisé comme sonde pour cribler un clone chevauchant et ainsi de suite jusqu'à un second marqueur connu. La séquence recherchée se trouve obligatoirement parmi les clones identifiés. Si l'un d'entre eux peut complémenter un mutant (par transgénie restituant le phénotype sauvage par exemple), c'est qu'il s'agit de la séquence recherchée.

                                                                                       

Le clonage biologique à l'aide d'un vecteur approprié est applicable à n'importe quelle séquence d'ADN (naturelle ou synthétique) et représente un outil d'amplification de molécules homogènes très puissant mais il ne s'agit que d'un outil. Les technologies de l'ADN recombiné in vitro sont à la base de la génétique moderne.


Analyse bioinformatique des séquences

1. - Introduction
 
La bioinformatique est la discipline de l'analyse de l'information biologique, en majorité sous la forme de séquences génétiques et de structures de protéines. C'est une branche théorique de la Biologie, largement antérieure à la récente "révolution génomique". Malgré son nom, la "bioinformatique" ne doit pas être confondue avec une simple application aux données biologiques des concepts et des outils de l'informatique traditionnelle.

1. - Historique et situation française
2. - Qu'est-ce que la bioinformatique ?
3. - Les différentes facettes de la bioinformatique
 




Analyse bioinformatique des séquences

1. - Introduction
1.1 - Historique et situation française
 

   Le terme de 'Bioinformatics' n'est apparu dans la littérature scientifique qu'au tout début des années 90. Cependant, ce domaine de recherche ne vient pas d'émerger. Bien avant que cette discipline ne soit mise sous les feux de la rampe par l'essor de la génomique, quelques dizaines de laboratoires dans le monde travaillaient depuis longtemps en 'biomathématique', une discipline constituée pour répondre aux besoins précoces (dès 1965 !) de la phylogénie moléculaire.

   Le tableau I retrace les grandes étapes de la bioinformatique, et montre à quel point cette discipline a accompagné et souvent précédé le développement des concepts biologiques et des outils informatiques sur laquelle elle est fondée.

   Une partie du retard pris en Europe continentale (et en France) dans ce domaine (la bioinformatique, publique ou privée, est à 90% anglo-saxonne) peut être attribué à une méconnaissance de l'origine et de l'histoire déjà longue des biomathématiques, et à la confusion associée au nouveau terme de 'Bioinformatique'. Les quelques actions en faveur de cette discipline ont été exercées dans un contexte multidisciplinaire Informatique/Biologie, qui n'a jamais collé à la réalité d'un domaine de recherche déjà bien structuré autour de concepts et techniques spécifiques.


Analyse bioinformatique des séquences

1. - Introduction
1.2 - Qu'est-ce que la Bioinformatique ?
 

   La bioinformatique est constituée par l'ensemble des concepts et des techniques nécessaires à l'interprétation de l'information génétique (séquences) et structurale (repliement 3-D). C'est le décryptage de la 'bio-information' ('Computational Biology' en anglais). La bioinformatique est donc une branche théorique de la Biologie. Son but, comme tout volet théorique d'une discipline, est d'effectuer la synthèse des données disponibles (à l'aide de modèles et de théories), d'énoncer des hypothèses généralisatrices (ex. : comment les protéines se replient ou comment les espèces évoluent), et de formuler des prédictions (ex. : localiser ou prédire la fonction d'un gène).

   Depuis son origine, la Bioinformatique a accompagné et/ou précédé l'acquisition de l'information génétique. Elle n'est donc pas un 'produit' de la génomique mais, comme la biologie moléculaire, elle en est un domaine fondateur. La bioinformatique a aussi accompagné et encouragé l'utilisation des ordinateurs en biologie depuis leur origine. La bioinformatique n'est pas pour autant dérivée de la 'science' informatique ; elle n'est (comme l'aéronautique, la banque ou la physique) qu'utilisatrice des ordinateurs et de leurs langages.

   Un véritable 'bioinformaticien' n'est donc pas le simple croisement d'un biologiste et d'un informaticien (pas plus qu'un neurochirurgien n'est celui d'un psychiatre et d'un anatomiste). Il manipule et conçoit des notions originales et doit être familier avec certains domaines mathématiques liés à l'origine de l'informatique (théorie de l'information, théorie des graphes, probabilités et processus stochastiques). En statistiques, par exemple, la bioinformatique a contribué à l'essor de l'approche bayésienne et à celle de l'analyse des valeurs extrêmes.

   Le suffixe 'Informatique' doit donc être compris comme renvoyant à l'interprétation de 'l'information' biologique, et non pas à l'utilisation de l'ordinateur. Le bioinformaticien qui formule des prédictions fonctionnelles ou structurales, joue ainsi un rôle croissant dans l'argumentaire des demandes de brevets (ex : 'ce gène partage tel motif avec tel autre, a donc telle fonction probable, et peut donc être à la base de telle application pharmacologique').

1. - Introduction
1.3 - Les différentes facettes de la bioinformatique
 

   Pour l'analyse des données expérimentales que représentent les séquences biologiques, l'apport informatique concerne principalement quatre aspects :

   Compilation et organisation des données
   Cet aspect concerne essentiellement la création de bases de données. Certaines ont pour vocation de réunir le plus d'informations possible sans expertise particulière de l'information déposée alors que d'autres sont spécialisées dans un domaine considéré avec l'intervention d'experts. Ces dernières bases sont généralement construites autour de thèmes précis comme l'ensemble des séquences d'une même espèce ou les facteurs de transcription. Incontestablement, toutes ces banques de données constituent une source de connaissance d'une grande richesse que l'on peut exploiter dans le développement de méthodes d'analyse ou de prédiction.

   Traitements systématiques des séquences
   L'objectif principal est de repérer ou de caractériser une fonctionnalité ou un élément biologique intéressant. Ces programmes représentent les traitements couramment utilisés dans l'analyse des séquences comme l'identification de phases codantes sur une molécule d'ADN ou la recherche de similitudes d'une séquence avec l'ensemble des séquences d'une base de données.

   Elaboration de stratégies
   Le but est d'apporter des connaissances biologiques supplémentaires que l'on pourra ensuite intégrer dans des traitements standard. On peut donner comme exemples la mise au point de nouvelles matrices de substitution des acides aminés, la détermination de l'angle de courbure d'un segment d'ADN en fonction de sa séquence primaire, ou encore la détermination de critères spécifiques dans la définition de séquences régulatrices.

   Evaluation des différentes approches dans le but de les valider
   Très souvent, tous ces aspects se confondent ou sont étroitement imbriqués pour donner naissance à un ensemble d'outils, d'études ou de méthodes qui convergent vers un but commun que l'on appelle l'analyse informatique des séquences.

   Il est maintenant facile et courant d'effectuer certaines opérations plus ou moins complexes à l'aide de logiciels plutôt que manuellement. Pourtant, ces pratiques ne sont pas toujours systématiques car il est souvent difficile pour certains utilisateurs de savoir quel programme utiliser en fonction d'une situation biologique déterminée ou d'exploiter les résultats fournis par une méthode. C'est pourquoi ce cours contient la présentation d'un certain nombre d'outils ou de méthodes couramment utilisés et reconnus dans l'analyse informatique des séquences. Cependant, cette présentation ne constitue en aucun cas un exposé exhaustif de tout ce qui existe.
1   ...   10   11   12   13   14   15   16   17   ...   25

similaire:

Introduction aux protéines iconIntroduction générale Introduction aux ordinateurs

Introduction aux protéines iconUne introduction aux processus sédimentaires

Introduction aux protéines iconChapitre I : Introduction aux réseaux informatiques

Introduction aux protéines icon1 Introduction aux expérimentations en matière de sûreté de l’espace urbain

Introduction aux protéines iconDenis Monière/Jean Herman Guay (1987) Introduction aux théories politiques

Introduction aux protéines iconTD/tp 1 Introduction au sdk d’Android 1 Introduction
«*. univ-lr fr» pour éviter d’utiliser le proxy pour les adresses internes à l’ulr

Introduction aux protéines iconCharles-Henry cuin, Librairie dr0Z, Genève, 2000. Introduction
«des vertus lustrales à l’eau du bain». Les défenseurs d’un positivisme tempéré empruntent une voie médiane et affirment la vocation...

Introduction aux protéines iconIntroduction aux droits de l'informatique
«création intellectuelle» : invention, solution technique, œuvre littéraire ou artistique, marque, dessins et modèles industriels,...

Introduction aux protéines iconBibliographie sélective Table des matières introduction generale...
«Santé publique» et est destiné aux étudiants en deuxième année de graduat en Sciences Infirmières pour toute les orientations

Introduction aux protéines iconProgramme du symposium et enjeux
«Entreprises étendues» aux partenaires, aux fournisseurs ou aux clients conduit








Tous droits réservés. Copyright © 2016
contacts
ar.21-bal.com