Proposition de stage de developpement d’outilslogiciels pour l’etude de phylogenie moleculaireVersion du 8 avril 2008DESCRIPTIFL’utilisation de grappes de calcul informatique (clusters), c’est a dire desystemes informatiques ou les tac^ hes sont reparties simultanement ou tem-porellement entre plusieurs processeurs, se generalise en bio-informatique.On attend de ces clusters un gain de temps consequent en matiere de calculscomplexes. Un des domaines ou^ les clusters apparaissent prometteurs estcelui de la reconstruction de phylogenies, c’est a dire la reconstruction desrelations de parente entre des organismes vivants, plantes, animaux ou bac-teries. Depuis le milieu des annees 90, le developpement de la systematiquemoleculaire a ete rendu possible par la popularisation des techniques d’am-plication selective de fragment de genes (PCR) et la disponibilite d’outilsde sequen cage automatique.Il est desormais relativement aise d’obtenir pour un grand nombre d’or-ganismes (individus ou especes) des sequences de nucleotides issues de l’ana-lyse de plusieurs genes mitochondriaux ou nucleaires. Les jeux de donnees enphylogenie moleculaire s’accroissent donc de maniere quasi exponentielle, cequi a des consequences en matiere de traitement informatique de ces donnees.Classiquement, la reconstruction de genealogies d’individus ou de taxonsse fait via trois types d’approches analytiques destinees a identi er ...
Lesdeuxpremi`eresapprochesatteignentrapidementleurslimitespra-tiquesentermesdetempsdecalcullorsquelesjeuxdedonne´escroissent, mˆemesiplusieurse´quipess’efforcentdemettreaupointdesalgorithmesde vraisemblanceplusrapides.L’inf´erencebaye´siennes’estpopularise´eaucours destroisderni`eresann´eesdufaitdelarapidite´desesalgorithmesdecalcul etdufaitdelapossibilit´ededistribuerlescalculssurplusieursprocesseurs travaillant ensemble. C’est le cas notamment du logiciel MrBayes.
OBJECTIFS Porter,d´evelopperouoptimisersurunedesdeuxgrappesdecalculdu laboratoiredesoutilsdereconstructiond’arbresphylog´en´etiquesinclusou non dans la suite logicielle bio-informatique Bioteam Inquiry. Certains ou-tilslogicielspermettantl’alignementdes´equencesoul’analysededonn´ees dege´n´etiquedespopulationspourrontaussiˆetreprisencompte.Unein-terfacefacilitantlechoixraisonne´desoutilsetleurutilisationpourraeˆtre propos´ee.Lesoutils`autiliserserontceuxdelasuiteded´eveloppementsGnu ou Xcode d’Apple, ainsi que les librairies MPI, SGE ou Xgrid. L’ensemble desnouveauxcodesde´velopp´esserasouslalicencelibre“CeCIL”.