Le traitement de donn'ees comportementales – un tour ...

icon

67

pages

icon

Français

icon

Documents

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

icon

67

pages

icon

Français

icon

Documents

Le téléchargement nécessite un accès à la bibliothèque YouScribe Tout savoir sur nos offres

Le traitement de donnees comportementales { un tour
d’horizon avec des exemples traites par R
c Christian Jost - jost@cict.fr - 2008/2009
document en cours de developpement,
merci de me signaler les erreurs
Avertissement: c’est un tutorial interactif, il n’est souvent comprehensible qu’en
voyant sur l’ecran les reponses de R aux commandes indiquees. Telechargez donc
les chiers associes (voir Avant-propos page 2) et installez-les ensemble avec R sur
votre ordinateur.
15 octobre 2010 Avant-propos
Ce document est un petit tour d’horizon des situations experimentales qu’on peut rencontrer
dans l’etude du comportement et des traitements statistiques a appliquer dans ces cas. Le but ne
sera pas de vous expliquer les theories sous-jacentes a ces methodes statistiques (il y a des livres
qui font cela beaucoup mieux que je pourrais le faire, voir Scherrer (1984) ou Zar (1999)) mais
de donner quelques notions cles necessaires pour leur application, l’interpretation des resultats et
pour les communiquer dans un travail ecrit. Chaque methode sera suivi d’un petit exemple concret
et de quelques references pour aller plus loin.
Le contenu est regroupe en quatres chapitres. Le premier rappelle le type de donnees qu’on
peut rencontrer et comment les representer graphiquement. Le second concerne les statistiques
descriptives et l’estimation des intervalles de con ance. Le troisieme chapitre fait le tour d’horizon
des tests d’hypotheses les plus repandus. En n, le quatrieme chapitre fait ...
Voir icon arrow

Publié par

Nombre de lectures

85

Langue

Français

Poids de l'ouvrage

1 Mo

Letraitementdedonn´eescomportementalesuntour dhorizonavecdesexemplestraite´sparR
c Christian Jost - jost@cict.fr - 2008/2009 documentencoursdede´veloppement, merci de me signaler les erreurs
Avertissement:irlautottsnucelneif,iractintee´rpmoctnevuostsnequleibnshe voyantsurl´ecranlesreponsesdeRxuaconzdee.s´Tlee´hcraegcommandesindiqu´ ´ les fichiers associes (voirAvant-propospage 2) et installez-les ensemble avecRsur ´ votre ordinateur.
15 octobre 2010
Avant-propos
Cedocumentestunpetittourdhorizondessituationsexp´erimentalesquonpeutrencontrer dansl´etudeducomportementetdestraitementsstatistiques`aappliquerdanscescas.Lebutne serapasdevousexpliquerlesthe´oriessous-jacentesa`cesme´thodesstatistiques(ilyadeslivres qui font cela beaucoup mieux que je pourrais le faire, voir Scherrer (1984) ou Zar (1999)) mais dedonnerquelquesnotionscl´´airespourleurapplication,linterpr´etationdesre´sultatset es necess pourlescommuniquerdansuntravail´ecrit.Chaqueme´thodeserasuividunpetitexempleconcret etdequelquesre´fe´rencespourallerplusloin. Lecontenuestregroup´eenquatreschapitres.Lepremierrappelleletypededonne´esquon peutrencontreretcommentlesrepr´esentergraphiquement.Lesecondconcernelesstatistiques descriptivesetlestimationdesintervallesdeconance.Letroisie`mechapitrefaitletourdhorizon destestsdhypothe`seslesplusre´pandus.Enn,lequatri`emechapitrefaitunepetiteintroduction a`lamod´elisationstatistique,enparticulierlesr´egressionsline´airesetnon-lin´eaires.Dunpointde vue longueur le chapitre trois prend clairement le plus de place, mais je pense que le chapitre deux est bien plus important parce que plus fondamental. Donc, n’hesitez pas de revenir dans ce chapitre sidesnotionstelquepr´ecision,erreurstandardouintervalledeconancevousfontdouter. Cedocumentdevraitvousservircommeunpointded´epartquivouspermettedetrouverle traitementstatistiqueadapte´`avotrequestionbiologiqueet`avotredispositifexpe´rimental,ouau insdevousaiguillerdanslabonnedirection.Toutesuggestionpourlam´elierparrapport` mo or a ces buts sera la bienvenue1. Letraitementstatistiquecefaitdenosjours`alaidedordinateurs,aussibienpourlapre´-parationquepourlanalysedesdonne´es.Lesexemplesserontdoncfaitsavecunlogiciellibre spe´ciquementd´evelopp´epourlesanalysesstatistiques,R2esexeesdonn´lesdvaceihrenUc.selpme est disponible sur internet3irvoapchreit2pA.lruo´dseiateedsllinstallation).oVsuevrrzearip-( dement queRitsiseuqsleitatsevqusoupastencigolnusissualeile`asimpiserutilreatuqcegocinils allezrencontrerdansleslaboratoireso`uvousallezpeut-eˆtrefaireunstage(parexempleSystat, SPSS, S-Plus, . . .). Donc, pourquoiR Il y a trois raisons : ?et non pas un logiciel plus simple a) les logiciels “simples” sont payants, vous ne pouvez donc pas les installer sur vos ordinateurs sanspayerunelicence,b)sivousaveccomprislorganisationdesdonn´eesetlinterpr´etationdes analyses dansRvous allez comprendre intuitivement aussi l’utilisation de tous les logiciels men-tionn´esci-dessus,etc)Rest aussi un environnement de programmation qui vous permet de faire despetitsmode`lesetdesexpe´riencesvirtuelles,chosetr`esutileparexemplepourestimerlataille dele´chantillonn´ecessairepourmettreen´evidenceuneetsivousdisposezdesdonne´esdunepre´-expe´rience.Sivousnavezpas(encore)cetteambitionc)contentez-vousderecopierlescommandes Rparrmentrtauappoalus,secraegrlastubxetconcentrez-vatetndiosoesiertssuolruetni´rpr de ce document. Sinon, l’annexe A vous donnera une rapide introduction dans l’utilisation deR pourorganiseretanalyservospropresdonne´es.
1. jost@cict.fr 2..tce/grohrpjo.w-r//wwtt:p 3.th/:ptog/ctini.uon-tpssl.erfv/say-p.ph?id=chj
2
Sommaire
1
2
3
Letypededonn´eesetleurrepre´sentationgraphique 1.1Lesdonn´eesnominales.................................. 1.2Lesdonne´esordinales.................................. 1.3Lesdonne´escontinuesetdiscre`tes...........................
Estimation : des moyennes et des erreurs standards 2.1Lapopulationstatistiqueetl´echantillon........................ 2.2Lebootstrap:uneme´thodeuniversellepourestimerlerreurstandard.......
Lestestsdhypothe`ses 3.1Leschoixbinairesetlestestsassoci´es......................... 3.2Lestestssurlesfr´equencesd´eve`nements........................ 3.3Letestdenormalit´e,param´etriqueique............nnop-ramae´rt... 3.4Comparaisonentredeux´echantillons.......................... 3.5Comparaisonentreplusieurs´echantillons........................ 3.6LesANOVAa`2facteurs................................. 3.7MANOVAetlANOVAa`mesuresr´epe´te´es....................... 3.8LesANCOVA:desfacteurs`amodalite´xeoucontinue............... 3.9Agre´gationetse´gre´gationentreindividus....................... 3.10Dudata-miningetdelad´etectiondeetssignicatifs................ 3.11 La puissance statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.12Au-del`adestestsdhypothe`ses.............................
4Ajustementdemode`le:estimationettestsassocie´s 4.1Lare´gressionlin´eaire................................... 4.2Lacorre´lationsimple................................... 4.3Lar´egressionnon-lin´aire.............. e . . . . . . . . . . . . . . . . . . 4.4 Analyse de survie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5Statistiquesmultivarie´esavanc´ees 5.1 L’analyse en composante principale (ACP) . . . . . . . . . . . . . . . . . . . . . . .
A Quelques aides pour se servir de R A.1 Quelques mots surR. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.2Lesbibliothe`quesetleschiersaccompagnantcedocument............. A.3Organiser,saisir,enregistreret(re)lirevosdonne´esdansR. . . . . . . . . . . . . A.4 Enregistrer et utiliser les graphiques deR. . . . . . .. . . . . . . . . . . . . . . .
R´efe´rencesbibliographiques
3
4 4 5 5
9 9 11
14 15 17 19 20 21 27 29 30 33 35 36 37
43 44 46 46 50
53 53
56 56 56 57 61
63
Voir icon more
Alternate Text