Les références

add1

\bullet Présentation

Cet article ne vise pas à établir une liste exhaustive des ouvrages et sites web et surtout meilleurs que les autres. Il s’agit ici de présenter une bibliothèque, principalement construite autour des références régulièrement citées dans les documents parcourus pour construire ce site.

C’est également l’occasion de faire un peu de promotions aux copains qui sont tout autant passionnés par cette discipline époustouflante qu’est la statistique et la probabilité et qui font un super boulot pour mettre en lumière tout ce qu’elle peut apporter au monde d’aujourd’hui et de demain.

\bullet Les ouvrages

Histoire et pré-histoire de l’analyse des données de Jean-Paul Benzécri (160 pages)

add

Pour la petite histoire, Mr Jean-Paul Benzécri est le père-fondateur de l’Analyse Factorielle des Correspondances. Son ouvrage présente en première partie une synthèse sur l’histoire des statistiques du début de notre civilisation à 1982 ainsi que l’aspect philosophique qui se cache derrière ces disciplines que sont la Probabilité et la Statistique. La seconde partie de son livre est dédiée à l’AFC et l’ACM, de manière plus littéraire que « matheuse », régulièrement argumentée par des figures précieuses pour la compréhension. Un livre rare à trouver et qui reste un classique à avoir sur son étagère.

Contenu:

– Chapitre I: La préhistoire.

– Chapitre II: La biométrie.

– Chapitre III: Era piscatoria.

– Chapitre IV: La psychométrie.

– Chapitre V: L’Analyse des correspondances.

Statistique, dictionnaire encyclopédique de Yadolah Dodge (634 pages)

add

Comme son nom l’indique, il s’agit d’un petit dictionnaire plus ou moins pratique. Plus, car il fournit un document standardisé du vocabulaire statistique ainsi qu’un bon balayage sur pas mal d’outils/méthodes à utiliser un de ces jours et connus que de nom, le tout décliné par une partie historique, théorie et exemple bien pratique et vraiment très agréable à lire. Moins, car il manque pas mal d’outils (notamment au niveau des tests statistiques) et toute la partie Data Mining. Cependant, avec le recul, ce n’est pas vraiment l’objectif de ce dictionnaire encyclopédique qui fait finalement office de synthèse d’autres encyclopédies des Statistiques.

La probabilité, le hasard et la certitude de Paul Deheuvels (128 pages)

add

Excellent livre s’inscrivant dans la série des « que sais-je? » et qui n’est plus à présenter. L’ouvrage se positionne essentiellement sur la théorie des jeux de hasard et se divise en fait en deux parties. La première, présente les principaux théorèmes et propriétés qui vont servir à alimenter la seconde partie, plus axée sur nos chances de gagner aux jeu de hasard. Et le tout ponctué d’une conclusion pertinente et théoriquement argumentée. Un réel plaisir à lire.

Contenu:

– Chapitre I: De l’impossibilité d’observer des évènements improbables.

– Chapitre II: Les débuts du calcul de probabilités, fortune et ruine du chevalier de Méré.

– Chapitre III: Espérance de gain dans un jeu de hasard; loi des grands nombres de Bernouilli.

– Chapitre IV: Fondements logiques du calcul des probabilité. Einstein et le mouvement brownien, le modèle de Kolmogorov.

– Chapitre V: Les nombres normaux de Borel et l’explication naturelle de la loi des grands nombres au jeu de pile ou face.

– Chapitre VI: Autres exemples de calcul des probabilités en théorie des nombres; Hardy et Ramanujan, Erdos, Kac et Lévêque, développements en fractions continues.

– Chapitre VII: Indépendances de variables aléatoires, le théorème de Kommogorov, fonctions de Rademacher, échangeabilité et le théorème de De Finetti.

– Chapitre VIII: Les lois du zéo ou un pour les suites indépendantes de Borel-Cantelli, Kolmogorov et Hewitt-Savage; le manichéisme des lois de la chance, martingales.

– Chapitre IX: La théorie ergodique et le caractère universel de la convergence des moyennes de suites stationnaires.

– Chapitre X: Les lois du logarithme itéré de Hartman-Wintner et de Strassen.

– Chapitre XI: Autres lois des grands nombres; stabilité des maxima normaux; théorème de Glivenko-Cantelli.

– Chapitre XII: Les marches aléatoires et le problème de la ruine du joueur.

– Chapitre XIII: Comment ne pas trop perdre à la roulette et au jeu.

– Chapitre XIV: La persistance de la chance ou de la malchance.

– Chapitre XV: La loi de l’Arc sinus ou l’injustice fondamentale de la nature.

– Chapitre XVI: La théorie de l’arrêt optimal et la preuve mathématique qu’il vaut mieux s’abstenir de jouer au casino.

Comprendre et utiliser les statistiques dans le sciences de la vie de Bruno Falissard (376 pages)

add

Un livre très très très fortement recommandé aux étudiants en statistique qui ont fini leur Master 2 ou leur licence professionnelle et vont débuter leur stage! Le livre est très littéraire et basé sur les biostatistiques (plusieurs exemples de traitement sur des données épidémiologique). Il est accompagné de nombreux graphes qui permettent de comprendre trivialement le principe de tout ce qui est régression, ACP, clustering, ect. Excellent lien entre la théorie des universités et la pratique du monde professionnel.

Contenu:

– Chapitre I: Introduction.

– Chapitre I – partie 1: Remarques concernant la méthodologie en recherche médicale.

– Chapitre I – partie 2: Définitions.

– Chapitre I – partie 3: Gestion des données.

– Chapitre II: Méthodes univariées.

– Chapitre II – partie 1: Les représentations graphiques.

– Chapitre II – partie 2: L’Estimation.

– Chapitre II – partie 3: Les tests d’hypothèse.

– Chapitre II – partie 4: Les données de survie.

– Chapitre III: Modèles multivariés.

– Chapitre III – partie 1: Régression linéaire et analyse de variance.

– Chapitre III – partie 2: Modèle linéaire généralisé: régressions logistique et de Poisson.

– Chapitre III – partie 3: Modèle de Cox.

– Chapitre III – partie 4: Mesures répétées.

– Chapitre III – partie 5: Modèles structuraux.

– Chapitre III – partie 6: Modèles multivariés: discussion.

– Chapitre IV: Méthodes exploratoires multidimensionnelles.

– Chapitre IV – partie 1: Analyse discriminante.

– Chapitre IV – partie 2: Modèle log-linéaire.

– Chapitre IV – partie 3: Méthodes de classification, analyse en clusters.

– Chapitre IV – partie 4: Méthodes de segmentation, CART.

– Chapitre IV – partie 5: Analyse en composantes principales.

– Chapitre IV – partie 6: Analyse des correspondances.

– Chapitre IV – partie 7: Échelonnement multidimensionnel.

– Chapitre IV – partie 8: Analyse des corrélations canoniques.

– Chapitre IV – partie 9: Analyse factorielle.

Data Mining et statistique décisionnelle de Stéphane Tufféry (706 pages)

add

Le coup de cœur, l’amour littéraire de ma vie! L’Ouvrage de Mr Stéphane Tufféry permet de dresser un excellent bilan de ce qu’il est possible de faire avec R et SAS (et de temps en temps SPSS) en termes d’analyses statistiques et surtout il donne énormément d’informations sur les conditions d’utilisation des différents outils avec certains exemples (notamment un déroulé complet et précieux d’une analyse et de l’optimisation d’un modèle de régression logistique sur la base de données issues du naufrage du « Titanic »). A noter qu’il est essentiellement littéraire et syntaxique, peu de maths.

Contenu:

– Chapitre I: Panorama du Data Mining.

– Chapitre II: Le déroulement d’une étude de Data Mining.

– Chapitre III: L’Exploration et la préparation des données.

– Chapitre IV: L’Utilisation des données commerciales.

– Chapitre V: Les logiciels de statistique et de Data Mining.

– Chapitre VI: Aperçu sur les techniques de Data Mining.

– Chapitre VII: L’Analyse factorielle.

– Chapitre VIII: Les réseaux de neurones.

– Chapitre IX: Les techniques de classification automatique.

– Chapitre X: La recherche d’associations.

– Chapitre XI: Les techniques de classement et de prédiction.

– Chapitre XII: Une application du Data Mining: le scoring.

– Chapitre XIII: Les facteurs de succès d’un projet de Data Mining.

– Chapitre XIV: Le Text Mining.

– Chapitre XV: Le Web Mining.

Les techniques de sondage de Pascal Ardilly (676 pages)

add

Véritable superstar de l’INSEE, le bouquin de Mr Pascal Ardilly s’adresse aussi bien à des matheux, qu’à des statisticiens, qu’à des sociologues, ka dé, ka dé, etc. Il propose synthèses et explications sur les méthodes de tirages d’échantillons sur de grandes bases de données ainsi que l’historique des différentes enquêtes et méthodes associées à l’INSEE. Certes il coûte une certaine somme et le domaine qu’il couvre est très précis, mais à titre culturel il fait clairement son œuvre.

Contenu:

– Chapitre I: Aspects universels, principes de base.

– Chapitre I – partie 1: Généralités.

– Chapitre I – partie 2: Formalisation et vocabulaire de base.

– Chapitre I – partie 3: Loi d’un estimateur et intervalle de confiance.

– Chapitre I – partie 4: Principe des estimateurs « en chaîne ».

– Chapitre I – partie 5: Bases de sondage.

– Chapitre I – partie 6: Différents types d’erreurs rencontrés dans les enquêtes.

– Chapitre II: Présentation des plans de sondages classiques.

– Chapitre II – partie 1: Sondage aléatoire simple.

– Chapitre II – partie 2: Sondage stratifié.

– Chapitre II – partie 3: Sondage à plusieurs degrés.

– Chapitre II – partie 4: Sondage à probabilités inégales.

– Chapitre II – partie 5: Échantillonnage équilibré.

– Chapitre II – partie 6: Sondages empiriques.

– Chapitre II – partie 7: Cas pratique: l’échantillonnage des enquêtes-ménages de l’INSEE.

– Chapitre II – partie 8: Synthèse.

– Chapitre III: Amélioration des estimateurs (redressements, correction de la non-réponse).

– Chapitre III – partie 1: Post-stratification simple.

– Chapitre III – partie 2: Post-stratification sur plusieurs critères.

– Chapitre III – partie 3: Estimateur par le ratio (ou par le quotient).

– Chapitre III – partie 4: Estimateur par la régression.

– Chapitre III – partie 5: Une approche générale du problème: calage généralisé et application « CALMAR ».

– Chapitre III – partie 6: Traitement de la non-réponses.

– Chapitre III – partie 7: Cas pratique:l’enquête biens durables – ameublement.

– Chapitre III – partie 8: Synthèse.

– Chapitre IV: Quelques aspects particuliers des sondages.

– Chapitre IV – partie 1: Estimation sur des domaines.

– Chapitre IV – partie 2: Tirage d’individus dans un ménage.

– Chapitre IV – partie 3: Échantillonnage dans le temps.

– Chapitre IV – partie 4: Introduction à l’approche modèle.

– Chapitre V: Plans de sondage complexes: éléments pour estimer les précision.

– Chapitre V – partie 1: Problèmes posés et généralités sur les types de traitements.

– Chapitre V – partie 2: Deux méthodes générales d’estimation de précision: le bootstrap et le jackknife.

– Chapitre V – partie 3: Une méthode particulière d’estimation de précision: le demi-échantillon.

– Chapitre V – partie 4: Cas d’application 1: mise en œuvre du logiciel Poulpe dans le cadre de l’enquête emploi de l’INSEE.

– Chapitre V – partie 5: Cas d’application 2: méthode de calcul de précision des enquêtes-ménages tirées dans l’échantillon maître 82.

– Chapitre V – partie 6: Cas d’application 3: précision de l’indice trimestriel des loyers.

– Chapitre V – partie 7: Cas d’application 4: précision « anticipée » des enquêtes-ménages tirées dans l’échantillon-maître 90.

Analyse factorielles simples et multiples de Brigitte Escofier et Jérôme Pagés (320 pages)

add

L’ouvrage le plus bourrin que j’ai eu la chance de lire jusqu’à maintenant. ACP, AFC, ACM, AFM et CAH y sont exhaustivement présentées. Cet ouvrage contient la théorie et un déroulé très complet sur l’utilisation de ces méthodes. Véritablement l’ouvrage de référence sur les outils d’analyse exploratoire multivariée, il n’y manque plus qu’un ajout du même acabit dans les futures éditions sur les MDS (Multi-Dimensional Scale) et il sera parfait!

Contenu:

– Chapitre I: Analyse en Composantes Principales.

– Chapitre II: Exemple d’ACP et de CAH.

– Chapitre III: Analyse Factorielle des Correspondances.

– Chapitre IV: Analyse des Correspondances Multiples.

– Chapitre V: Calculs et dualité en Analyse Factorielle.

– Chapitre VI: Exemple de traitement de tableau multiple par ACM et AFC.

– Chapitre VII: L’Analyse Factorielle Multiple à partir de deux applications.

– Chapitre VIII: Aspect théoriques et techniques de l’Analyse Factorielle Multiple.

– Chapitre IX: Méthodologie de l’AFM.

– Chapitre X: Comparaison de tableaux de fréquence binaire.

– Chapitre XI: Interprétation des résultats d’une analyse factorielle.

– Chapitre XII: Fiches techniques.

Probabilité, analyse des données et Statistiques de Gilbert Saporta (622 pages)

add

En tout bien tout honneur, il n’est pas vraiment nécessaire de présenter cet ouvrage puisqu’il s’agit simplement de la bible des statistiques et des probabilités (en omettant volontairement le domaine de la théorie de la mesure car Mr Saporta ne s’y attarde que par séquence dans les 70 premières pages) et permet de conserver des bases précieuses dans ces domaines. A lire et relire en boucle (surtout que l’introduction du bouquin est assez sexy)!

Contenu:

– Chapitre I: Le modèle probabiliste.

– Chapitre II: Variables aléatoires.

– Chapitre III: Couples de variables aléatoires, conditionnement.

– Chapitre IV: Vecteurs aléatoires, formes quadratiques et lois associées.

– Chapitre V: Description unidimensionnelle de données numériques.

– Chapitre VI: Description bidimensionnelle et mesures de liaison entre variables.

– Chapitre VII: L’Analyse en composantes principales.

– Chapitre VIII: L’Analyse canonique et la comparaison de groupes de variables.

– Chapitre IX: L’Analyse des correspondances.

– Chapitre X: L’Analyse des correspondances multiples.

– Chapitre XI: Méthodes de classification.

– Chapitre XII: Distribution des caractéristiques d’un échantillon.

– Chapitre XIII: L’Estimation.

– Chapitre XIV: Les tests statistiques.

– Chapitre XV: Méthodes de Monte-Carlo et de rééchantillonnage (Jack-knife, bootstrap).

– Chapitre XVI: La régression simple.

– Chapitre XVII: La régression multiple et le modèle linéaire général.

– Chapitre XVIII: Analyse discriminante et régression logistique.

– Chapitre XIX: Méthodes algorithmiques, choix de modèles et principes d’apprentissage.

– Chapitre XX: Sondages.

– Chapitre XXI: Plans d’expériences.

The Elements of Statistical Learning de Trevor Hastie, Robert Tibshirani et Jerome Friedman (538 pages)

add

Tout en anglais, je précise… si le bouquin de Maître Saporta est la bible française alors celui-ci en est probablement sa continuité en anglais! L’ouvrage se concentre sur les différents outils d’analyse supervisé et non supervisé. Il est bien illustré avec ses graphes en couleur et le niveau d’anglais requis pour le lire est assez intermédiaire. Après nous enfonçons des portes ouvertes, il suffit de voir les trois auteurs-stars de cet ouvrage pour comprendre à quel point il s’agit d’un bouquin référence qui doit figurer sur toutes les étagères du simple au parfait statisticien.

Contenu:

– Chapitre I: Introduction.

– Chapitre II: Overview of Supervised Learning.

– Chapitre III: Linear Methods for Regression.

– Chapitre IV: Linear Methods for Classfication.

– Chapitre V: Basis Expansions and Regularization.

– Chapitre VI: Kernel Methods.

– Chapitre VII: Model Assessment and Selection.

– Chapitre VIII: Model Inference and Averaging.

– Chapitre IX: Additive Models, Trees and Related Methods.

– Chapitre X: Boosting and Additive Trees.

– Chapitre XI: Neural Networks.

– Chapitre XII: Support Vector Machines and Flexible Discriminants.

– Chapitre XIII: Prototype Methods and Nearest-Neighbors.

– Chapitre XIV: Unsupervised Learning.

The top ten algorithms in Data Mining de Xindong Wu et Viping Kumar (220 pages)

add

Ce livre met en évidence dix algorithmes de type probabiliste ou appartenant à la branche Data Mining au travers d’une présentation de leur fonctionnement. Chaque algorithme y est donc précisément présenté d’un point de vue théorique avec exemples, exercices et références associés. Une véritable mine d’or pour les curieux surtout que parmi les dix, certains sont assez inattendus, peu répandus dans la littérature et couvrant notamment des domaines d’applications assez rares. Par contre, le niveau d’anglais requis est un peu plus coriace.

Contenu:

– Chapitre I: C4.5.

– Chapitre II: K-means.

– Chapitre III: SVM: Support Vector Machines.

– Chapitre IV: Apriori.

– Chapitre V: EM.

– Chapitre VI: PageRank.

– Chapitre VII: AdaBoost.

– Chapitre VIII: kNN: k-Nearest Neighboos.

– Chapitre IX: Naïves Bayes.

– Chapitre X: CART: Classification and Regression Trees.

Processus stochastiques et applications de Nicolas Bouleau (284 pages)

add

Un ouvrage purement théorique qui balaie de manière assez complète tout ce qui touche aux processus stochastiques. Ici vous serez bombardé de théorème, définitions et propriétés, vous permettant ainsi d’avoir une référence solide et en faisant un livre principalement orienté pour les étudiants et les développeurs de nouvelles méthodologies.

Contenu:

– Chapitre I: Généralités sur les processus.

– Chapitre II: Chaîne de Markov.

– Chapitre III: Processus de sauts markoviens et processus ponctuels.

– Chapitre IV: Processus à accroissements indépendants. Mouvements brownien. Processus de Lévy.

– Chapitre V: Processus du second ordre, filtrage et prédiction.

– Chapitre VI: Introduction au calcul d’Ito.

– Chapitre VII: Équations différentielles stochastiques.

– Chapitre VIII: Processus de Markov et diffusions.

Séries chronologiques de Jean-Jacques Droesbeke, Bernard Fichet, Philippe Tassi (300 pages)

add

Un ouvrage dont la force est la faiblesse et sa quasi-exhaustivité. En effet, il fournit tous les théorèmes, définitions et propriétés associés aux modèles ARMA, ARIMA et leur extension mais parfois ne va pas assez loin sur certaines méthodes d’estimations, ce qui peut en laisser certains sur leur faim. Ceci étant dit, il n’en demeure pas moins un livre sur lequel se baser pour bien étudier les séries chronologiques, notamment avec une introduction sur leur naissance bien agréable et quelques exemples pratiques permettant de s’y retrouver dans les différentes phases d’analyse.

Contenu:

– Chapitre I: La place des séries chronologiques en statistique.

– Chapitre II: Généralités sur les processus du second ordre.

– Chapitre III: Processus univarié AR, MA, ARMA.

– Chapitre IV: Estimation des paramètres de modèles ARMA.

– Chapitre V: Identification et vérification.

– Chapitre VI: Processus multidimensionnels.

– Chapitre VII: Modèles non stationnaires, séries univariées et multivariées.

– Chapitre VIII: Quatre cas pratiques.

Contributions to probability and statistics de Ingram Olkin, Wassily Hoeffding, Sudhish G. Ghurye, William G. Madow et Henry B. Mann (517 pages)

add

Ce livre est un recueil de publications célèbres. Plusieurs d’entre elles sont régulièrement citées en référence ou bibliographie, ce qui en fait un ouvrage assez important à avoir. Cependant, il est devenu rare sur le marché.

Contenu:

– Chapitre I: Harold Hotelling.

– Chapitre II: Harold Hotelling – A leader in Mathematical Statistics.

– Chapitre III: The Teaching of Statistics.

– Chapitre IV: Bibliography of Harold Hotelling.

– Chapitre V: Some Remarks on the Design and Analysis of Factorial Experiments.

– Chapitre VI: A Limitation of Optimum Property of the Sequential Probability.

– Chapitre VII: Decision Theroy and the Choice of a Level of Significance for the t-Test.

– Chapitre VIII: Simultaneous Comparison fo the Optimum and Sign Tests of a Normal Mean.

– Chapitre IX: Some Stochastic Models in Ecology and Epidemiology.

– Chapitre X: Random Orderings and Stochastic Theories of Responses.

– Chapitre XI: On a Method of Constructing Steiner’s Triple Systems.

– Chapitre XII: A Representation of Hotelling’s T ^2 and Anderson’s Classification Statistic W in Terms of Simple Statistics.

– Chapitre XIII: Euler Squares.

– Chapitre XIV: A Compromise Between Biais and Variance in the Use of Nonrepresentative Samples.

– Chapitre XV: Construction of Fractional Factorial Designs of the Mixed second and third Series.

– Chapitre XVI: Application of Boudary Theory to Sums of Independent Random Variables.

– Chapitre XVII: Some k-Sample Rank_order Tests.

– Chapitre XVIII: Characterization of Some Location and Scale Parameter Families of Distributions.

– Chapitre XIX: Generalization of Some Results for Inversion of Partitioned Matrices.

– Chapitre XX: Selecting a Subset Containing the Best of Several Binomial Populations.

– Chapitre XXI: Consistency of Maximum Likelihood Estimation of Discrete Distributions.

– Chapitre XXII: An Upper Bound for the Variance of Kendall’s « Tau » and of Related Statistics.

– Chapitre XXIII: On the Amount of Information Contained in a \sigma-Field.

– Chapitre XXIV: The Evergreen Correlation Coefficient.

– Chapitre XXV: Robust Tests for Equality of Variances.

– Chapitre XXVI: Intrablock and Interblock Estimates.

– Chapitre XXVII: A Bivariate Chebyshev Inequality for Symmetric Convex Polygons.

– Chapitre XXVIII: Notes on the Numerical Convergence of Iterative Processes.

– Chapitre XXIX: Prediction in Future Samples.

– Chapitre XXX: Ranking in Triple Comparisons.

– Chapitre XXXI: A Statistical Screening Problem.

– Chapitre XXXII: On the Power of Some Rank-order Two-sample Tests.

– Chapitre XXXIII: Some Non-parametric Analogs of « Normal » ANOVA, MANOVA, and of Studies in « Normal » Association.

– Chapitre XXXIV: Relations Between Certain Incomplete Block Designs.

– Chapitre XXXV: Infinitesimal Renewal Processes.

– Chapitre XXXVI: Classification Procedures Bases on Dichotomous Response Vectors.

– Chapitre XXXVII: Multiple Regression.

– Chapitre XXXVIII: An Optimum Replicated Two-sample Test Using Ranks.

– Chapitre XXXIX: A survey of Sampling from Contamined Distributions.

– Chapitre XXXX: Multidimensional Statistical Scatter.

– Chapitre XXXXI: Convergence of the Empiric Distribution Function on Half-spaces.

– Chapitre XXXXII: Analysis of Two-factor Classifications With Respect to Life Tests.

SAS l’essentiel d’Olivier Decourt (264 pages)

add

L’Ouvrage de base du codage sous SAS pour les francophones et écrit par Olivier Decourt, un grand monsieur toujours disponible pour répondre aux questions des rookies se baladant sur le net via le forum developpez.net. Le livre parcours les principales fonctionnalités de SAS et présente également une présentation très intéressante de la manière dont marche l’architecture. Il est plus orienté pour les débutants mais même une programmeur développé pourra y trouver quelques informations pour compléter ses connaissances sur SAS.

Contenu:

– Chapitre I: Environnement.

– Chapitre II: Données: stockages et organisations.

– Chapitre III: Programmes SAS: contenu et logique.

– Chapitre IV: Traitements utilitaires.

– Chapitre V: Requêtes et extractions.

– Chapitre VI: Création de variables.

– Chapitre VII: SQL: une autre manière de créer des requêtes.

– Chapitre VIII: Fusions et tables.

– Chapitre IX: Import de fichiers externes.

– Chapitre X: Exports.

– Chapitre XI: Statistiques et graphiques.

– Chapitre XII: Langage macro et macro-variables.

– Chapitre XIII: Macro-programmes.

Reporting avec SAS d’Olivier Decourt (214 pages)

add

Une sorte de suite à l’autre ouvrage d’Olivier Decourt: « SAS l’essentiel », et axée, cette fois-ci, sur tout ce qui est templating et reporting. Excellemment précieux pour ceux qui travaillent sous SAS et qui font énormément d’automatisation d’analyses statistique.

Contenu:

– Chapitre I: ODS: organiser et diffuser des sorties.

– Chapitre II: La personnalisation avancée des sorties.

– Chapitre III: Les listes, les tableaux, les rapports.

– Chapitre IV: Les graphiques.

– Chapitre V: La gestion des mises en forme.

– Chapitre VI: La gestion a posteriori des sorties.

– Chapitre VII: La mise en œuvre dans l’architecture SAS BI.

– Chapitre VIII: Les grandes avancées disponibles dans SAS 9.2.

The R Book de Michael J. Crawley (1 051 pages)

add

Le mastodonte de la programmation sous R. Tout le b.a.-ba concentré dans un seul livre ainsi que tout ce qui touche à la programmation avancée et de fonctions. Le tout enrobé de syntaxes précieuses pour la sortie de résultats statistiques. Fréquemment accompagné d’exemples, l’introduction va même jusqu’à une présentation synthétique de l’ouvrage pour que les débutants et les habitués du langage R puissent focaliser sur tel ou tel partie du livre. Tout en anglais, il faut le préciser, il reste très accessible même pour ceux n’étant pas à l’aise avec cette langue.

Contenu:

– Chapitre I: Getting Started.

– Chapitre II: Essentials of the R language.

– Chapitre III: Data Input.

– Chapitre IV: Dataframes.

– Chapitre V: Graphics.

– Chapitre VI: Tables.

– Chapitre VII: Mathematics.

– Chapitre VIII: Classical Tests.

– Chapitre IX: Statistical Modelling.

– Chapitre X: Regression.

– Chapitre XI: Analysis of Variance.

– Chapitre XII: Analysis of Covariance.

– Chapitre XIII: Generalized Linear Models.

– Chapitre XIV: Count Data.

– Chapitre XV: Count Data in Tables.

– Chapitre XVI: Proportions Data.

– Chapitre XVII: Binary Response Variables.

– Chapitre XVIII: Generalized Additive Models.

– Chapitre XIX: Mixed-Effects Models.

– Chapitre XX: Non-Linear Regression.

– Chapitre XXI: Meta-Analysis.

– Chapitre XXII: Bayesian Statistics.

– Chapitre XXIII: Tree Models.

– Chapitre XXIV: Time Series Analysis.

– Chapitre XXV: Multivariate Statistics.

– Chapitre XXVI: Spatial Statistics.

– Chapitre XXVII: Survival Analysis.

– Chapitre XXVIII: Simulation Models.

– Chapitre XXIX: Changing the Look of Graphics.

♦ Méthodes et modèles en statistique non paramétrique – exposé fondamental de Philippe Capéraà et Bernard Van Custem (359 pages)

add

L’Ouvrage de référence de la statistique non paramétrique. Difficile de vouloir faire l’anticonformiste en critiquant un livre autant cité dans de multiples articles. Le livre offre un tour d’horizon assez complet sur la théorie qui se cache derrière les tests différentiels non paramétriques accompagné de la présentation d’un grand nombre de ces tests. Le tout étant enrobé d’une écriture simple et d’un style particulièrement agréable avec énormément d’informations très précieuses pour la compréhension. A conseiller fortement.

Contenu:

– Chapitre I: Introduction.

– Chapitre II: Statistiques d’ordre.

– Chapitre III: Exemples d’utilisation des statistiques d’ordre.

– Chapitre IV: Problèmes à deux échantillons.

– Chapitre V: Problèmes à un échantillon.

– Chapitre VI: Comparaison de k traitements.

– Chapitre VII: Tests d’indépendance. Mesures d’association.

– Chapitre VIII: Tests d’adéquation.

♦ Analyse statistique des données de survie de Catherine Hill, Catherine Com-Nougué, Andrew Karmar, Thierry Moreau, John O’Quigley, Rachid Senoussi et Claude Chastang (190 pages)

add.png

Un autre livre célèbre présenté sur ce site. Il s’agit d’un classique de l’analyse de survie qui couvre l’intégralité des outils utiles et nécessaires pour l’exploitation des données de survie. Le livre contient également en annexe des informations précieuses sur l’estimation par maximum de vraisemblance et sur l’usage des tests de rang de Wilcoxon et de Savage. Fortement recommandé pour ceux qui veulent une excellente référence sur le sujet.

Contenu:

– Chapitre 1: Définitions des fonctions de survie

– Chapitre 2: Échantillon tiré d’une seule population

– Chapitre 3: Comparaison e la survie de deux ou plusieurs groupes – approche non-paramétrique

– Chapitre 4: Modèles de survie paramétriques

– Chapitre 5: Modèle de Cox – Approche semi-paramétrique

– Chapitre 6: Nombre de sujets nécessaire

– Chapitre 7: Adéquation des modèles de survies

– Chapitre 8: Les modèles de survie en recherche clinique

\bullet Les pages webs à visiter absolument

– Les présentations .ppt en ligne de Mr Stéphane Tufféry: http://blogperso.univ-rennes1.fr/stephane.tuffery/public/

– Les cours en ligne de Mr Ricco Rakotomolala: http://eric.univ-lyon2.fr/~ricco/cours/

– La chaîne youtube de Mr Bruno Falissard: https://www.youtube.com/user/brunofalissardconf

– Les fiches en ligne de Mr Jean-Yves Baudot: http://www.jybaudot.fr/a_general/indexstats.html

– Les articles en ligne de Mme Véronique Bourcier: https://thesasreference.wordpress.com/

\bullet Les forums pratiques et chaudement recommandés

– Forum spécialisé dans tout ce qui relève de la pratique de l’analyse de données: http://statistiques.forumpro.fr/

– Forum pour toutes les questions touchant aux mathématiques d’un point de vue théorique: http://www.les-mathematiques.net/phorum/

– Forum à consulter lorsque vous êtes perdus avec les syntaxes de vos propres programmes: http://www.developpez.com/

– Forum spécialisé dans tout qui touche de prés ou de loin à R: http://forums.cirad.fr/logiciel-R/

\bullet Les sites web des copains, car eux aussi font des trucs vraiment très sympas!

– La chaîne youtube de ce bon Niaboc: https://www.youtube.com/channel/UCWty1tzwZW_ZNSp5GVGteaA/videos

– Le site web de superA.D.: https://superstatisticienne.fr/r-sur-le-web-le-package-shiny/

Publicités

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion /  Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s