Les logiciels, packages et fonctions ...

Package ANSI C++

MixNet

Le modèle Mixnet est un modèle de mélange pour graphes aléatoires (orientés ou non). Il vise à détecter des groupes de sommets ayant des profils de connexion similaires. L'estimation des paramètres est effectuée selon une méthode variationnelle qui permet de maximiser la vraisemblance approchée des données.


Mixnet is C++ package based on a probabilistic model for heterogeneous random graphs. This model is based on the hypothesis that real networks are made of classes of vertices which show specific connectivity patterns. Mixnet compute variationnal estimates of the parameters and a statistical criterion, ICL to select the number of classes.

La page du logiciel : http://stat.genopole.cnrs.fr/logiciels/mixnet

Références :
Daudin, J.-J., Picard, F., Robin, S., Mixture model for random graphs, Statistics and Computing, 2008.
Picard, F., Miele, V., Daudin,J-J., Cottret,L., Robin, S., Deciphering the connectivity structure of biological networks using MixNet, BMC Bioinformatics , Suppl 6, S17,2009, http://www.biomedcentral.com/1471-2105/10/S6/S17

wmixnet

Le Stochastic Block Model avec covariables est une extention du Stochastic Block Model qui a déjà fait l'objet d'une implémentation (MixNet, cf section précedente).

Ce modèle vise à estimer l'effet des covariables et à regrouper les sommets ayant des profils de connexion similaires conditionnellement aux covariables.

L'estimation est effectuée au moyen d'un EM variationel afin de maximiser une approximation de la vraissemblence des données. Le choix du nombre de groupe est effectuée avec le critère ICL.

Cette implémentation est effectuée en C++, liée avec des bibliothèques de calcul matriciel, et parralellisée.

Télechargement et procédure d'installation


The Stochastic Block Model with covariates is a extention of the Stochastic Block Model which is already implemented (MixNet, see below).

The aim of this model is to estimate the covariate effects, and grop vertices which have same connectivity profile conditionnaly to covariates.

The estimation is done by a variationnal EM to maximize a approximation of liklelihood, and the number of groups is choosen by the ICL criterion.

This program is written in C++, linked with algebra libraries, and parralellized.

Download and installation procedure

SelvarClust

SelvarClust is a software implemented in C++ with object-oriented programming. It is devoted to the variable selection in model-based clustering. It is a greedy algorithm associated to the SR modeling proposed by Maugis et al. (2009) in Biometrics. This software allows us to study data where individuals are described by quantitative block variables. It returns a data clustering and the selected model, composed of the number of clusters, the mixture form and the variable partition.

SelvarClustMV is a software implemented in C++ with object-oriented programming. It is an extension of SelvarClust, it is devoted to the variable selection in model-based clustering allowing for missing value (Maugis-Rabusseau et al. (2012) in Journal de la SfdS. Currently, this software is proposed for Gaussian mixtures whose variance matrices are assumed to be identical and free (m=[pkLC]).

SelvarClustIndep is a software implemented in C++ with object-oriented programming. It is devoted to the variable selection in model-based clustering. It is a greedy algorithm associated to the SRUW modeling proposed by Maugis et al. (2009) in CSDA. The SRUW modeling takes into account three possible roles for each variable: relevant, redundant and independent. This software allows to study datasets where observations are described by quantitative variables. It returns a data clustering and the selected model composed of the number of clusters, the mixture form, the variance matrix form for the linear regression and the independent Gaussian density, and the variable partition.

Package R

Le package anapuce est disponible sur CRAN : http://cran.r-project.org

varmixt0.2-4

Le package varmixt était un package définissant un modèle de mélange sur les variances dans le cadre de la recherche de gènes différentiellement exprimés entre deux conditions. Il n'est plus maintenu. La méthode est implémentée dans le package anapuce (fonction est.varmixt) et les fonctions DiffAnalysis.unpaired et DiffAnalysis permettent d'effectuer une analyse différentielle entre deux conditions en utilisant varmixt.

Référence :
Delmar P, Robin S, Daudin J.J (2005), VarMixt: efficient variance modelling for the differential analysis of replicated gene expression data, Bioinformatics 2005 Feb 15;21(4):502-8.
doi:10.1093/bioinformatics/bti023


anapuce2.2

anapuce2.2 est un package rassemblant des outils pour l’analyse de microarrays. Il permet :

  • d’effectuer la normalisation de puces deux couleurs : normalisation globale par une loess + soustraction de la médiane par bloc
  • d’effectuer l’analyse différentielle : variance spécifique / variance homogène / une variance par groupe de gènes (méthode varmixt proposée par P. Delmar) + prise en compte de la multiplicité des tests via l’utilisation de la fonction p.adjust.
  • de calculer un FDR local à partir de pvalues brutes. Le FDR local associé à chaque gène mesure la probabilité que ce gène soit un faux positif.
  • de calculer le Label Bias Index. Cet index constitue une mesure globale du biais de marquage spécifique au gène. Un minimum de deux lames jaunes est nécessaire.

Références :
Aubert J, Bar-Hen A, Daudin J.J, Robin S
(2004), Determination of the differentially expressed genes in microarrays experiments using local FDR, BMC Bioinformatics 2004, 5:125.
doi:10.1186/1471-2105-5-125
Martin-Magniette M.L, Aubert J, Cabannes E, Daudin J.J (2005), Evaluation of the gene-specific dye bias in cDNA microarray experiments, Bioinformatics, 21(9), 1995-2000.
doi:10.1093/bioinformatics/bti302

anapuce dispose d'une page Wiki.
La version 2.2 a été compilée avec la version 2.11.1 de R [MAJ 17/08/10]
Guide d'utilisateur d'anapuce 2.1
Ce qui change dans la nouvelle version d'anapuce 2.2


MixThres

MixThres est un package permettant la définition d’un seuil d’hybridation à partir de modèles de mélange sur la distribution d’un signal :
.zip .tar.gz

Référence :
Picard F, Martin-Magniette M.L, Gagnot S, Brunaud V, Aubert J, Gendrel V, Robin S, Caboche M, Lecharny A, Colot V (oct 2008), MixThres: mixture models to define a hybridization threshold in DNA microarray experiments
preprint.


MultiChIPmixHMM

Le package MultiChIPmixHMM est un package R disponible sur http://cran.r-project.org/web/packages/MultiChIPmixHMM/index.html. C'est un modèle de mélange de deux régressions linéaires permettant d'analyser simultanément plusieurs réplicats biologiques de données de ChIP-chip. Quand les données sont produites avec des puces tiling array, la dépendance spatiale entre les sondes peut-être pris en compte grâce à une modélisation de la variable latente par une chaîne de Markov d'ordre 1.

Référence :
Martin-Magniette ML, Mary-Huard T, Berard C, Robin S (2008), ChIPmix: Mixture model of regressions for two-color ChIP-chip analysis, Bioinformatics, 24(16):i181-i186
doi:10.1093/bioinformatics/btn280


TAHMMAnnot

TAHMMAnnot_1.0.tar.gz Bidimensionnal Gaussian mixture model, HMM and Annotation for ChIP-chip IP/IP and Transcriptome data analysis.

Référence :
Bérard C, Martin-Magniette ML, Brunaud V, Aubourg S, Robin S (2011), Unsupervised Classification for Tiling Arrays: ChIP-chip and Transcriptome,Statistical Applications in Genetics and Molecular Biology, Vol. 10: Iss. 1, Article 50
http://www.bepress.com/sagmb/vol10/iss1/art50


HMMmix

HMMmix_0.1.tar.gz The HMMmixture package allows one to reduce a K-states HMM to a D-states HMM, with D < K.


VBMA4hmm

VBMA4hmm_0.1.tar.gz Variational Bayes Model Averaging for hidden markov models.
http://cran.r-project.org/src/contrib/VBMA4hmm_0.1.tar.gz


CGHseg

cshseg, cghseg_0.0.1.tar.gz Segmentation methods for array CGH analysis

Référence :
Picard F, Lebarbier E, Hoebeke M, Rigaill G, Thiam B, Robin S (2011) Joint segmentation calling and normalization of multiple CGH profiles, Biostatistics, vol. 12 pp.413-428


dbmss

http://cran.r-project.org/web/packages/dbmss/ Tools to characterize point patterns

Référence : Marcon E, Traissac S, Puech F, Lang G (2013) Tools to Characterize Point Patterns: dbmss for R, Journal of Statistical Software, submitted


EBS

EBS is a package for the exact Bayesian segmentation of profiles

Références :
Rigaill G, Lebarbier E, Robin S (2012) Exact posterior distributions and model selection criteria for multiple change-point detection problems, Statistics and Computing, 22:917–929
Cleynen A, Robin S (2013) Comparing change-point locations of independent profiles, Computational Statistics & Data Analysis, submitted


Segmentor3IsBack

Segmentor3IsBack is a package for the exact and fast segmentation of large profiles

Référence :
Cleynen A, Koskas M, Lebarbier E, Rigaill G, Robin S (2013) Segmentor3IsBack: an R package for the fast and exact segmentation of Seq-data, Algorithm for Molecular Biology, submitted


Programmes Matlab

Modèle C-Mixnet et ses applications

  • Package MATLAB [.zip] NECESSITE la ToolBox Optimisation
  • La présentation [.pdf]
  • Le rapport de stage [.pdf] d'Emeric Thibaud (juin 2009) encadré par Jean-Jacques Daudin.

Référence :
Daudin, J.-J., Pierre, L., Vacher, C., Model for Heterogeneous Random Networks Using Continuous Latent Variables and an Application to a Tree-Fungus Network, Biometrics 66,1043-1051, December 2010.


Segmentation

Les programmes de Franck : CGH_segmentation[MAJ 08/09/05]

Référence : Picard F, Robin S, Lavielle M, Vaisse C, Daudin J.J (2005), A Statistical approach for array CGH data analysis, BMC Bioinformatics 2005, 6:27. doi:10.1186/1471-2105-6-27

 
/var/www/html/agroparistech/mmip/maths/essaimia/data/pages/productions/logiciels.txt · Dernière modification: 2014/01/07 15:38 par gabriel
 
LogoAgroParisTech INRA Driven by DokuWiki