QnGene : FORMAT GÉNÉTIQUE POUR HPC
Projet d'extension du format Adam pour y inclure le génotypage, les données cliniques et effectuer des analyses génétiques pour la médecine personnalisée, à grande échelle, à l'aide d'apprentissage machine.
Nous avons conçu et développé un prototype de logiciel de visualisation génétique nommé GenomeViewer. Pour ce faire, nous avons analysé le processus et les logiciels utilisés pour effectuer des requêtes génétiques au laboratoire du Dr Pavel Hamet. La cible de la version .4 du prototype vise à facilement comparer les données d'un patient avec les données de 1000genome publiquement disponibles. À sa version finale, GenomeViewer permettra aux chercheurs en cancérologie de visualiser complètement et rapidement les mutations somatiques et les comparer à plusieurs BD publiques. Beatriz a produit un premier prototype jetable, la v.1 nommée GOAT, qui a fait objet de plusieurs étapes de réingénierie par la suite. La deuxième version du prototype par Cédric, ensuite la v.3 par Victor afin d'établir une architecture logicielle interne maintenable (voir publication de GOAT). Ce prototype a été renommé GenomeViewer et la cible fonctionnelle a été ajustée vers la visualisation de mutations somatiques. l'amélioration du prototype a été effectuée par une équipe d'étudiants de projet de fin d'études afin de remplacer la présentation graphique limitée par l'utilisation de la technologie de Bokeh Server par AmCharts et remplacer la technologie actuelle de BD SQL par du NoSQL-Spark afin d'augmenter significativement la vitesse d'exécution des requêtes. La plus récente version du prototype, la v.4, ici, comporte seulement les données des 1000 génomes, est s'exécute maintenant sur une grappe AWS. Elle permet le chargement de fichiers .vcf. La performance d'exécution du chargement des données est passée d'une durée de 6 heures à une durée de 30 minutes. De plus les requêtes intéractives au back-end sont passées de 3 minutes à 5 secondes grâce à l'utilisation du format Adam de Berkeley sur AWS-EMR. Consultez son mémoire de maîtrise ici.
ÉQUIPE D'ÉTUDIANTS Beatriz Kanzki, Max St-Onge, Raphaël Papillon, David Guay, Émile Filteau-Tessier, Cédric Urvoy, Victor Dupuy. TECHNOLOGIES Smacss, Sass, React (Facebook), Reflux, React-JSX, Griddle, Django, MySql, Python, Biopython, AmCharts, Numpy, Pandas, Blaze, Flask, Matplotlib, Adam, AWS - EMR (Spark)
ÉQUIPE D'ÉTUDIANTS M.Y.Tariq, U.Ghomsi, N.Brousseau, R.Chebli, G.Gbelai, D. Boukadi, A. Elmoul TECHNOLOGIES .Net 4, IIS7, Sql Server 2008 R2, SQL, MDX, XML, SSIS, SSAS, SSRS
ÉQUIPE D'ÉTUDIANTS D. Lauzon, C. Vallières, P. Herrera, A.Boussif, A.Zakharov, D.Olano, M-A Tardif, P-E Viau, M.Ouellet, P-A St-Jean TECHNOLOGIES Logiciels libres seulement: HighCharts, WebSockets, Socket.io, Node.js, VirtualBox, Ubuntu