Ingénieur – Machine Learning
Eric Blaudez Courriel : eric.blaudez@gmail.com
Nationalité : Française
Mots clés : fouille de données, traitement de la parole, apprentissage automatique
Site web : eblaudez.pro
39 ans / 13 années d’expérience
| Ingénieur – Machine Learning
|
Spécialisé dans la fouille de données, le traitement automatique de la parole et l'apprentissage automatique, mon expérience a été forgée par la parallélisation de flux audio après segmentation intelligente (réseau de neurones, extraction d'information psycho-acoustiques) pour des systèmes de traitement automatique de la parole à l'époque où les temps de traitement étaient de 30 fois le temps réel (Keovoice), le développement de systèmes de classifications (SVM, SVD/LDA-EM, ...) dans des espaces de grandes dimensions (Sinequa), le développement de systèmes d'indexation et de classification de documents audio (Vecsys) ou encore par l'étude de modèles statistiques complexes que sont les modèles non linéaire de population à effets mixtes (INRIA/Lixoft).
FORMATION
| 2002 - 2003
| DEA en informatique à l'université de Marseille (LUMINY) – 13
| 2001 - 2002
| Maîtrise en Génie Mathématiques et Informatique à l'IUP d'Avignon – 84
| 2000 - 2001
| Licence en Génie Mathématiques et Informatique à l'IUP d'Avignon – 84
| 1999 - 2000
| DEUG en Génie Mathématiques et Informatique à l'IUP d'Avignon – 84
| 1996 - 1999
| DEUG en Mathématiques et Informatique Appliqué aux Sciences à Metz – 57
| 1995 - 1996
| Baccalauréat S au Lycée de Jarny – 54
| LANGUE
| Anglais : anglais scolaire (lu, écrit, parlé)
| COMPÉTENCES EN INFORMATIQUE
| Programmation
| C/C++
C#
Assembleur
Pascal
Basic
| Scheme
PHP
Matlab
JAVA/J2EE
JSP
Python
| Javascript, AJAX
HMTL,CSS
LEX / YACC
PERL
Script shell
|
| Outils de développement
| gcc/g++
automake/autoconf
cmake
mono
| Kdevelop, Anjuta
Microsoft Visual C++
Borland C++
Eclipse
| as / tasm
Flex 2.0
Netbeans
QtCreator
|
| Réseaux
(TCP / IP)
| Déploiement de serveurs APACHE, FTP, SAMBA, DNS, DHCP, LDAP, CVS, subversion, SSH, glassfish, tomcat, vpn (openvpn)
| Modélisation
| UML : Rational Rose, Umbrello, Visual Paradigm
Design Patterns
| Architecture Distribuée
| CORBA (Common Object Request Broker Architecture)
JAVA RMI (Remote Method Invocation)
OpenMPI
Spark (pyspark)
| SGBD
| MySQL, Postgres, Oracle, Informix 1.0, MSSQL
| Systèmes
| Linux, Mac OS X, Microsoft Windows
| Bureautique
| Suite Microsoft Office, OpenOffice, LaTex
| COMPÉTENCES EN APPRENTISSAGE AUTOMATIQUE
| Classification
| KMeans & variantes
Affinity propagation
Mean shift
Agglomerative clustering
DBSCAN
Gaussian Mixture
SVM
| Arbres de decisions
Bayesien naïf
AdaBoost
Random Forests
XGBoost
Réseaux de neurones
|
| Régression
| Méthodes de régularisation (Lasso, Tikhonov, ElasticNet)
Moindres carrés
Arbres de régressions
SVM
SAEM
|
EXPÉRIENCE PROFESSIONNELLE
| depuis sept. 2011
| Ingénieur pour la société Lixoft (spin-off de l’INRIA)
développement d’un langage de description de projet pour l’étude statistique de population adapté à la pharmacologie
développement d’outil d’exploration de modèles structurels avec intégration de mesures statistiques pour la visualisation des réponses d’un modèle
développement de libraries de calculs distribués adaptées au problème d’algorithmes statistiques (MCMC, SAEM)
développement d’outils de simulations hiérarchiques
mise en place d’outil de packaging et de déploiement du logiciel Monolix
développement d’outils de calculs parallèle
développement de web services
développement d’interfaces utilisateurs (avec Qt)
développement d’un logiciel de test multiplateformes
gestion des outils de développement et de communication (mailing, gestion de licences, gestion de projets, gestion de version de codes)
développement d’interfaces web (site web de Lixoft, plateforme de téléchargement)
: Projet Européen DDMore
Enseignement : cours de Java avancé à l’IUT Paris Sud
| fév. 2010 – sept. 2011
| Ingénieur pour la société INRIA: travaux d’intégration autour du logiciel monolix
mise en place de nouveaux formats d’entrés
mise en place d’une architecture de tests
mise en place et développement d’outils de packaging
aide à la formalisation des algorithmes utilisés dans monolix (SAEM, MCMC, Fisher)
environnement fonctionnel : outils de statistiques pour la pharmacologie
environnement technique :
méthodologie : UML/Design Pattern (Visual Paradigm)
langage : C/C++, JAVA, matlab, perl, shell scripts,
bibliothèques : POCO, boost spirit, IzPack
environnement de développement :
g++/cmake,
visual studio (express)
tests unitaires/profilage : cppunit, valgrind, ctest, cdash
| sept. 2007-fév. 2010
| Ingénieur pour la société Vecsys :
conception d'un système d'indexation multimédia
transcription et indexation de données audiovisuelles et conversationnelles
extraction de thèmes, de concepts, d'entités nommées
environnement fonctionnel : recherche d’information multimédia
environnement technique :
méthodologie : UML/Design Pattern (Umbrello)
langage : C/C++, WebService JAVA/SOAP, WebService RESTFUL, XMLRPC, C#, perl, javascript
bibliothèques : POCO, CLucene, Sphinx III
environnement de développement :
g++/automake/autoconf, netbeans, glassfish
tests unitaires/profilage : cppunit, valgrind
algorithmes d’extraction d’information : extraction de thèmes et de concepts utilisant une méthode statistique non supervisé (Latent Dirichlet Allocation), extraction d’entités nommées utilisant les Champ Conditionnels Aléatoire
développement d'outils de Speech Analytics
extraction d'indices psycho-acoustiques (fréquence fondamentale, énergie, ...)
extraction d'indices psycholinguistiques (vitesse d'élocution, ...)
environnement fonctionnel : Speech Analytics, Analyse Marketing
environnement technique : C/C++, perl, shell scripts
environnement de développement :
g++/automake/autoconf
tests unitaires/profilage : cppunit, valgrind
algorithmes d’analyse du signal : MFCC, F0/AMDF, énergie RMS
conception d'un portail de démonstration
interface web de recherche de données multimédia
outils de visualisation et d'écoute de transcriptions
sous-titrage de journaux télévisuels
environnement fonctionnel : démonstration des technologies de reconnaissance automatique de la parole
environnement technique : Zend Framework (PHP), JQuery (javascript/Ajax), Flex
design d'une architecture distribuée pour le traitement massif de flux audio
définition des cas d’utilisations
description de l’architecture matérielle (Cluster HP Haute disponibilité)
description de l’architecture logicielle (Distribution des calculs avec PBS Pro)
gestion de projet de recherche Européen
EASY Interaction (projet ITEA2): développement d'interfaces vocales dans le secteur de la sécurité civile pour l'aide à la création de rapport et pour la géo localisation
Vital (projet FP6): développement d'interface vocale pour l'aide à la navigation dans un index
QUAERO: transcription automatique de données audiovisuelles et interface vocale
| fév. 2004 - fév. 2007
| Ingénieur de recherche au sein de Sinequa Labs, département R&D de Sinequa:
développements autour du système d’indexation/recherche de Sinequa
analyse des requêtes multilingues
démonstrateurs de la technologie Intuition
serveur d’extraction d’entités nommées
convertisseur de document Microsoft Office
environnement fonctionnel : recherche d’information environnement de développement :
Microsoft Visual c++ 6.0, gcc, g++
tests unitaires/profilage : cppunit, bound checker
environnement technique : C/C++, Java, Perl, PHP, JSP, MySQL, MSSQL
conception de méthodes permettant la combinaison de différentes sources de données (statistiques et à base de règles) pour l'analyse de documents (étiquetage, classification, segmentation, ...)
environnement technique : C/C++, Java, Perl, shell scripts méthodologie : UML (Umbrello) algorithmes: Expectation-Maximisation, Champs Aléatoires de Markov, Champs Conditionnels Aléatoires, Modèles de Markov Cachés, SVM (Machines à Vecteur Support), réseaux de croyances, réseaux de neurones, arbres de classification (CART), méthodes de recuits simulés
gestion de projet de recherche Technolangue : OuRAL
Développement d’une « boîte à outils » pour l’analyse linguistique et sémantique Enseignement :
initiation au système UNIX et aux langages structurés pour des élèves de 3ème cycle au Laboratoire de Linguistique et d'Informatique (LLI) – Paris-XIII
cours de théorie des graphes dispensés aux étudiants de deuxième de cycle de l’université d’Avignon
| fév. -juil. 2003
| Stage au Laboratoire Informatique d'Avignon (DEA): Conception d'un système d'identification automatique du locuteur par mots de passe personnalisés avec intégration de contraintes temporelles fondées sur les Modèles de Markov Cachés. environnement technique : C/C++
| 2001 – 2003
| Projet de création d'entreprise (Keovoice) Indexation automatique de documents audio et faisant lieu d'un transfert technologique avec le Laboratoire d'Informatique d'Avignon (LIA). Ce projet fût lauréat du 3ème concours d'aide à la création d'entreprise de l'ANVAR :
conception d'une plate-forme d'indexation automatique de documents vocaux par le contenu au sein du projet Keovoice en collaboration avec le Laboratoire Informatique d'Avignon
développement d'une architecture distribuée (CORBA), de la partie traitement du signal (segmentation de flux audio)
conception de modèles de langages (nécessaire au fonctionnement du moteur de reconnaissance automatique de la parole)
environnement technique : C/C++, JAVA, JSP, perl, shell scripts
| 2000 - 2001
| Développeur pour la société Parts-Equipment : amélioration des fonctionnalités graphique (Xlib) et réseau d'un logiciel de gestion commerciale développé en C sous SCO UNIX environnement technique : C, Informix 1.0
| juin – août 2001
| Stage de fin d'étude (Maitrise) : développement d'un système d'Identification Automatique de la Langue (approche phonotactique) durant un stage de 2 mois en Slovénie dans le laboratoire de reconnaissance automatique de la parole de Maribor. Système développé en C en utilisant les outils HTK (Hidden Markov Models Tools Kit) environnement technique : C, perl, shell scripts
|
/
CV – Eric Blaudez
|