Université de Moncton
  Campus de Shippagan  
  FaceBook Google+ Twitter You Tube
Réseaux sociaux

Intelligence artificielle - Sid-Ahmed Selouani - Interaction personne-système robuste et ubiquiste.

Activités recherche-développement

  • Professeur invité à l’Institut National de Recherche Scientifique Énergie, Matériaux & télécommunications, Université du Québec.
  • Responsable du Groupe de Recherche en Information et Technologie (GRIT) à l’UMCS (2006-2009).
  • Chercheur dans le cadre du projet CORIMEDIA : Image, Vidéo et Multimédia : Recherche, indexation et Navigation, Université de Sherbrooke. 
  • Cité en référence dans un rapport des nations unis (ONU) sur l’évolution des technologies de l’information dans les pays Arabes (Maghreb et Moyen-Orient) : « Harmonization of ICT standards related to Arabic language use in information society applications », United Nations, page 39, New York, 2003.
  • Membre Senior de l’institut des ingénieurs électriciens et électrotechniciens (IEEE).
  • Certifié RFID+ par CompTIA et RFID Pro par Academia Canada 
  • Responsable du Laboratoire de recherche LARIHS (http://www.larihs.com/). Voir aussi le lien sur les activités du LARHIS.
  • Collaborations de recherche avec l'INRS-EMT de Montréal, CLIPS-IMAG de Grenoble France, Computer Engineering college King Saud University, CNRC Canada, LCPTS-USTHB Alger, Université du Nouveau-Brunswick.
  • Membre de l’International Association of Science and Technology for Development.
  • Membre du comité scientifique et/ou d'organisation des conférences suivantes : SSPRA 2003, ACS 2003, CST 2003, CSS2003, NCI 2004, CSS’2004, PDCN2004, AIA 2005, MIC 2005, Biomed 2005, ACIT-CS 2005, CI 2005, SIP 2005, IAIL 2005, ISSPA-Summer School 2006, ACS 2006.NOLISP2007,AMBISYS2008, ICTW2008, CI2009, SOMITAS 2009, CNSR2009, ITNG 2009, CNSR2010, ICMWI2010.
  • Publications

    A-Chapitres de livres

    • S- A. Selouani, "The Well Adjusted Intelligent Conversational Agent for Mobile Communications", Chapter in Springer eds book Visions of Speech: Exploring New Voice Apps in Mobile Environments, Call Centers and Clinics, under press.
    • S- A. Selouani, T-H. Lê, Y. Benahmed, and D. O'Shaughnessy, "Enhanced Speech-Enabled Tools for Intelligent and Mobile E-Learning Applications", book chapter in Technologies Shaping Instruction and Distance Education: New Studies and Utilization, eds Advances in Distance Education Technologies series, pp. 147-166, 2010.
    • N. Kamel, S-A Selouani and H. Hamam, "A formal approach to the verification of adaptability properties for mobile multimodal user interfaces", Chapter in multimodality in Mobile Computing and Mobile Devices: Methods for Adaptable Usability, Stan Kurkovsky eds, IGI publishing, pp. 53-75, 2010.
    • Y. Benahmed, S-.A. Selouani, H. Hamam, "Natural Human-System Interaction Using Intelligent Conversational Agents", Book chapter Open Information Management: Applications of Interconnectivity and Collaboration. IGI Publishing edition, pp. 232-250, 2009.

    B-Articles dans des revues avec comité de lecture (7 dernières années)   

    • H. Sitilia, H. Hamam, S.-A. Selouani, "Technical Solutions for Privacy Protection in RFID", European Journal of Scientific Research, Vol.38 No.3, pp.500-508, 2010.
    • Y. A. Alotaibi, and S-.A. Selouani,. "Evaluating the MSA West Point Speech Corpus", International Journal of Computer Processing of Oriental Languages, vol. 22, No.4: 1-20., 2010.
    •  N. Ghourchian, S.-A. Selouani, D. O'Shaughnessy, "Robust Speech Enhancement Using Two-Stage Filtered Minima Controlled Recursive Averaging", Lecture Notes in Computer Science, Springer eds. SIP, pp. 72-81, December 2009.
    • Y. Benabderahmane, S.-A. Selouani, D. O'Shaughnessy, and H. Hamam,"A Comparative Study of Blind Speech Separation using Subspace Method and Higher Order Statistics", Lecture Notes in Computer Science, Springer-Verlag Berlin Heidelberg eds.,  pp. 117-124, December 2009.
    • S-.A. Selouani, M.S. Yakoub, D. O'Shaughnessy, "Alternative Speech Communication System, for persons with severe speech disorders", EURASIP Journal on Advances in Signal Processing, Special issue on Analysis and Signal Processing of Oesophageal and Pathological Voices, Article ID 540409, 12 pages DOI: 10.1155, May 2009.
    • D. Addou, S.-A. Selouani, K. Kifaya, M. Boudraa, and B. Boudraa, "A noise-robust front-end for distributed speech recognition in mobile communications", International Journal of Speech Technology, ISSN 1381-2416, pp. 167-173, May 2009.
    • N. Kamel, S-A Selouani and H. Hamam, "A Model-Checking Approach for the Verification of CARE Usability Properties for Multimodal User Interfaces", International Review on Computers and Software, ISSN: 1828-6003, pp. 152-160, January 2009.
    • W. Cichocki,   S-.A. Selouani, L. Beaulieu, "The RACAD speech corpus of New-Brunswick Acadian French: Design and applications". The Canadian Acoustics Journal, vol. 36, pp.3-10, 2008.
    • Y. A., Alotaibi, S.-A. Selouani, and D. O'Shaughnessy, "Experiments on Automatic Recognition of Non-native Arabic Speech", EURASIP Journal on Audio, Speech, and Music Processing, Article ID 679831, 9 pages, doi:10.1155, 2008.
    • S.-A. Selouani, L. Tang-Hô, Y. Benahmed, D. O'Shaughnessy, "Speech-enabled tools for augmented Interaction in e-learning applications", Special issue of International Journal of Distance Education Technologies, Vol. 6 No2, pp. 1-20, 2008.
    • S-A. Selouani, Y. Alotaibi, "Investigating Automatic Recognition of Non-Native Arabic Speech", International Journal of Mathematical and Computer Sciences, Vol. No 2, pp. 1-18, March 2008.
    • S.-A. Selouani, H. Hamam, D. O'Shaughnessy, «A hybrid Genetic-Neural Front-end extension for robust speech recognition over telephone lines», Lecture Notes on Computer Science, Springer-Verlag Berlin Heidelberg, pp. 169-178, 2007.
    • S.-A. Selouani, and H. Hamam"Broadband's Social Impact in an Atlantic Rural Zone: Case Study in the Shippagan Area", Journal of Information, Information technology, and Organizations, Vol. 2, pp. 79-94, 2007.
    • S. A. Selouani, D.O'Shaughnessy and J. Caelen "Incorporating phonetic knowledge into an evolutionary subspace approach for robust speech recognition", International Journal of Computers and Applications, Vol. 29, No 2, pp. 143-154, 2007.
    • S.A Selouani, H. Hamam, and Y. Benahmed "Broadband Technology in the Acadian Peninsula: Report Based on a Case Study", IEEE-Canadian review, No. 54, pp. 8-12, 2007.
    • H. Hamam, D. LeBlanc, Y. Benahmed, S.A. Selouani, Y. Bouslimani,"Double Modality Computer Interface for Learners with Special Needs", International Journal of Emerging Technologies in Learning, ISSN: 18630383, Vol. 2, Issue 2, 2007.
    • S.A Selouani, T. Lê, C. Moghrabi, B. Lanteigne, J. Roy "Online collaborative learning system using speech technology", Transactions on Engineering, computing and technology, Vol. 15, pp.52-57, October 2006.
    • S. A. Selouani, «Un système à base de connaissances pour une communication parlée Personne-Système multilingue», numéro spécial de la revue de l'Université de Moncton, vol.36, No 2, pp.53-84, 2005.
    • S. A. Selouani & D.O'Shaughnessy, "Robust automatic recognition of telephone speech", Acoustical Society of America Journal, short paper, Vol. 113, No.4, pp. 2198-2198, 2003.
    • S. A. Selouani and D.O'Shaughnessy, "On the use of evolutionary algorithms to improve the robustness of continuous speech recognition systems in adverse conditions", Special issue of the Journal on Applied Signal Processing, No. 8, pp.814-823, July 2003.
    • S.-A Selouani & D.O'Shaughnessy, "Speaker adaptation of HMMs using evolutionary strategy-based linear regression", Acoustical Society of America Journal, Volume 111, Issue 5, pp. 2477-2478, 2003.

    C-Articles publiés dans des actes de conférences arbitrées (avec ISBN, sept dernières années) 

    • Y. Benabderahmane, D. O'Shaughnessy, S-A Selouani, "Blind Speech Separation for Convolutive Mixtures Using an Oriented Principal Components Analysis Method", 18th European Signal Processing Conference, Alborg, accepted, August 2010.
    • L. Fontaine, and S.-A Selouani, "Intelligent Agents for Customer Behavior Prediction to Improve Relationship Marketing", the 16th International Conference on
      Information Systems Analysis and Synthesis, pp. 362-365, Orlando, USA, 2010.
    • Md. F. R. Chowdhury, S.-A. Selouani, and D. O'Shaughnessy, "Frame Recursive Dynamic Mean Bias Removal Technique for Robust Environment-Aware Speech Recognition in Real World Applications", 23rdCanadian Conference on Electrical and Computer Engineering, Calgary, Canada, 2010.
    • S. Pelletier and S.A Selouani, "An Integrated Framework to Enhance the Web Content Mining and Knowledge Discovery", the 4th International Conference on Knowledge Generation, Communication and Management: KGCM, pp. 478-481, Orlando, USA, 2010.
    • Md. F. R. Chowdhury, S.-A. Selouani, D. O'Shaughnessy, "Text-independent distributed speaker identification and verification using GMM-UBM speaker models for Mobile", IEEE-International Symposium in Signal Processing and its Applications, pp. 57-60, Kula Lampur, Malaysia 2010.
    • Y. Alotaibi, and S. A. Selouani, "Investigating the adaptation of Arabic speech Recognition systems to foreign accented Speakers", IEEE-International Symposium in Signal Processing and its Applications, pp. 646-649, Kula Lampur, Malaysia 2010.
    • N. Ghourchian, S.-A. Selouani, D. O'Shaughnessy, "Robust Distributed Speech Recognition using Two-Stage Filtered Minima Controlled Recursive Averaging", IEEE Automatic Speech Recognition and Understanding (ASRU), pp. 249-255, December 2009.
    • Y. Benabderahmane, D. O'Shaughnessy, S-A Selouani, "Blind Speech Separation using OPCA Method", IEEE Symposium on Industrial Electronics and Applications (ISIEA 2009), Kuala Lumpur, Malaysia, pp. 736-740, October, 2009.
    • S. Rekik, S.A. Selouani, H. hamam, "A cooperative and conversational virtual agent for M-commerce applications", IEEE- International conference on Innovations in Information Technology, IIT '09., pp. 180 - 184, Dubai 2009. 
    •  Md.  Jahangir Alam, S-A.  Selouani, and D. O'Shaughnessy, "An improved perceptual speech enhancement technique employing a psychoacoustically motivated weighting factor", proceeding of IEEE Automatic Speech Recognition and Understanding (ASRU), pp. 266-270 December 2009.
    • I. H. Abolhassani, D. O'Shaughnessy, S.-A. Selouani, "A Method Utilizing Window Function Frequency Characteristics for Noise-Robust Spectral Pitch Estimation", Interspeech Conference, Brighton, UK, pp. 1371-1373, September 2009.
    • I. H. Abolhassani, D. O'Shaughnessy, S.-A. Selouani, "A Method Utilizing Window Function Frequency Characteristics for Noise-Robust Spectral Pitch Estimation", 17th European Signal Processing Conference (EUSIPCO), Glasgow, Scotland, pp. 2544-2548, 2009.
    • S-A. Selouani, Y. Alotaibi, "Analyzing the Seventh Vowel of Classical Arabic", IEEE International Conference on Natural Language Processing and Knowledge Engineering (IEEE NLP-KE'09), September 2009.
    • Y. Benabderahmane, S-A Selouani, D. O'Shaughnessy, "Blind Speech Separation using High Order Statistics", accepted in IEEE conference 22ndCanadian Conference on Electrical and Computer Engineering, St John, Terre-Neuve et Labrador, pp.670-673, May 2009.
    • Md. F. Chowdhury, S.-A. Selouani, D. O'Shaughnessy, "Distributed Automatic Text-Independent Speaker Identification Using GMM-UBM Speaker Models", 22ndIEEE-Canadian Conference on Electrical and Computer Engineering, St John, Terre-Neuve et Labrador, pp. 664-669, May 2009.
    • D. Addou, S.-A. Selouani, M. Boudraa, B. Boudraa, "Feature Combination using Multiple Spectral Cues for Robust Speech Recognition in Mobile Communications", IEEE-Information Technology of New Generation, Las Vegas, USA, pp.1256-1261, April 2009.
    • A. Ben Salem, S.-A. Selouani, H. Hamam, and J. Caelen, "A Highly robust audio hashing system using auditory-based front-end processing", IEEE-ICASSP, Taipei, Taiwan, pp. 1413-1416, April 2009.
    • Md. F. Chowdhury, S.-A. Selouani, D. O'Shaughnessy, "A Study on Bias-Based Speech Signal Conditioning Techniques for Improving the Robustness of Automatic Speech Recognition", 22ndIEEE-Canadian Conference on Electrical and Computer Engineering, St John, Terre-Neuve et Labrador, pp. 372 à 375, May 2009.
    • J. Marcoux and S.-A Selouani, "A Hybrid Subspace-Connectionist Data Mining Approach for Sales Forecasting in the Video Game Industry", IEEE-World Congress on Computer Science and Information Engineering (CSIE 2009), Los Angeles, California, USA, pp. 666-670, March 2009.
    • S.A Selouani & H. Hamam, "Trade Liberalization and Human Rights from the technological point of view: A Case Study of a Rural Region in Atlantic Canada", Oxford Forum on Public Policy, Journal of Oxford Round Table, August 2008.
    • K. Kifaya, A. Nourozian, S.-A. Selouani, H. Hamam, H. Tolba, "Multi-Stream front-end processing for Robust distributed speech recognition", 21st International Conference on Parallel and Distributed Computing and Communication Systems, New Orleans, LA, USA, pp. 98-102, September 2008.
    • S. A Selouani, "Hybrid Architectures for Emphatic/non-Emphatic Consonant Identification in Arabic Speech", National Information Technology Symposium, Ryadh, Arabie Saoudite, Mars 2009.
    • K. Kifaya, S.A. Selouani, H. Hamam, «Genetic Algorithm based Optimization of Robust Distributed Speech Recognition in GSM Noisy Environments", IIT'2008 Innovations 2008, Al-Ain,UAE, December 2008
    • N. Kamel, S. -A. Selouani and H. Hamam, "a decomposed model-checking approach for the verification of CARE usability properties for multimodal interfaces", in proceedings of Eighth International Workshop on Automated Verification of Critical Systems, Glasgow, AVoCS, September 2008.
    • N. Kamel, S. -A. Selouani and H. Hamam, "A Modal Logic for the CARE Usability Properties for Multimodal User Interfaces". International Conference on Software Research and Practice (SERP2008), 14-17, Las Vegas, USA, July 2008.
    • Md. Jahangir Alam, S.-A. Selouani, and D. O'Shaughnessy, "Speech enhancement based on a hybrid a priori signal-to-noise ratio (SNR) estimator and a self- adaptive Lagrange multiplier," European Signal Processing Conference (EUSIPCO), Lausanne, Switzerland, August 2008.
    • Md. Jahangir Alam, S-A. Selouani, and D. O'Shaughnessy, "Speech enhancement based on novel two-step a priori SNR estimators", proceeding of INTERSPEECH'08, Brisbane, Australia, pp. 565-568, September 2008.
    • Md. Jahangir Alam, S.-A. Selouani, D. O'Shaughnessy and S. Ben Jebara, "Speech Enhancement using a Wiener denoising technique and musical noise reduction," in proceeding of INTERSPEECH'08, Brisbane, Australia, pp. 407-410, September 2008.
    • A. H. Abolhassani, S-A Selouani, D. O'Shaughnessy, "Subspace-based speech enhancement by updating noise characteristics in the presence of speech", proceeding of European Signal Processing Conference (EUSIPCO), Lausanne, Switzerland, August 2008.
    • M. Sidi Yakoub, S.-A. Selouani, D. O'Shaughnessy, "Speech Assistive Technology to Improve the Interaction of Dysarthric Speakers with Machines", the IEEE-International Symposium on Communications, Control and Signal Processing, Malta, pp.1150-1154, 2008.
    • A. Norouzian, S. -A. Selouani, H. Tolba, and D. O'Shaughnessy, "Incorporating Formant Cues into Distributed Speech Recognition Systems", the IEEE-International Symposium on Communications, Control and Signal Processing, pp.1159-1162, Malta, 2008.
    • N. Kamel, Y. Ait-Ameur, S-A. Selouani and H. hamam, "A Formal model to handle the adaptability of Multimodal User Interface", International Conference on Ambient Media and Systems, Quebec City, ACM, ISBN: 978-963-9799-16-5, February 2008.
    • M. Sidi-Yacoub, S.-A. Selouani, D. O'Shaughnessy, "Improving Dysarthric Speech Intelligibility through Re-synthesized and Grafted Units", 21st IEEE-Canadian Conference on Electrical and Computer Engineering, pp. 1523-1526, May 2008.
    • A. Jahangir, D. O'Shaughnessy, S-.A Selouani, "Speech Enhancement Employing a Sigmoid-Type Gain Function with a Modified A priori Signal-to-Noise Ratio (SNR) Estimator", 21st IEEE-Canadian Conference on Electrical and Computer Engineering, pp. 631-634, May 2008.
    • A. Nourozian, S.-A Selouani, D. O'Shaughnessy, "Incorporating Phonetic Knowledge into a Multi-Stream HMM Framework", 21st IEEE-Canadian Conference on Electrical and Computer Engineering, pp. 1705-1708, May 2008.
    • N. Kamel, S-A. Selouani and H. Hamam, "Un modèle pour une satisfaction implicite des propriétés d'utilisabilité CARE pour les IHM multimodales", 21st IEEE-Canadian Conference on Electrical and Computer Engineering, pp. 279-282, May 2008.
    • Dahmani, S.A-Selouani, M. Chetouani, and N. Doghmane, "Prosody modelling of speech aphasia", IEEE-ICTTA'08, pp.255-258, April 2008.
    • Y. Benahmed, S-.A. Selouani, H. Hamam, and D. O'Shaughnessy, "Using Text-to-Speech Engine to Improve the Accuracy of a Speech-Enabled Interface", IEEE conference on Innovations in Information Technology, pp. 302-306, Dubai, UAE, 2007.
    • S-A. Selouani, Y. Alotaibi, "Investigating Automatic Recognition of Non-Native Arabic Speech", IEEE conference on Innovations in Information Technology, pp. 451-455, Dubai, UAE, 2007.
    • A. Abolhassani, S.-A. -Selouani, D. O'Shaughnessy, M.F. Harkat, "Speech Enhancement Using PCA and Variance of the Reconstruction Error Model Identification", in the proceedings of Interspeech, pp. 974-977, Belgium, August 2007.
    • H. Dahmani, S.- A. Selouani, M. Chetouani, N. Doghmane, « Ressources linguistiques pour l'assistance aux aphasiques d'une région de l'est algérien », Actes des VIIèmes RJC parole, pp. 68-71, Paris, juillet 2007.
    • A. H. Abolhassani, S-A Selouani, D. O'Shaughnessy, "Speech Enhancement Using PCA and VRE in DSR", IEEE-ASRU, pp. 19-23, Japan, December 2007.
    • H. Hamam, D. LeBlanc, Y. Ben Ahmed, S.A. Selouani, Y. Bouslimani "Giving computer and network access to learners with special needs", in the proceedings of the International Conference on Interactive Mobile and Computer Aided Learning, IMCL2007, Amman, April 2007.
    • D. LeBlanc, Y. Benahmed, S.A. Selouani, Y. Bouslimani and H. Hamam, "Computer interface by gesture and voice for users with special needs", IEEE conference on Innovations in Information Technology, pp. 122-125, Dubai, UAE, 2006.
    • S.-A. Selouani, D. O'shaughnessy "Speaker adaptation using evolutionary-based linear transform", in CD proceedings of International Conference on Spoken Language Processing ICSLP-InterSpeech conference, pp.1109-1112, Pittsburgh, November 2006.
    • Y. Benahmed, S.-A Selouani"Robust self-training system for spoken query information retrieval using pitch range variations", IEEE Canadian Conference On Electrical & Computer Engineering, pp. 949-952, Ottawa 2006.
    • S.A Selouani, M. Kardouchi,, E. Hervet et D. Roy, "Automatic Birdsong Recognition Based on Autoregressive Time-Delay Neural Networks", IEEE conference of Computational Intelligence: Methods & Applications, pp. 356-369, Istanbul, December 2005.
    • J. Paulin, M. Girourad, S.A Selouani, "An e-commerce community project for the Acadian Peninsula", Communications, Internet and Information Technology conference, CIIT2005, pp. 102-105, Cambridge, USA, November 2005.
    • M. Kardouchi, E. Hervet, S.A Selouani, "Interactive browsing method based on colour feature points and colour histograms" Information & Communications Technologies International Symposium IEEE-ICTIS'2005, Rabat, Morocco, pp. 257-261, June 2005.
    • H. Tolba, S.-A. Selouani and D.O'Shaughnessy, "Towards the Improvement of Automatic Speech Recognition by Integrating Dynamic and Static Auditory-based Acoustic Distinctive Features and Spectral Cues", 16th Modelling and Simulation conference, pp.154-157, Cancun, May 2005.
    • S.-A. Selouani and D.O'Shaughnessy, "Investigation into a Mel Subspace Based Front-End Processing for Robust Speech Recognition ", IEEE-International symposium in signal processing and Information Technology, ISSPIT'04, Roma, pp. 187-190, December 2004.
    • S.-A. Selouani and D.O'Shaughnessy, "Robustness of speech recognition using genetic algorithms and a mel-cepstral subspace approach", International Conference on Acoustics Speech and Signal Processing (IEEE-ICASSP'2004), vol.1, pp.201-204, May 2004.
    • S.-A. Selouani, and J. Caelen, «Un système hybride pour l'identification de traits phonétiques complexes», 25èmes JEP-TALN 2004, pp. 302-305, Fès, avril 2004.
    • H. Tolba, S-A. Selouani, and D. O'Shaughnessy, "Comparative Experiments to Evaluate the Use of Auditory-based Acoustic Distinctive Features and Formant Cues for Robust Automatic Speech Recognition in Low-SNR Car Environments", 8th European Conference on Speech Communication and Technology, EUROSPEECH'03, pp.3085-3088, Geneva, September, 2003.
    • S.A Selouani, H. Tolba & D.O'Shaughnessy, "Auditory-based Acoustic Distinctive Features and Spectral Cues for Robust Automatic Speech Recognition in Low-SNR Car Environments", HLT-NAACL 2003, Human Language Technology Conference of the North American Association for Computational Linguistics, pp.91-94, Edmonton, Canada, May 2003. 

    D-Conférences Invité, Communications présentées à des congrès, colloques ou conférences, propriété intellectuelle enregistrée (7 dernières années)

    • Y. Benabderahmane & S.A Selouani, "Blind Source Separation over GSM channel", SYTACom Research Workshop, Concordia University, April 2010, Montréal, Canada.
    • S.-A. Selouani, «Contribution sur l'état de la recherche en région», Table ronde, Radio-Canada, FESR, Mars 2010.
    • S-.A. Selouani, «Ateliers de formation sur la technologie RFID au profit du personnel de Jiffy Products Ltd»  o Atelier 1: Technologie RFID: Comment ça marche?, octobre 2009   o Atelier 2: Dispositifs et équipements RFID, novembre 2009 o Atelier 3: Règlements, standard et normes RFID + pratique, novembre 2009. o Atelier 4: Installation et analyse de sites pour un déploiement RFID, décembre 2009. o Atelier 5: Construire un modèle (cas) d'affaires (business case) RFID, janvier 2010.
    • S. A. Selouani, « Bonnes pratiques de l'Internaute averti», 30ème Colloque des professionnels de bureau, Shippagan, juin 2010.
    • I. Abolhassani, and S.A Selouani, "A Novel Pitch-Synchronous STFT-Based Method for Speech Enhancement", SYTACom Research Workshop, McGill University, April 2009, Montréal, Canada.
    • Y. Benabderahmane & S.A Selouani, "Blind Source Separation of convolutive mixture", SYTACom Research Workshop, McGill University, April 2009, Montréal, Canada.
    • S.-A Selouani, "Hybrid Architectures for Data mining applied in commercial prospective", Conférencier Invité au National Information Technology Symposium, Ryadh, Arabie Saoudite, Mars 2009.
    • S.-A Selouani, "Trade liberalization and human rights: A case study of a rural region in Atlantic Canada", invité 20th Oxford Round Table, Queen College, Oxford, 2-8 August 2008.
    • T. Ross, M. Arseneau, A. Kadouri, S. Belbraouet, Y. Bouslimani, S.-A Selouani, "Allergosoft logiciel destiné à identifier les produits allergiques contenus dans les aliments» Copyright #1056209, Canadian Intellectual Property Office, Industry Canada 2008.
    • S.-A. Selouani, «Vers une Interaction Humain-Système Naturelle, Intuitive et Robuste», Conférence plénière, USTHB, Alger, 22 Juin 2008.
    • S.-A Selouani, «Rapport sur la gestion des biens par RFID», Compagnie Jiffy Products Ltd. Novembre 2007.
    • S. A. Selouani, "Voice Recognition in noisy environments", Mobile Content and applications Workshop, CNRC, Moncton, June 2007.
    • Y. Benahmed, S.A Selouani, H. Hamam « Reconnaissance automatique de la parole en langue française du Nouveau-Brunswick » Journées des études supérieures et de la recherche, Université de Moncton, mars 2007.
    • A. Norouzian, S.-A. Selouani, H. Tolba & D. O'Shaughnessy, « Distributed Speech recognition using a multi-stream paradigm », annual workshop of SYTACom network, Laval, Québec, May 2007.
    • S.-A. Selouani, « Vers une robustesse et une accessibilité universelles des interfaces personne-système intégrant la voix », 3rd International Summer School on Signal Processing and its Applications, Jijel, juillet 2006.
    • S.A Selouani, H. McLaughlin, « eRGI : un répertoire électronique avec accessibilité augmentée pour la gestion de l'information dans les organisations », 74e  conférence de  l'ACFAS, D-212, Montréal, mai 2006.
    • S.-A. Selouani, H. Hamam, "Impact of Broadband Adoption in Rural New Brunswick: Shippagan and Surrounding Rural Area Case Study Report", New-Brunswick Universities, Research Consortium, Industry Canada project, March 2006.
    • S.A Selouani, «Prospérité numérique du Nouveau-Brunswick: volet e-commerce», contribution à la table ronde sous l'égide du Premier ministre du NB, Inkerman, 2005.
    • S. A Selouani «un nouveau modèle pour le e-commerce en Acadie», Contribution pour la collectivité ingénieuse de la péninsule acadenne, mai 2005.
    • S.-A. Selouani et D. O'Shaughnessy, «CoriMédia: Recherche et indexation de documents multimédia», Rapport du projet Valorisation-Recherche-Québec, années: 2003, 2004.
    • S.A Selouani, « Génétique et sélection naturelle pour une reconnaissance automatique de la parole plus robuste ». 72ème Congrès de l'ACFAS, Montréal, D208, mai, 2004.
    • S. A. Selouani, « Robustesse des systèmes de reconnaissance distribués» interfaces personne-système intégrant la voix », INRS-EMT, Montréal, juillet 2008.
    • Une série d'ateliers a été dispensée aux étudiants gradués de l'USTHB Alger, 17-21 juin 2008:o Atelier 1 : «Méthodes de Rehaussement du signal de parole en milieu bruité». o Atelier 2 : «Utilisation de l'outil HTK et les scripts UNIX». o Atelier 3 : «Base de données en parole : Méthodologie de conception et de collecte».
    • S.-A Selouani, "SCATÉ: un système palliatif de communication verbale», 4e Rendez-vous Santé en français, Edmonton, Canada, 13-16 février 2008.
    • S. A. Selouani, « Solutions pour une meilleure interaction Humain-Système dans le domaine de la santé», Symposium sur les réseaux de santé rurale, Fredericton, février 2007.
    • S. A. Selouani, « Affaires électroniques : outils et bonnes pratiques », 26e colloque des professionnels de bureau du Nouveau-Brunswick, Shippagan, juin 2006.
    • S. A. Selouani, « Prototypes de systèmes d'information conversationnels », Conférence Exposant, FrancoTech, Collectivité ingénieuse de la Péninsule Acadienne, Shippagan, novembre 2005.
    • «Humaniser la machine», Entrevue et rédaction d'un article sur ma recherche dans le journal: l'Acadie-Nouvelle du samedi 29 janvier 2005.
    • S. A. Selouani, « Gestion de l'information clé de l'économie du savoir», Conférence FrancoTech, Collectivité ingénieuse de la Péninsule Acadienne, Caraquet, octobre 2004.
    • S. A. Selouani, « Nouveaux modèles de commerce électronique », Journée des affaires, Université de Moncton, campus de Shippagan, mars 2004.
    • S. A. Selouani, « Commerce électronique : Mythes et réalités», Conférence FrancoTech, Collectivité ingénieuse de la Péninsule Acadienne, Shippagan, octobre 2003.

     

    Projets internationaux

    Titre du projet 1 : Cross-Atlantic Partenership in Network Systems and Information Management. Canada UE

    Organisme subventionnaire : Ministère Canadien des Ressources Humaines et Développement des Compétences 

    Années couvertes: 2010-2013

    Résumé du projet :

    The goal of the program is to establish sustainable partnerships between Canadian and European higher-education institutions in the field of information management that will facilitate the acquisition of skills required to meet the challenges of information management in the context of the global knowledge-based economy. Students will have the opportunity to study abroad at participating institutions and/or intern with an organization in the Information Technology and/or Information Management sector. This will allow the students to develop practical and academic knowledge related to their particular field of expertise, within an international context.


    Projets de recherche majeurs financés par des sources externes à l'Université de Moncton 

     

    Titre du projet 1 : Dispositifs Hybrides d'Identification par Radiofréquence et Technologies Vocales Robustes Appliqués à l'Industrie Horticole  

    Organisme subventionnaire : Fondation Canadienne de l'Innovation, Fonds des leaders

    Années couvertes: 2008-2010  

    Résumé du projet :

    La recherche principale proposée se caractérise par la convergence-intégration de technologies novatrices pour proposer une solution améliorant la gestion des opérations dans l'industrie manufacturière. Elle se base sur des concepts avancés en traitement du signal qui améliorent la robustesse et l'efficacité de l'interaction Personne-Système via des interfaces utilisant des agents de reconnaissance vocale et de synthèse de la parole. Ces agents vocaux communiqueront avec un réseau maillé d'étiquettes intelligentes RFID pour traiter plus rapidement l'information véhiculée par ces étiquettes. Les sujets de recherche potentiels couvrent plusieurs domaines de pointe dont les principaux sont : 

    -les applications réseaux omniprésents et complexes dans la mesure où l'objectif est de permettre un accès rapide à une information omniprésente dans un réseau maillé d'étiquettes RFID. Un opérateur pourra localiser très rapidement un produit en interrogeant, tout étant en mobilité (microphone sans fil) un intergiciel capable de lui fournir la réponse par voix synthétique. L'opérateur pourra également transmettre en temps réel l'information  sur le produit via ce dispositif mains-libres axé sur le réseau d'étiquettes RFID et voix. La recherche touche l'aspect du traitement des signaux intelligents en proposant une nouvelle technique de rehaussement en milieu bruité (manufacturier). Ces signaux seront transmis via un intergiciel à un réseau omniprésent d'étiquettes RFID qui sont des dispositifs radiofréquence sans fil.

    Les réseaux adaptatifs ou cognitifs par l'intégration d'une nouvelle technique d'adaptation des agents conversationnels au profil de l'utilisateur. Grâce à ce système l'utilisateur évitera les longues séances d'apprentissage de l'engin de reconnaissance. Une automatisation de l'apprentissage est prévue par un mécanisme modélisant le profil et les préférences de l'utilisateur (opérateur dans le milieu industriel). Un module de dialogue Humain-Système, basé sur une approche novatrice utilisant le formalisme AIML (Artificial Intelligence Markup Language) permettra une interaction verbale bilingue : Anglais-Français plus naturelle.

    ---------------------------------------------------------------------------------------------------------

    Titre du projet 2 : Interfaces conversationnelles augmentées pour l'assistance de personnes francophones et anglophones atteintes de troubles de l'élocution

    Organisme subventionnaire : Fondation de l'Innovation du Nouveau-Brunswick (FINB) IAR

    Années couvertes: 2008-2010  

    Résumé du projet :

    La recherche proposée se caractérise par l'intégration de technologies vocales novatrices pour proposer une solution améliorant la communication verbale des personnes atteintes de diverses pathologies de la parole. Le projet vise la réalisation d'outils technologiques facilitant l'insertion sociale de personnes anglophones et francophones ayant des  troubles de la parole (dysarthriques, bègues, aphasiques, etc.). Ces personnes pourront ainsi communiquer plus efficacement avec les autres interlocuteurs car leur message (parole) devient plus intelligible. Le projet s'inscrit dans la grappe stratégique des technologies de l'information. La recherche proposée facilitera l'insertion professionnelle ainsi que l'apprentissage de personnes ayant des difficultés d'élocution. Cette frange de la société Néo-Brunswickoise pourra également interagir plus facilement avec les fournisseurs de services par Web vocalisé ou par téléphone. En effet, la technologie proposée permettra une amélioration de la qualité de communication verbale en français et en anglais. Le domaine de recherche est articulé autour des technologies d'interfaces augmentées qui connaissent une croissance exponentielle. La plus-value qu'apporte le projet constitue une option stratégique pour :

    • améliorer considérablement la qualité de vie des personnes ayant des troubles de la parole;
    • faciliter l'insertion de personnes atteintes de troubles de la parole dans la sphère socio-économique du Nouveau-Brunswick;
    • former du personnel de recherche hautement qualifié dans le domaine de l'interaction des personnes à besoins spéciaux avec divers systèmes informatiques;
    • intégrer des algorithmes générateurs de propriété intellectuelle dans le domaine du traitement des signaux, d'interfaces augmentées, d'outils d'aide et d'assistance dans des applications novatrices : e-apprentissage, télécommunications, ...

    ---------------------------------------------------------------------------------------------------------

    Titre du projet 3 : Reconnaissance distribuée et robuste de la parole optimisée par une approche évolutionniste et intégrant le dialogue coopératif

    Organisme subventionnaire : Conseil de Recherche en Sciences Naturelle & Génie (CRSNG)  

    Résumé du projet :

    Dans les configurations utilisant l'interaction Personne-Système verbale, des insuffisances sont toujours constatées, plus particulièrement autour des trois aspects suivants que nous ciblons dans le présent projet :

    Le projet est articulé autour de trois axes complémentaires visant une Interaction Personne-Système Verbale (IPSV) robuste et naturelle sur des dispositifs de télécommunications mobiles. Le premier axe propose une nouvelle approche pour la reconnaissance de la parole distribuée basée sur un paradigme multi-flots de données (multi-stream paradigm) optimisé par algorithmes génétiques. Le deuxième axe vise l'établissement d'un nouveau modèle de dialogue Personne-Système basé sur la coopération. Le troisième axe, applicatif, a pour objectif l'assistance aux personnes atteintes de troubles d'élocution (aphasiques, dysarthriques, etc.) en mettant à leur disposition, lorsqu'ils communiquent avec un centre d'appel par exemple, un système-prothèse générant de la parole intelligible à leur place.

     -------------------------------------------------------------------------------------------------------------

    Titre du projet 4 : Reconnaissance vocale robuste dans les télécommunications mobiles

    Organisme subventionnaire : Coopération Québec/ Nouveau-Brunswick  

    Années couvertes: 2006-2009

    Résumé du projet :

    Nous proposons une nouvelle technique de débruitage et de séparation de sources d'informations indépendantes dans le contexte de télécommunications mobiles. En effet, les systèmes actuels de reconnaissance vocale sont incapables de distinguer entre deux locuteurs (sources) parlant avec le même niveau de volume. L'être humain est par contre capable d'écouter et de comprendre le message de son interlocuteur même si celui-ci est noyé dans du bruit  ou dans un flots de parole provenant d'autres locuteurs (effet cocktail party). La solution au problème de la séparation de sources est fortement liée aux modèles du mélange des sources  qui représentent  les interactions  entre les sources et les signaux reçus à la sortie des capteurs. La méthode proposée s'interessera à la  séparation sous l'hypothèse d'un mélange convolutif dans le réseau GSM.

    -------------------------------------------------------------------------------------------------------------

    Titre du projet 5 : Greffe sonore pour locuteurs francophones ayant des difficultés d'élocution  (PHASE II)

    Organisme subventionnaire : Consortium National de formation en Santé (CNFS)

    Années couvertes: 2007-2008  

    Résumé du projet :

    Le projet proposé vise la réalisation d'un système de greffe logicielle qui permettra d'améliorer l'intelligibilité de la parole des personnes francophones ayant des difficultés d'élocution. Ces difficultés peuvent être d'origine accidentelle ou innée. Pour atteindre cet objectif, il est nécessaire de disposer d'enregistrements audio de patients francophones atteints de troubles du langage. Nous avons organisé des séances d'enregistrements audio auprès de patients francophones habitant principalement la Péninsule acadienne. Ceci, afin de recueillir des données qui permettront d'améliorer les interfaces vocales. Les comités d'éthique de l'Université de Moncton, des régies de la santé Beauséjour, Restigouche et Acadie-Bathurst ont donné leur approbation pour la collecte de données auprès de patients francophones. Le projet s'articule principalement autour de l'intégration du système de synthèse TD-PSOLA mis à la disposition des utilisateurs ayant des troubles d'élocution. Celui-ci se charge de synthétiser de façon intelligible le texte issue de la parole reconnue prononcée par une personne ayant des difficultés d'élocution tels que le bégaiement, la dysarthrie, cancer de la langue, etc. La vois synthétisée (corrigée) est très proche de la voix originale de ces personnes. Ce dernier objectif a été atteint grâce à un module qui adapte les différents paramètres prosodiques (fréquence fondamentale, durée, intensité).

    --------------------------------------------------------------------------------------------------------------

    Titre du projet 6 : Interaction ad hoc personne-système par mouvements et voix : Applications en santé et en éducation

    Organisme subventionnaire : CRSNG

    Montant :   216000$  

    Résumé du projet :

    Nous proposons une technologie à faible coût pour donner accès à la télévision, à l'ordinateur, à Internet et aux différents instruments d'usage quotidien ou d'usage professionnel à des personnes ayant des contraintes particulières. Inscrite dans les domaines des communications et de la gestion de l'information, notre stratégie consiste à combiner des technologies, évoluant exponentiellement et notamment les réseaux de prochaines générations sans fil ad hoc, avec la communication vocale avec la machine. La recherche est de nature à élaborer des nouvelles connaissances, techniques, et produits innovateurs. La problématique dans laquelle s'inscrit le projet répond aux questions : Comment avoir accès à la machine pour se divertir, s'instruire, se former, travailler, faire une recherche, communiquer avec une autre personne ou système, payer ses factures, faire des transactions bancaires, lorsqu'on ne peut pas utiliser l'une ou les deux mains pour une raison permanente (déficience, fatigue rapide, troisième âge,...) ou dans une situation particulière (mains occupées, craintes d'infection, traitement en cours, on a besoin de trois mains,) ? Comment le faire d'une façon multimodale (accès au clavier, à la souris, à la voix, aux applications différentes : PowerPoint, fureteur Web, moteurs de recherche,...), précise (exactement conformément au désir de l'utilisateur), conviviale (agréable à utiliser), rentable (bas coût), mobile (sans fil) et robuste (pas de failles, de blocage ou d'incertitude) ? Dans les usines impliquant des procédés de fabrication dangereux, comment au moyen d'un système multimodal, convivial, rentable, mobile et robuste permettre à l'employé d'agir en toute sécurité (sans connexions électriques,...) à distance pour accomplir une tâche complexe ou pour débloquer une situation impliquant les mouvements des mains ?

    Comment remplacer les écrans spéciaux (tactiles,...) généralement coûteux par des écrans simples ou carrément par des murs assurant les mêmes fonctionnalités ? Ceci doit être à travers une interface multimodale, précise, conviviale, rentable, mobile et robuste.

    ---------------------------------------------------------------------------------------------------------------

    Titre du projet 7 : Formalisation et traitement du dialogue oral Homme-Machine coopératif dans les plateformes multimédia dédiées au commerce électronique

    Organisme subventionnaire : Centre Jacques Cartier (France-Canada)  22ème appel d'offres 

    Années couvertes: 2006-2007  

    Résumé du projet :

    Le projet vise l'amélioration de l'interaction entre l'utilisateur et une plateforme multimédia dotée d'un système de dialogue oral Homme-Machine dans une application de commerce électronique. Il s'agira de proposer des améliorations à deux niveaux. Au premier niveau, le principe novateur des techniques que nous proposons consiste à « manipuler génétiquement », au sens des algorithmes évolutionnaires, les différents paramètres mis en jeu dans le processus de reconnaissance ou d'adaptation au locuteur à savoir les éléments de la matrice d'observation et la matrice globale de transformation. Au second niveau, il s'agira de proposer un modèle de dialogue Homme-Machine à la fois cognitif et formel, exploitable dans des applications de commerce électronique. Nous examinerons la manière dont un système de dialogue peut gérer, exploiter, identifier puis formaliser l'implicite dans ce type de communication d'affaires, afin d'accroître à la fois l'accessibilité et les capacités de compréhension de la machine.  Le principal objectif est d'étendre les facultés multimodales via un dialogue formel aux solutions logicielles que nous avons développées. Grâce au produit visé, les clients finaux devraient pouvoir transmettre des données par le biais de plusieurs modalités (la parole et/ou le clavier, mais aussi la souris ou l'écran). La plateforme se chargeant en retour de synthétiser la réponse adéquate dans le format adéquat : audio, plein texte, vidéo/ou graphique. Ces modes peuvent être couplés les uns aux autres, mais également utilisés indépendamment. Les applications envisageables sont fortement génératrices de valeur pour les utilisateurs, a fortiori pour ceux ayant une incapacité physique motrice et/ou visuelle.

    --------------------------------------------------------------------------------------------------------------

    Titre du projet 8 : Impact of Broadband Adoption in Rural New Brunswick: Shippagan and Surrounding Rural Area

    Organisme subventionnaire : Industrie Canada

    Années couvertes: 2006  

    Résumé du projet :

    L'objectif de l'étude est d'évaluer les impacts de l'adoption de la large bande au Nouveau-Brunswick rural. Dans le cadre de l'étude plus large, nous évaluons les impacts sociaux, économiques, institutionnels et culturels dans la région de Shippagan, Le Goulet, Lamèque et Ste Marie. La recherche est menée par un partenariat de toutes les universités du Nouveau-Brunswick.

    Cette étude implique des sondages auprès de foyers et d'entreprises sur divers aspects. Elle implique aussi une entrevue avec des représentants d'organisations, de groupes et d'institutions (écoles, établissements médicaux, bureaux du gouvernement et autres) pour en apprendre davantage sur « si » et « comment » le large bande a été adopté et utilisé, et quels impacts, s'il y en a, en sont découlés.

    -------------------------------------------------------------------------------------------------------------

    Titre du projet 9 : Assistance par interaction vocale artificielle à l'usage des francophones atteints de troubles du langage

    Organisme subventionnaire : CNFS (Consortium National de formation en santé)

    Années couvertes: 2006-2007  

    Résumé du projet :

    Le projet global vise à réaliser un système d'assistance aux personnes francophones atteintes de divers troubles du langage incluant par exemple la dysarthrie, le bégaiement et l'aphasie. Ces difficultés d'origine cérébrale le plus souvent, se manifestent par des altérations de la voix, de l'articulation, de la déglutition et autres fonctions qui peuvent altérer complètement une situation de communication à cause de l'inintelligibilité du message produit. Le système-prothèse que nous visons est constitué de deux modules. Le premier module a pour rôle l'apprentissage de la parole altérée sur des corpus de données segmentés et étiquetés en phonèmes, puis l'identification de ces phonèmes par les modèles de Markov cachés. Le deuxième module a pour tâche l'analyse linguistique (lexicale et syntaxique) puis la synthèse de la parole reconnue à partir du texte. Pour atteindre cet objectif, il est nécessaire de disposer d'enregistrements audio de patients francophones atteints de troubles du langage. La présente demande de financement concerne la collecte de corpus et la réalisation des deux modules : celui de l'apprentissage-reconnaissance et celui de la synthèse naturelle.

    -------------------------------------------------------------------------------------------------------------

    Titre du projet 10 : Un Codeur-Décodeur bas-débit pour une reconnaissance vocale distribuée sur les réseaux sans fils de nouvelle génération

    Organisme subventionnaire : Fondation de l'Innovation du Nouveau-Brunswick

    Années couvertes: 2006-2007  

    Résumé du projet :

    Il s'agit de développer un nouveau codeur-décodeur (codec)  destiné à une application de la reconnaissance vocale distribuée (DSR : Distributed Speech Recognition) utilisant des protocoles Internet (IP), et sera conçu pour intégrer l'ensemble des applications propres aux nouvelles technologies à large bande communément appelée réseaux de nouvelle génération (NGN: Next Generation Networks). Cette nouvelle architecture repose sur quelques principes généraux à savoir un réseau principal partagé pour tous types de services et d'accès, des technologies de transport par paquets, des interfaces normalisées ouvertes entre les différentes couches du réseau, des supports d'interface utilisateur adaptables et des réseaux d'accès de type et d'accès variables. Ce Codec s'inscrit également dans la perspective de la convergence des télécommunications fixes et mobiles sur des réseaux initiaux et des plateformes de service techniquement similaires. Le codec développé sera compatible pour intégrer le projet de partenariat de troisième génération (3GPP) qu'il soit celui relatif aux réseaux 3GPP élaboré sur GSM (européens), ou 3GPP2 élaboré sur CDMA (Nord-Américains). De ce fait, notre codec s'inscrira donc dans une perspective mondiale, qui préfigurera du monde multimédia mobile de demain. Il offre des caractéristiques fondamentalement avancées en termes d'interactivité avec les utilisateurs. Il y a par conséquent un avantage évident à profiter d'un marché de masse réellement convergeant basé sur les plateformes vocales intelligentes. Par ailleurs, le développement de notre codec compatible NGN a lieu au moment opportun car il existe une forte demande de l'industrie pour des services multimédia de nouvelle génération pour des accès sans fils. Comparativement au standard de DSR actuel, notre système utilisant le paradigme multi-variable vise une meilleure compression de débit ainsi que de meilleures performances en termes de taux de reconnaissance pour de faibles rapports signal sur bruit (RSB).

    -------------------------------------------------------------------------------------------------------------

    Titre du projet 11 : Infrastructure pour la recherche en interactivité personne-système appliquée à l'assistance des usagers déficients

    Organisme subventionnaire : Fondation Canadienne de l'innovation (FCI)

    Période couverte: 2004-2009

    Résumé du projet :

    L'objectif recherché à travers ce projet est la mise en place d'une infrastructure de recherche (LARIHS : Laboratoire de Recherche en Interactivité Homme-Système) et l'acquisition de l'équipement nécessaire pour mener divers travaux liés à la conception et à la réalisation de plateformes qui permettent une interactivité efficace, robuste et proche du naturel entre l'usager et le système (centre d'appel, portail Web, dispositif embarqué,...) et ce, quelles que soient les capacités ou les possibilités d'interaction de l'usager. Il est attendu à travers cette infrastructure, le développement de produits qui sont le type d'outils recherchés tant par les individus que par les institutions et entreprises opérant dans le domaine des affaires électroniques et qui visent une accessibilité augmentée. Les projets initiés s'appuieront sur les technologies langagières dans le but de constituer une alternative efficace lorsque l'usage d'un système interactif traditionnel est rendu inefficient en raison de difficultés de représentation des commandes, de l'inadéquation des modalités ou d'un handicap sensoriel ou moteur des utilisateurs. Ceci sans occulter les problèmes inhérents à la variabilité de la parole spontanée (caractéristiques du locuteur, contexte d'usage, mode d'élocution). La composante matérielle consiste en quatre stations de travail adaptées, d'un ordinateur portable doté de capacité de stockage amovible, d'une imprimante laser, de deux DAT (enregistreurs numériques) et de leurs accessoires, de cinq microphones sans fil, d'un afficheur Braille, et d'une baie multiple de duplication CD. Les besoins logiciels sont constitués des systèmes de développement d'environnements applicatifs et de bases de données : VisualStudio .Net, IBM ViaVoice (différents Kits de développement de reconnaissance et de synthèse), VoiceXML, Matlab (différents toolbox), un logiciel de script, Speech Studio, la suite Microsoft Office et des bases de données : Hub5 et Aurora 2.0. Le laboratoire est actuellement opérationnel à l'UMCS.

    -------------------------------------------------------------------------------------------------------------

    Titre du projet 12 : Robustesse de la reconnaissance de la parole par algorithmes génétiques

    Organisme subventionnaire : CRSNG

    Période couverte: 2004-2007  

    Résumé du projet :

    Le projet vise la réalisation de systèmes de reconnaissance robustes aux changements intempestifs de l'environnement acoustique et du locuteur, tout en imposant le moins de contraintes possible à l'utilisateur. Le principe novateur des techniques proposées consiste à utiliser les algorithmes génétiques pour optimiser différents paramètres mis en jeu dans le processus de reconnaissance ainsi que dans celui de l'adaptation au locuteur. Ce choix est justifié par le fait qu'aucune connaissance a priori sur le bruit, ni hypothèse préalable sur le locuteur, ne sont nécessaires pour réaliser l'adaptation. Par ailleurs, le champ d'investigation des solutions d'optimisation est plus ouvert. Ces techniques robustes seront intégrées (validées) dans une plate-forme multimédia disposant de fonctionnalités vocales et dédiée à l'apprentissage électronique (e-apprentissage). Dans le cadre de ce projet, je m'intéresse à l'adaptation du système de reconnaissance lui même, au moyen d'un auto-ajustement des distributions gaussiennes d'émission. Les deux démarches, à savoir : un rehaussement des données et une auto-adaptation du système, sont complémentaires et seront incluses dans un système unique afin d'appréhender le problème de robustesse des SRAP d'une manière plus globale, contrairement aux approches classiques. L'optimisation s'effectuera par algorithmes génétiques. Une série d'expériences permettra la formalisation de l'algorithme d'optimisation ainsi que la fixation des paramètres génétiques à savoir : le taux de croisement, le taux de mutation, la méthode de sélection, le nombre de générations, le critère d'arrêt, la fonction d'évaluation, le type de codage et la taille de la population.

    --------------------------------------------------------------------------------------------------------------

      Équipe de Recherche 2008-2010

               Post-doctorant-es:

                N. Kamel: Université de Poitiers & USTHB

        Étudiant-es Ph.D.:

        Md Foez Chowdhury : INRS-EMT Montréal

        Y. Benabderahmane: INRS-EMT Montréal

        J. Addou: USTHB Alger

        Y. Benahmed: INRS-EMT Montréal

        K. Kifaya: Université du Québec à Trois-Rivières

        G. Droua-Hamdani: USTHB Alger

        S. Rekik: Canadian University of Dubai

        H. Dahmani  : Université de Msila, Algérie

        Maitrise:

        A. Ben Ayad : Unversité de Moncton

        N. Ghourchian: INRS-EMT Montréal

        I. Abolhassani: INRS-EMT Montréal

        A. Nourouzian: INRS-EMT Montréal

        M. Sidi Yacoub: INRS-EMT Montréal

        A. H. Abolhassani:INRS-EMT Montréal

        Assistant-es de recherche:

        S. Benahmed 

        L. Gaudet 

        R. Ing

         

      Imprimer cette page
      Calendrier
      Nouvelles
      Bottin
      Plan du site
      Partager
      Accueil  |  Urgence  |  Assistance technique © 2019, Université de Moncton. Tous droits réservés.