Acoustic Space Mapping : A Machine Learning Approach to Sound Source Separation and Localization |
|
Analyse audio-visuelle de la scène d'un point de vue égocentrique : une approche par de l'apprentissage automatique et du traitement du signal.. |
|
Apprentissage auto-supervisé des relations entre sons, gestes articulatoires et unités de la parole pour le contrôle de la production : vers un agent apprenant à parler |
|
Au delà des mots : utilisation des modèles de langage pour une synthèse vocale incrementale et adaptable au contexte linguistique |
|
audio-visual multiple-speaker tracking for robot perception. |
|
Automatic detection of screams and shouts in the metro |
|
Beyond words : leveraging language models for incremental and context-aware text-to-speech synthesis. |
|
The bimodality of speech as a help to source separation. |
|
Codage ambisonique pour les communications immersives |
|
COSMO-Onset : un modèle Bayésien de perception de la parole, neuro-inspiré, combinant un traitement bottom-up de l'enveloppe du signal et des prédictions temporelles top-down pour la segmentation syllabique |
|
Débruitage de parole par un filtrage utilisant l'image du locuteur |
|
Deep learning for speaker counting and localization with Ambisonics signals. |
|
Détection automatique de cris dans le métro. |
|
Dynamical Variational Autoencoders for Multimedia Processing. |
|
High-capacity watermarking for audio sources mixtures. |
|
A high-rate data hiding technique for uncompressed audio signal. - |
|
Learning representations for robust audio-visual scene analysis |
|
Localisation et rehaussement de sources de parole au format Ambisonique : analyse de scènes sonores pour faciliter la commande vocale |
|
Localization and enhancement of speech from the Ambisonics format. |
|
Modèles de mélange pour la séparation multicanale de sources sonores en milieu réverbérant |
|
Multimodal analysis : informed content estimation and audio source separation |
|
Music sound synthesis using machine learning : Towards a perceptually relevant control space |
|
New contributions to audio source separation and diarisation of Multichannel Convolutive Mixtures. |
|
Noisy speech enhancement with a filtering process using the speaker's view. |
|
Phase recovery based on signal modeling : application to audio source separation. |
|
Représentations redondantes et hiérarchiques pour l'archivage et la compression de scènes sonores |
|
Self-supervised learning of the relationships between sounds, gestures and units for the control of speech production : towards an agent learning to speak. |
|
Séparation aveugle de source : de l'instantané au convolutif |
|
La séparation de sources audiovisuelles |
|
Sinusoidal long term modeling of the speech signals. |
|
Sparse and herarchical representations for archival and compression of audio scenes. |
|
Suivi multi-locuteurs avec information audio-visuel pour la perception du robot |
|
Synthèse de sons musicaux par apprentissage machine : vers un espace de contrôle perceptivement pertinent. |
|
Tatouage haute-capacité pour mélanges sonores |
|
Tatouage pour le renforcement de la qualité audio des systèmes de communication bas débit |
|
Toward a brain-computer interface for speech restoration. |
|
Vers une interface cerveau-machine pour la restauration de la parole |
|
Watermarking for enhancing the audio quality in low bit-rate audio coding. |
|