Dutech, Alain, 19..-....
Dutech, Alain
VIAF ID: 218481673 (Personal)
Permalink: http://viaf.org/viaf/218481673
Preferred Forms
- 100 1 _ ‡a Dutech, Alain
- 100 1 _ ‡a Dutech, Alain, ‡d 19..-....
5xx's: Related Names (2)
- 511 2 _ ‡a Laboratoire lorrain de recherche en informatique et ses applications
- 511 2 _ ‡a Université de Lorraine (2012-....)
Works
Title | Sources |
---|---|
Améliorer l'efficacité en données de Novelty Search avec des modèles ou initialisation d'archive. | |
Apprentissage actif sous contrainte de budget en robotique et en neurosciences computationnelles. Localisation robotique et modélisation comportementale en environnement non stationnaire | |
Apprentissage automatique en ligne pour un dialogue homme-machine situé | |
Apprentissage autonome dans un système de vision neuromorphique : un modèle de codage impulsionnel actif et efficace appliqué à la vision. | |
Apprentissage de compétences de plus en plus complexes via l'apprentissage profond par renforcement en utilisant la motivation intrinsèque. | |
Apprentissage de couplages sensori-moteur en utilisant très peu d'informations : application à la robotique de manipulation. | |
Apprentissage micro-data pour l'adaptation en robotique. | |
Apprentissage non-supervisé pour la découverte de propriétés d'objets par découplage entre interaction et interprétation | |
Apprentissage par renforcement appliqué au revenue management des compagnies aériennes | |
Une approche modulaire pour l’apprentissage par imitation générique à l’aide d’une représentation spatio-temporelle des démonstrations basée sur les graphes : application à l’apprentissage robotique. | |
Auto-organisation multi-échelle pour l'émergence de comportements sensorimoteurs coordonnés | |
Autonomous learning in a neuromorphic vision system : an active efficient coding spiking model applied to vision | |
Comment Dresser Votre Robot - Nouveaux Environnements de Formation Robotique et Nouvelles Méthodes de Transfert de Stratégies du Simulateur au Vrai Robot.. | |
Contributions to Simulation-based High-dimensional Sequential Decision Making | |
Création de systèmes de contrôle de feux à l’aide de méthodes d’apprentissage par renforcement. | |
Dealing with uncertainty to optimise interactive systems. | |
Designing traffic signal control systems using reinforcement learning | |
Dynamique d'apprentissage pour Monte Carlo Tree Search : applications aux jeux de Go et du Clobber solitaire impartial | |
ehavioral Recognition and multi-target tracking in partially observed environments. | |
EWRL-6' 2003 : actes = proceedings | |
Exploration of reinforcement learning algorithms for autonomous vehicle visual perception and control | |
Façonnage de comportement robotique basé sur des signaux instructifs non labellisées. | |
Gestion de l'incertitude pour l'optimisation de systèmes interactifs | |
How to Train Your Robot. New Environments for Robotic Training and New Methods for Transferring Policies from the Simulator to the Real Robot | |
Improving Novelty Search Sample Efficiency with Models or Archive Bootstrapping | |
Intrinsically Motivated and Interactive Reinforcement Learning : a Developmental Approach | |
Learning behaviours aligned with moral values in a multi-agent system : guiding reinforcement learning with symbolic judgments | |
Learning dynamics for Monte Carlo Tree Search : application to combinatorial games. | |
Learning increasingly complex skills through deep reinforcement learning using intrinsic motivation | |
Learning sensori-motor mappings using little knowledge : application to manipulation robotics | |
Mathematical programming methods for decentralized POMDPs | |
Mécanismes d'apprentissage développemental et intrinsèquement motivés en intelligence artificielle : étude des mécanismes d'intégration de l'espace environnemental | |
Micro-Data Reinforcement Learning for Adaptive Robots | |
Modélisation du comportement habituel de la personne âgée dépendante en environnement incertain pour la détection d'évolutions et d'activités anormales | |
Motivated Multi scale Self-Organization for the emergence of coordinated sensorimotor behaviors. | |
Neural network distillation for generalization and transfer in reinforcement learning. | |
Online learning for situated human-machine dialogue. | |
Pré-entraînement non supervisé de représentations d'état dans un environnement sans récompense. | |
Présentation de sensibilisation contextuelle dans le processus d'estimation d'état : Extension de Bayes filtres avec des distributions de temps hétérogènes dépendant du contexte. | |
Des programmes mathématiques pour les processus décisionnels de Markoff décentralisés et partiellement observés. | |
Que prêtons-nous aux machines ? : approches interdisciplinaires des interactions homme-robot | |
Reconnaissance comportementale et suivi multi-cible dans des environnements partiellement observés | |
Reinforcement learning applied to airline revenue management. | |
Representation learning and developmental robotics : on the use of deep learning for autonomous robots. | |
La rétroaction de bandit sur classification et optimization multi-objective. | |
Shaping robot behaviour with unlabeled human instructions | |
Unsupervised learning for object property discovery by decoupling interaction and interpretation. | |
Unsupervised pretraining of state representations in a rewardless environment |