Pierluca D'Oro

Cytowane przez

	Wszystkie	Od 2019
Cytowania	293	291
h-indeks	8	8
i10-indeks	7	7

120

20182019202020212022202320241 4 19 23 43 111 91

Dostęp publiczny

Wyświetl wszystko

4 artykuły

0 artykułów

dostępne

niedostępne

Objęte finansowaniem

Współautorzy

Pierre-Luc BaconUniversity of MontrealZweryfikowany adres z mila.quebec
Evgenii NikishinPhD student, Mila, University of MontrealZweryfikowany adres z umontreal.ca
Aaron CourvilleProfessor, DIRO, Université de Montréal, Mila, Cifar CAI chairZweryfikowany adres z umontreal.ca
Max SchwarzerOpenAIZweryfikowany adres z openai.com
Marcello RestelliAssociate Professor, Politecnico di MilanoZweryfikowany adres z polimi.it
Alberto Maria MetelliAssistant Professor, Politecnico di MilanoZweryfikowany adres z polimi.it
Matteo PapiniPolitecnico di MilanoZweryfikowany adres z polimi.it
Marc G. BellemareGoogle BrainZweryfikowany adres z google.com
Wojciech JaśkowskiSnowflakeZweryfikowany adres z snowflake.com
Martin KlissarovMcGill University, MilaZweryfikowany adres z mail.mcgill.ca
Pascal VincentFacebook AI Research; U. Montreal (Professor, Computer Sc. & Op. Res.); MILA; CIFARZweryfikowany adres z iro.umontreal.ca
Mikael HenaffFacebook AI ResearchZweryfikowany adres z nyu.edu
Amy ZhangAssistant Professor of Electrical and Computer Engineering at University of Texas at AustinZweryfikowany adres z austin.utexas.edu
Roberta RaileanuResearch Scientist, MetaZweryfikowany adres z fb.com
Harley WiltzerMcGill University, MilaZweryfikowany adres z mila.quebec
Nate RahnPhD Student, McGill UniversityZweryfikowany adres z mail.mcgill.ca

Obserwuj

Pierluca D'Oro

Mila & Meta

Zweryfikowany adres z mila.quebec

AI Agents Artificial Intelligence Reinforcement Learning Deep Learning


Tytuł Sortuj wg cytatów Sortuj wg roku Sortuj wg tytułu	Cytowane przez Cytowane przez	Rok
The primacy bias in deep reinforcement learning E Nikishin, M Schwarzer, P D’Oro*, PL Bacon, A Courville International conference on machine learning, 16828-16847, 2022	100	2022
Sample-Efficient Reinforcement Learning by Breaking the Replay Ratio Barrier P D'Oro, M Schwarzer, E Nikishin, PL Bacon, MG Bellemare, A Courville International Conference on Learning Representations (ICLR), 𝐍𝐨𝐭𝐚𝐛𝐥𝐞-𝐭𝐨𝐩-𝟓%, 2023	44	2023
Gradient-Aware Model-based Policy Search P D'Oro, AM Metelli, A Tirinzoni, M Papini, M Restelli The Thirty-Fourth AAAI Conference on Artificial Intelligence, 3801-3808, 2020	42	2020
How to Learn a Useful Critic? Model-based Action-Gradient-Estimator Policy Optimization P D'Oro, W Jaśkowski Advances in Neural Information Processing Systems 34, 2020	28	2020
Adversarial framework for unsupervised learning of motion dynamics in videos C Spampinato, S Palazzo, P D’Oro, D Giordano, M Shah International Journal of Computer Vision, 1-20, 2019	27*	2019
Policy Optimization as Online Learning with Mediator Feedback AM Metelli, M Papini, P D'Oro, M Restelli The Thirty-Fifth AAAI Conference on Artificial Intelligence, 8958-8966, 2021	12	2021
Motif: Intrinsic Motivation From Artificial Intelligence Feedback M Klissarov, P D’Oro, S Sodhani, R Raileanu, PL Bacon, P Vincent, ... International Conference on Learning Representations (ICLR), 2024	10	2024
Group Anomaly Detection via Graph Autoencoders P D’Oro, E Nasca, J Masci, M Matteucci NeurIPS Graph Representation Learning Workshop, 2019	8	2019
Real-time Classification from Short Event-Camera Streams using Input-filtering Neural ODEs G Giannone, A Anoosheh, A Quaglino, P D'Oro, M Gallieri, J Masci NeurIPS workshop on Interpretable Inductive Biases and Physically Structured …, 2020	7	2020
SMfinder: Small Molecules Finder for Metabolomics and Lipidomics analysis G Martano, M Leone, P D'Oro, V Matafora, A Cattaneo, M Masseroli, ... Analytical Chemistry, 2020	6	2020
Long-Term Credit Assignment via Model-based Temporal Shortcuts M Ma, P D'Oro, Y Bengio, PL Bacon Deep RL Workshop NeurIPS, 2021	5	2021
Policy Optimization in a Noisy Neighborhood: On Return Landscapes in Continuous Control N Rahn, P D'Oro, H Wiltzer, PL Bacon, MG Bellemare Advances in Neural Information Processing Systems 37, 2023	3	2023
Meta Dynamic Programming P D’Oro, PL Bacon NeurIPS Workshop on Metacognition in the Age of AI: Challenges and Opportunities, 2021	1	2021
Maxwell's Demon at Work: Efficient Pruning by Leveraging Saturation of Neurons S Dufort-Labbé, P D'Oro, E Nikishin, R Pascanu, PL Bacon, A Baratin arXiv preprint arXiv:2403.07688, 2024		2024
The Curse of Diversity in Ensemble-Based Exploration Z Lin, P D'Oro, E Nikishin, A Courville International Conference on Learning Representations (ICLR), 2024		2024
Do Transformer World Models Give Better Policy Gradients? M Ma, T Ni, C Gehring, P D'Oro, PL Bacon ICLR Workshop on Generative Models for Decision Making, 𝐎𝐫𝐚𝐥, 2024		2024
Unleashing The Potential of Data Sharing in Ensemble Deep Reinforcement Learning Z Lin, P D'Oro, E Nikishin, A Courville Deep Reinforcement Learning Workshop NeurIPS 2022, 2022		2022
Beyond maximum likelihood model estimation in model-based policy search P D’Oro Politecnico di Milano Digital Archive, Italy, 2019		2019

Nie można teraz wykonać tej operacji. Spróbuj ponownie później.

Prace 1–18

Cytowania rocznie

Powielone cytowania

Scalone cytowania

Dodaj współautorówWspółautorzy

Obserwuj

Cytowane przez

Współautorzy