OSCAR: OOD State-Conservative Offline Reinforcement Learning for Sequential Decision Making

Jan 1, 2023·

Yi Ma

,

Chao Wang

,

Chen Chen

,

Jinyi Liu

Jinyi Liu

,

Zhaopeng Meng

,

Yan Zheng

,

Jianye Hao

· 0 min read

Type

Journal article

Publication

CAAI Artificial Intelligence Research

Overview

An offline reinforcement learning method that stays conservative on out-of-distribution states for sequential decision-making.

Venue. CAAI Artificial Intelligence Research

Last updated on Apr 26, 2025

Jinyi Liu

Authors

Ph.D. Candidate Reinforcement Learning and LLM Systems

← Exploration in deep reinforcement learning: From single-agent to multiagent domain Jan 1, 2023

Figcps: Effective failure-inducing input generation for cyber-physical systems with deep reinforcement learning Jan 1, 2021 →

Back to Publications

More Publications

Squeeze the Soaked Sponge: Efficient Off-policy RFT for Large Language Model Jan 2026 CellAgent: LLM-Driven Multi-Agent Framework for Natural Language-Based Single-Cell Analysis Jan 2026 From Seeing to Doing: Bridging Reasoning and Decision for Robotic Manipulation Jan 2026