字節跳動ByteBrain團隊提出秒級推理強化學習VMR系統

6月5日,字節跳動技術團隊微信公衆號發文稱,字節跳動ByteBrain團隊主導,聯合UC Merced和UC Berkeley提出了VMR²L,研發了一套基於深度強化學習的VMR系統,在保持近似最優性能的同時,將推理時間壓縮至1.1秒,成功實現系統性能與工業可部署性的統一。

本工作已在系統頂會EuroSys25發表。本文兩位共同一作是字節跳動ByteBrain團隊的實習生,研究聚焦於長期被忽視但至關重要的虛擬機重調度(VMR)問題。VMR指的是在已有資源使用狀態下,通過遷移部分已部署的VM來重組資源、降低碎片、提升整體資源利用率。