Compress, Gather, and Recompute: REFORMingLong-Context Processing in Transformers
논문 링크 ⚡️ REFORM: 100만 토큰도 잊지 않는 LLM 추론 파이프라인 한 줄 요약 (TL;DR) REFORM은 압축(Compress) → 선별(Gather) → 선택적 재계산(Recompute) 세 단계를 하나로 묶어, 단일 H100 GPU …
26 분
2506.01215v1
LLM,
Long-Context
Retrieval
Systems