Compress, Gather, and Recompute: REFORMingLong-Context Processing in Transformers
논문 링크 ⚡️ REFORM: 100만 토큰도 잊지 않는 LLM 추론 파이프라인 한 줄 요약 (TL;DR) REFORM은 압축(Compress) → 선별(Gather) → 선택적 재계산(Recompute) 세 단계를 하나로 묶어, 단일 H100 GPU에서도 100 만 토큰 문맥을 망각 …
26 분
'2506.01215v1' 태그의 모든 글
검색어를 입력하세요