Foundation-Models

'Foundation-Models' 카테고리의 모든 글

총 2개의 글

시간순 정렬

[논문리뷰] KIMI K2: OPEN AGENTIC INTELLIGENCE

논문 링크 Kimi K2: 오픈소스 LLM이 에이전트 지능을 향해 내딛은 한 걸음 TL;DR MuonClip 프리트레인 + 대규모 에이전틱 툴 데이터 + Verifiable‑RL 정렬의 3‑단계 파이프라인으로, Kimi K2는 τ²‑Bench …

2025년 07월 26일

KimiK2 MuonClip tool-use self-critique-RL agentic-llm long-context MoE-models open-source-LLM Tau2-bench SWE-bench

[논문리뷰] Qwen3 Technical Report

[논문리뷰] Qwen3 Technical Report

[논문리뷰] Qwen3 Technical Report

논문 링크 Qwen 3: 생각량을 조절하는 거대 MoE 언어모델의 진화 한 줄 요약 (TL;DR) Qwen 3는 “얼마나 깊게 생각할지”를 토큰 수치로 직접 제어할 수 있는 Thinking Budget과 128-전문가 MoE 설계를 결합해, 활성 파라 …

2025년 07월 26일

Qwen3 Mixture-of-Experts LongContext ThinkingBudget MultilingualModel ChainOfThought BenchmarkEvaluation OpenSourceModel