Jaehun's Blog

For Efficient AI


  • 홈

  • 카테고리

  • 태그

  • 아카이브

  • About

  • 검색

SageAttention3: Microscaling FP4 Attention for Inference and An Exploration of 8-bit Training

작성일 2025-07-09 | In paper-review , with-gpt ,
Reading time 30

논문 링크

Read more »

Peri-LN: Revisiting Normalization Layer in the Transformer Architecture

작성일 2025-07-09 | In paper-review , with-gpt ,
Reading time 23

논문 링크

Read more »

Massive Activations in Large Language Models

작성일 2025-07-09 | In paper-review , with-gpt ,
Reading time 25

논문 링크

Read more »

Helix Parallelism: Rethinking Sharding Strategies for Interactive Multi-Million-Token LLM Decoding

작성일 2025-07-08 | In paper-review , with-gpt ,
Reading time 33

논문 링크

Read more »

Insights into DeepSeek-V3: Scaling Challenges and Reflections on Hardware for AI Architectures

작성일 2025-07-08 | In paper-review , with-gpt ,
Reading time 28

논문 링크

Read more »

DeepSeek-Prover-V2: Advancing Formal Mathematical Reasoning via Reinforcement Learning for Subgoal Decomposition

작성일 2025-07-08 | In paper-review , with-gpt ,
Reading time 23

논문 링크

Read more »

Inference-Time Scaling for Generalist Reward Modeling

작성일 2025-07-08 | In paper-review , with-gpt ,
Reading time 23

논문 링크

Read more »

디지털 드래곤의 심장: AI 시대, 중국 데이터센터 배터리 시장에 투자해야 하는 이유

작성일 2025-07-07 | In 투자 , 2차전지 , deep-research , with-gemini ,
Reading time 12

아래 글은 gemini의 deep research를 이용하여 생성한 리포트입니다. 앞으로의 시대에서 2차전지는 전기차와 휴머노이드와 같은 산업에서 많은 수요가 있을것으로 예상이 됩니다. 그중에서도 데이터센터에 필요한 2차전지에 주목한다면(UPS/AI와 같은 워크로드가 순간적으로 많은 전력을 요구할시에 이에대한 전력요구가 필요/SMR,재생에너지와 같은 에너지원이 그리드가 갖추어지기전 저장하기 위해서 필요) 어떤 투자 인사이트를 얻을 수 있을지 궁금해서 리포트를 만들어 보았습니다.

Read more »

Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention

작성일 2025-07-07 | In paper-review , with-gpt ,
Reading time 34

논문 링크

Read more »

Code I/O: Condensing Reasoning Patterns via Code Input-Output Prediction

작성일 2025-07-07 | In paper-review , with-gpt ,
Reading time 35

논문 링크

Read more »
1 2 … 50
류재훈

류재훈

495 포스트
34 카테고리
247 태그
RSS
e-mail Linkedin
0%
© 2020 - 2025 류재훈
Powered by Jekyll
Theme - NexT.Mist