Ai Tenstorrent Metalium 잘 돌아가게 하기 요즘 연구실에서 Tenstorrent라는 회사의 AI가속기를 사용해서 하는 연구를 주로 하고 있는데, 코드베이스가 깔끔하지 않아서 빌드 단계에서 실패하는 경우가 잦다. ㅠ_ㅠ 공식 문서에 작성되어 있는 것 이외에, 자주 발생하는 문제의 해결 방법을 정리해 보았다.
Ai 논문 정리: FlashAttention GPU가 워크로드를 처리하는 방법에 있어 I/O Aware한 최적화 알고리즘을 제안하여 처리 속도와 GPU 메모리 사용량 모두를 크게 개선한 성과를 낸 논문 FlashAttention에 대해 정리해 보고자 합니다. 굉장히 유명한 논문이며 현재는 AI워크로드에 필수적으로 널리
Ai Architecture System Tenstorrent 논문 요약 기존의 Shared Memory 방식과는 전혀 다른 설계 구조로 만들어진 Tenstorrent의 AI 가속기가 어떤 물건인지 대략적으로 알아볼 수 있는 논문 Compute Substrate for Software 2.0 을 읽고 핵심 내용을 요약해 보겠습니다.