研究の過程で,cudaコードをclangに与えて出力されるLLVM IRを,GPUの実行可能ファイルまでコンパイルする必要があったので,そのコンパイルフローをまとめる. 環境 コンパイルフロー cu --> ll device.ll --> ptx ptx -> .o ptx, o --> fatbin fatbin, hos…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。