[CUDA RT Series 8] Metal

목차: Series 1 – Index + Methodology (Link)이전 글: Series 7 – Iteration vs. Recursion (Link)다음 글: Series 9 – Dielectrics + Snell’s Law (Link) 출처 1에서 출처 2의 Chapter 8 내용부터는 추가적인 설명 없이 코드만 공유하고 있다. Chapter 8부터는 앞에 설명한 내용을 기반으로 CUDA 코드를 작성하면 된다고 한다. 그래서 Series 8부터는 변경된 코드 부분과 성능에 대해서만 간단히 작성할 계획이다. … Read more

[CUDA RT Series 7] Iteration vs. Recursion

목차: Series 1 – Index + Methodology (Link)이전 글: Series 6 – It’s All Random (Link)다음 글: Series 8 – Metal (Link) Diffuse Material을 계산하기 위해서 작성한 CPU Color Function(함수)는 Recursive Function(재귀 함수)을 사용한다. 해당 코드를 CUDA로 변경하면 Stack Overflow가 발생할 확률이 매우 높다. 출처 3에 따르면 CUDA의 경우 최대 24번의 Recursive Function 호출이 가능하다고 한다. Diffuse Material CPU 코드에서는 … Read more

[CUDA RT Series 6] It’s All Random

목차: Series 1 – Index + Methodology (Link)이전 글: Series 5 – Manage Your Memory (Link)다음 글: Series 7 – Iteration vs. Recursion (Link) 이번 글에서는 Anti-Aliasing(AA)를 구현한다. AA를 구현하기 위해서 Random 함수를 사용한다. CUDA는 cuRAND 라이브러리를 사용해서 Random 수를 생성한다. cuRAND는 CUDA Random Number Generation 라이브러리이다. cuRAND 라이브러리를 사용하여 AA를 구현하기 이전에 먼저 Camera Class를 먼저 생성한다. 아래 코드 1은 … Read more

[CUDA RT Series 5] Manage Your Memory

목차: Series 1 – Index + Methodology (Link)이전 글: Series 4 – Classing Up the GPU (Link)다음 글: Series 6 – It’s All Random (Link) 이번 장에서는 여러 개의 Sphere(구) 정보를 GPU 메모리에 저장하고 해당 정보를 활용해서 Sphere를 Rendering 할 예정이다. 이러한 과정에서 GPU 메모리를 관리하는 방법에 관해서 설명한다. 먼저 기존에 CPU에서 작성한 hitable, hitablelist, sphere Class를 GPU가 사용할 수 … Read more

[CUDA RT Series 4] Classing Up the GPU (Single vs. Double Precision)

목차: Series 1 – Index + Methodology (Link) 이전 글: Series 3 – Adding Vectors (Link) 다음 글: Series 5 – Manage Your Memory (Link) 이번에는 GPU가 사용할 Class를 생성한다. GPU에서 연산할 Class는 기존 CPU 코드와 동일하게 작성한다. Series 3 (Adding Vecotrs)에서 작성한 것과 같이 GPU에서 호출할 함수 앞에 “__device__”를 추가하면 된다.  아래 코드 1은 GPU에서 호출할 수 있도록 작성한 … Read more

[CUDA RT Series 3] Adding Vectors

목차: Series 1 – Index + Methodology (Link) 이전 글: Series 2 –First Image (Link) 다음 글: Series 4 –Classing Up the GPU (Link) 이번 장에서는 “__global__”, “__host__”, “__device__” 사용에 관해서 설명한다. 앞에서 작성한 코드 중 GPU에서 실행될 Function에 “__global__”을 함수 이름 앞에 작성하였다. “__global__”의 경우 GPU에서 실행할 함수를 의미한다. 보통 CPU에서 처음 호출할 함수 앞에 작성한다. “__global__”로 작성된 함수를 … Read more

[CUDA RT Series 2] First Image

목차: Series 1 – Index + Methodology (Link) 이전 글: Series 1 – Index + Methodology (Link) 다음 글: Series 3 – Adding Vector (Link) 출처 1에서 가장 처음 그리는 이미지는 초록색/빨간색/파란색을 적당히 혼합한 이미지이다. 아래 그림 1은 우리가 그릴 이미지이다. 우리가 그리게 될 이미지는 크기는 1200 x 600 이다. 기존 CPU 코드는 For Loop을 여러 번(Nested For Loops) 사용해서 … Read more

[CUDA RT Series 1] Index + Methodology

CUDA RT Series Index Ray Tracing (RT) in One Weekend(출처2)의 내용을 혼자 공부하면서 번역(출처 1)을 해보았다. 지난 RT 시리즈를 작성하면서 CUDA를 사용한 병렬화에 아주 적합한 코드인듯하여서 인터넷에 검색해 보니 역시나 병렬화 코드가 공개되어 있다 (출처 3). 개인적으로 CUDA 코드를 작성하는 방법에 대한 시리즈를 한번 작성해보고 싶었는데 출처 3에 좋은 내용이 있어서 역시나 공부를 하면서 번역을 해볼 … Read more