CUDA와 OpenCL 프로그래머에게 GPU는 확장된 C언어로 프로그램을 할 수 있는 대규모 병렬 산술계산용 프로세서다. GPU구조의 특징 대규모 멀티스레딩 CPU에 비해 상대적으로 캐쉬 메모리 대역폭에 초점을 맞춘 메모리 인터페이스 설계 CUDA 의 컴퓨팅 시스템 : HOST와 한 개 이상의 디바이스로 구성. HOST : 전통적인 CPU에 해당. DEVICE : 많은 수의 산술 연산 유닛을 장착한 대규모 병렬 프로세서 데이터 병렬성-자료 구조를 가지고 많은 개수의 산술 연산을 동시에 수행할 수 있는 성질. CUDA 디바이스는 대규모 데이터 병렬성을 담당해, application 수행 속도를 빠르게 함. ▶CUDA 프로그램의 구조 데이터 병렬성이 거의 없는 영역은 HOST 코드로, 많은 부분은 DEVIC..