网站Logo Ran's blog
首页
归档
登录
CUDA学习笔记:Block与 Thread协作

CUDA学习笔记:Block与 Thread协作

本章主要学习有关cuda中Block与Thread的关系,Thread间如何通信,以及Thread的同步问题。初步认识cuda如何解决大规模并行问题 CUDA执行层次结构:Grid、Block和Thread 下图表示了Grid,Block,Thread三种结构的递进关系,能俯瞰它们是如何协作处理任务

2025-12-10
3
0
cuda
CUDA学习笔记:Block与 Thread协作

CUDA学习笔记:简单的并行程序——julia set

kernel的并行方式 最简单的例子 首先来看一个最经典的场景:向量加法: 对于向量a和向量b,假如我们想得到它们相加的结果c,在CPU(传统cpp)上,我们只能循环遍历每一个元素,比如: for(int i = 0; i < a.size(); i++){ c[i] = a[i] + b[

2025-11-17
13
0
cuda
CUDA学习笔记:简单的并行程序——julia set
CUDA学习笔记:简单的并行程序——julia set
CUDA学习笔记:CUDA入门

CUDA学习笔记:CUDA入门

host代码与device代码 host代码(主机端)指运行在CPU及内存(RAM)上的代码,一般是标准C/CPP代码 device代码(设备端)指运行在GPU及显存(vRAM)上的代码,即声明为__global__的代码(kernel函数) 一个cuda c程序由host代码和device代码两部

2025-11-02
9
0
cuda
CUDA学习笔记:CUDA入门