当前位置: 首页 > news >正文

如何做app 的模板下载网站如何加速wordpress反应速度

如何做app 的模板下载网站,如何加速wordpress反应速度,1920网页设计尺寸规范,医院网站开发兼职为了确保能够真正地了解线程块的分配,接下来我们写一个简短的内核程序来输出线程块、线程、线程束和线程全局标号到屏幕上。现在,除非你使用的是 3.2 版本以上的 SDK否则内核中是不支持 printf的。因此,我们可以将数据传送回 CPU 端然后输出到…

        为了确保能够真正地了解线程块的分配,接下来我们写一个简短的内核程序来输出线程块、线程、线程束和线程全局标号到屏幕上。现在,除非你使用的是 3.2 版本以上的 SDK否则内核中是不支持 printf的。因此,我们可以将数据传送回 CPU 端然后输出到控制台窗口,内核的代码如下:


#include "cuda_runtime.h"
#include "device_launch_parameters.h"#include <stdio.h>
#include <stdlib.h>
#include <conio.h>__global__ void what_is_my_id(unsigned int* const block,unsigned int* const thread,unsigned int* const warp,unsigned int* const calc_thread) {/* Thread id is block index * block size + thread offset into the block */const unsigned int thread_idx = (blockIdx.x * blockDim.x) + threadIdx.x;block[thread_idx] = blockIdx.x; thread[thread_idx] = threadIdx.x;/* Calculate warp using buit in variable warpSize */warp[thread_idx] = threadIdx.x / warpSize;calc_thread[thread_idx] = thread_idx;
}#define ARRAY_SIZE 128
#define ARRAY_SIZE_IN_BYTES (sizeof(unsigned int)* (ARRAY_SIZE))/* Declare statically four arrays of ARRAY_SIZE each */
unsigned int cpu_block[ARRAY_SIZE];
unsigned int cpu_thread[ARRAY_SIZE];
unsigned int cpu_warp[ARRAY_SIZE];
unsigned int cpu_calc_thread[ARRAY_SIZE];int main(void) {/* Total thread count =2*64=128 */const unsigned int num_blocks = 2;const unsigned int num_threads = 64;char ch;/* Declare pointers for GPU based params */unsigned int* gpu_block;unsigned int* gpu_thread;unsigned int* gpu_warp;unsigned int* gpu_calc_thread;/* Declare loop counter for use later */unsigned int i;/* Allocate four arrays on the GPU */cudaMalloc((void**)&gpu_block, ARRAY_SIZE_IN_BYTES);cudaMalloc((void**)&gpu_thread, ARRAY_SIZE_IN_BYTES);cudaMalloc((void**)&gpu_warp, ARRAY_SIZE_IN_BYTES);cudaMalloc((void**)&gpu_calc_thread, ARRAY_SIZE_IN_BYTES);/* Execute our kerne] */what_is_my_id <<<num_blocks, num_threads>>>(gpu_block, gpu_thread, gpu_warp, gpu_calc_thread);/* Copy back the gpu results to the CPU */cudaMemcpy(cpu_block, gpu_block, ARRAY_SIZE_IN_BYTES, cudaMemcpyDeviceToHost);cudaMemcpy(cpu_thread, gpu_thread, ARRAY_SIZE_IN_BYTES, cudaMemcpyDeviceToHost);cudaMemcpy(cpu_warp, gpu_warp, ARRAY_SIZE_IN_BYTES, cudaMemcpyDeviceToHost);cudaMemcpy(cpu_calc_thread, gpu_calc_thread, ARRAY_SIZE_IN_BYTES, cudaMemcpyDeviceToHost);/* Free the arrays on the GPU as now we're done with them */cudaFree(gpu_block);cudaFree(gpu_thread);cudaFree(gpu_warp);cudaFree(gpu_calc_thread);/* Iterate through the arrays and print */for (i = 0; i < ARRAY_SIZE; i++) {printf("Calculated Thread: %3u - Block:%2u - Warp %2u - Thread %3u\n", cpu_calc_thread[i], cpu_block[i], cpu_warp[i], cpu_thread[i]);}ch = getch();
}

        在这个例子中,我们可以看到线程块按照线程块的编号紧密相连。由于处理的是一维数组,所以我们对线程块采用相同的布局便可简单解决问题。以下是此程序的输出结果:

                  

        正如我们计算的那样,线程索引是0~ 127。一共有两个线块,每个线程块包含 64个线程,每个线程块内部线程的索引为0~63。一个线程块包含两个线束。

http://www.yayakq.cn/news/768458/

相关文章:

  • 织梦网站如何上传wordpress头像显示空白
  • 设计网站页面设计wordpress仿hexo主题
  • 模块化建站工具网站建设企业开发
  • 网站开发工程师就业形势手机 pc网站模板
  • 微信小程序开发注意事项手机优化加速有什么用
  • 贵州省城乡与建设厅网站wordpress边栏小工具
  • 杭州做卖房子的工作哪个网站好wordpress 使用教程
  • 罗田县建设局网站家纺代发网站建设
  • 如何看配色网站企业展示型网站怎么建
  • 兰州网站建设怎么选珠海做网站公司
  • 线上p2p网站建设手机网站横向切换
  • 网站需求清单动态的网站大概多少钱
  • 网站流量100g网站建设 应酷
  • 建设门户网站的意见和建议网易企业邮箱怎么找回密码
  • 番禺区pc端网站建设公众号链接的手机网站怎么做的
  • 百度一下你就知道官方网站网站app封装怎么做
  • 怎么做专题网站注册网站后邮箱收到邮件
  • 陕西省建设监理协会网站证件查询品牌网站建设新闻
  • 苏州建设网站首页wordpress用ip访问
  • 郑州定制网站推广工具产品知名网站开发公司
  • 网站开发的优势wordpress 糗百
  • 万网是做网站的吗黄冈网站建设哪家专业
  • 名片在哪个网站做改图网在线制作图片
  • 商城类网站如何众筹网上营销推广
  • 企业高端网站建设美工闵行区网站设计
  • 网站界面风格游戏网站wordpress
  • 广州网站建设 乐云seo效果好网站建设哪家便宜
  • 卖建材的网站有哪些设计网站教程
  • 网站的宣传方法有哪些wordpress原图片删除
  • 企业网站建设宣贯网站开发属于IT行业