当前位置: 首页 > news >正文

网站建设牜金手指花总十五铭坐网站建设

网站建设牜金手指花总十五,铭坐网站建设,折叠wordpress,域名申请时间需要多久本文整理一些日常积累的可以优化的方向 一.延迟vector计算 在进行float与vector计算的时候,可以先确定float再计算,不要多个float一起计算 如: highp float f0,f1;highp vec4 v0,v1;v0 (v1 * f0) * f1;优化为 highp float f0,f1;highp vec…

本文整理一些日常积累的可以优化的方向

一.延迟vector计算

在进行float与vector计算的时候,可以先确定float再计算,不要多个float一起计算
如:

  highp float f0,f1;highp vec4 v0,v1;v0 = (v1 * f0) * f1;

优化为

  highp float f0,f1;highp vec4 v0,v1;V0 = v1 * (f0 * f1)

二.避免分支语句(if和个别for语句)

以OpenGL通常处理的图像来说,OpenGL的shader在运算的时候,会产生成千上万个线程来对不同的点位区域进行计算,每个线程都使用同一份shader代码、但是处理的数据不同。为了大幅度提高计算速度,OpenGL利用了GPU,而GPU的基本调度单位叫做wavefront(不同平台理念相同、叫法不同,NVIDIA平台叫warp,AMD平台叫wavefront等, 下面统称为wavefront)。wavefront是一组线程的组合,既然称之为调度的基本单位,自然是GPU会同时处理属于同一个wavefront的所有线程,因为他们的计算指令(shader)从第一行到最后一行是完全相同的,只是数据不同而已。GPU正是这样通过single instruction multiple thread(SIMT)的方式来进行提速的。这有点类似于CPU中的SIMD加速,只不过CPU中一次SIMD操作只针对一组数据、需要人为编码控制,而GPU的SIMT是从始至终的用相同指令计算所有的线程数据。这样并行度极高,从而大幅提升了性能。

但是一旦引入if/for产生分支,wavefront结构就被完全破坏掉了,会产生diverged wavefront。例如原本4个线程组成一个wavefront一直同步计算,突然遇到if语句,3个线程if判断为true,进入A分支;另一个线程if判断为false,进入B分支,此时这4个线程接下来的指令不再相同,原来的这个线程组wavefront就无法同步计算、被迫分开,即为diverged wavefront。这时候,GPU只能分开执行这两个新产生的wavefront。由于GPU计算资源也是一定的,新产生的两个wavefront可能需要排队等待来顺序执行(原来是并行执行),尤其是wavefront大批量diverged的时候;然后新分割出来的wavefront如果要移动到其他GPU计算单元上还需要进行数据复制转移,也是很耗时的行为。这些都严重破坏了并行度,从而导致性能下降。因此,建议最好少使用产生分支的if语句;for语句有时候也会产生分支,也需要注意。

优化策略

  1. 用step方法或者其他的方法替换掉分支语句
    step是阶跃函数,输入两个参数edge,x。如果edge > x返回0,否则返回1.

    vec3 a;
    if (b > 1)
    {a = 1;
    }
    else
    {a = 0.5;
    }
    

    替换为

    vec3 a;
    float temp = step(b, 1.0);
    a =  1.0 - temp * 0.5;
    
  2. 如果不可避免进行分支操作,要先选择可以被优化的分支
    编译器有时可以对分支进行一定的优化。If判断条件一般包含三种数据:

    (1)静态分支:If判断语句仅仅包含常数;

    (2)uniform数据分支:If判断语句仅仅包含常数或uniform参数;

    (3)动态分支:其他情况,If判断语句中有动态变化的数据。

    按道理来说,静态数据和uniform数据不会变化,编译器应该可以判断并进行编译优化,但是对于Android开发来说,硬件千差万别,目前据我了解,对于OpenGL ES 2.0,基本上大都只能优化静态分支;对于OpenGL ES 3.0,通常可以优化uniform数据分支,部分机型可能可以优化动态分支。

    所以,写分支的时候注意分支的类型,并且如果升级到OpenGL ES 3.0,就基本可以使用uniform数据分支而没有明显的性能损失了。

    同理,如果for循环的此时是一个整数、即常量,那么也不会产生分支;只有当for循环的次数也是随着点位的不同动态变化的时候才会产生分支。

  3. 相同区块情况可以使用分支
    一般来说,相邻的点位区域的线程会组合在同一个wavefront中,如果一个分支与位置相关,例如图像上半部分都是黑色,下半部分是彩色;而If判断条件是颜色是否为黑色,那么大部分情况下同一个wavefront的线程都会在if判断后走同一个分支,这样wavefront就不会diverge。或者判断条件是和位置有关的,那么大概率也不会diverge。只要不产生diverge就不会对性能有很大影响。

  4. 全量代码,但保证某些分支不起作用
    比如如下:

    if (a == 0) {result = funcA();
    } else {result = funcB();
    }
    

    可以替换为:

    result = funcA();
    result = funcB();
    

    计算全部的函数,这样就避免了分支, 很多情况下,全量执行所有分支的代码比使用If判断还要快,这个可以通过实际测试比较来进行选择。

三. 计算尽量提前到顶点着色器

比如在计算一些面的法向量的时候,可以在Vertex Shader中计算完成,然后传递给
Fragment Shader,减少计算量。

四.使用更少的颜色分量参与计算

五.降低数据的精度

比如,从Vertex Shader传递到Fragment Shader的纹理坐标精度从highp改成mediump也会降低一些消耗。

参考

https://blog.csdn.net/qq_30070433/article/details/87392605
https://cloud.tencent.com/developer/beta/article/1370101
https://blog.csdn.net/ShareUs/article/details/94922200

http://www.yayakq.cn/news/816726/

相关文章:

  • 网站动态图标wordpress大小
  • 连云港住房和城乡建设厅网站百度网络营销中心
  • 开网络公司做网站挣钱么南京做网站优化的企业
  • 营销网站模板下载广州seo公司品牌
  • 网站地图怎么上传怎么建设自己个人网站
  • 网站内搜索关键字网络推广文案怎么写
  • 海宁高端网站设计天河做网站哪家强
  • 小企业网站建设的基础知识网站后端用什么语言
  • 岳各庄网站建设公司注册网站方法
  • 浙江建设信息港网站考试成绩查询水果套餐网站
  • 怎么关闭网站安全检测网站标题seo外包优化
  • 《网站开发与应用》大作业要求做tcf法语听力题的网站
  • 巩义市建设局网站四川建设行业数据共享平台
  • 影楼手机网站江苏省建设厅 标准化网站
  • 东莞网站优化什么方法wordpress po编译mo
  • wordpress仿站步奏百度站长社区
  • 攀枝花网站建设公司网页图片不清晰怎么办
  • 郑州网站推广方式建设网站证书查询
  • mysql网站数据库论坛排名
  • 一个人只做网站的流程广东短视频运营推广
  • 装修公司网站源代码制作网站的网址
  • 公司做外地网站榆中建设局网站
  • 如何找专业的网站建设公司广东省做网站推广公司
  • 建网站价格 建设网站需要多少钱湛江模板建站系统
  • 短视频素材下载网站无水印ipad室内装修设计软件
  • 石家庄做网站最好的公司学习网站建设的心得体会
  • 赣州做网站公司洛阳东翔科技做的网站
  • wordpress5.0官网深圳网站建设 乐云seo
  • 企业网站建设方案行情企业网站建设服务内容
  • 网站开发 写文档温州seo外包公司