当前位置: 首页 > news >正文

网站开发维护承担的法律责任网站建设期的网站案例

网站开发维护承担的法律责任,网站建设期的网站案例,建筑工程公司名字大全集,买了域名怎么做自己的网站文章目录 :one: 算力的常见指标:two: 算力计算:three: 常用链接 🚀 本文主要是聚焦于深度学习领域的 GPU的算力估计,其他类型的硬件设备如CPU可以类比参考。 1️⃣ 算力的常见指标 算力衡量主要与运算速度和精度这两个指标有关。 🌔速度指…

文章目录

    • :one: 算力的常见指标
    • :two: 算力计算
    • :three: 常用链接


🚀 本文主要是聚焦于深度学习领域的 GPU的算力估计,其他类型的硬件设备如CPU可以类比参考。

1️⃣ 算力的常见指标

算力衡量主要与运算速度精度这两个指标有关。

🌔速度指标常有:

指标备注
FLOPSFloat Operations Per Second(默认精度为FP32)
MFLOPS10^6 FLOPS
GFLOPS10^9 FLOPS
TFLOPS10^12 FLOPS
OPSOperations Per Second(默认精度为INT8)
MOPS10^6 OPS
GOPS10^9 OPS
TOPS10^12 OPS
Compute Capability(CUDA 能力)英伟达GPU的一种算力等级(数值不等于TFLOPS)

⭐️精度指标常有:

指标备注
FP64双精度浮点
FP32单精度浮点(FLOPS的默认精度)
FP16半精度浮点
TF32NVIDIA定义的TensorCore的中间计算格式(FP32的整数部分+FP16的小数部分)
BF16用于半精度的矩阵浮点运算,相比于FP16能提高效率
INT88位整型(OPS的默认精度)

在精度换算时,可以近似地根据位数的倍数来计算。
(这个地方不太严谨,如果手头参考资料有限,可以这样估计)

比如一个GPU可以操作1个FP32,在同等条件下,可以近似地认为它可以操作4个INT8,即TFLOPS ≈ \approx 4TOPS

常常算力仅以速度指标来表示,因为此时精度指标设定为默认值(FP32/INT8)。

2️⃣ 算力计算

以GPU为例,估计算力涉及以下这些常见参数

符号单位备注
n c u d a n_{cuda} ncuda1CUDA核心数
f b o o s t f_{boost} fboostHz加速频率(Boost Frequency)
a a a1单核心每时钟周期浮点运算系数(GPU常设为2:乘加运算)
C C CFLOPS浮点算力

❤️则一个GPU的算力可以按照如下公式估计:
C = n c u d a × f b o o s t × a C=n_{cuda}\times f_{boost}\times a C=ncuda×fboost×a

以NVIDIA GeForce RTX 2080 Ti 为例,讲解一下算力计算流程:

查询NVIDIA官网,只给出了RTX 2080 Ti的Compute capalibility等级为7.5,没有以FLOPS/TOPS为单位算力指标。
查询得到 n c u d a = 4352 n_{cuda}=4352 ncuda=4352 f b o o s t = 1.64 × 1 0 9 f_{boost}=1.64\times10^9 fboost=1.64×109,进而进行如下计算(以FLOPS为单位):
C = 4352 × ( 1.64 × 1 0 9 ) × 2 = 1.4275 × 1 0 13 C=4352\times(1.64\times10^9)\times2=1.4275\times 10^{13} C=4352×(1.64×109)×2=1.4275×1013
折算为以TFLOPS(FP32)为单位:
C T F = C / 1 0 12 = 14.275 C_{TF}=C/10^{12}=14.275 CTF=C/1012=14.275
理论计算结果与在TECHPOWERUP查询的RTX 2080 Ti算力13.45 TFLOPS较为接近。
\newline
而折算为以TOPS(INT8)为单位:
C T = C T F × 4 = 57.1 C_{T}=C_{TF}\times 4=57.1 CT=CTF×4=57.1
更进一步地,如果手头上有一台设备的算力为6 TOPS,并已知某一深度学习算法在RTX 2080 Ti上的运行速度为80帧,则可以估计出同样的算法在本设备的帧率:
F P S = 80 × 6 57.1 = 8.4 FPS=80\times\frac{6}{57.1}=8.4 FPS=80×57.16=8.4

3️⃣ 常用链接

  • TECHPOWERUP-GPU主页,比较公认的第三方技术参数查询点
  • NVIDIA GeForce GPU 技术参数官网
http://www.yayakq.cn/news/387412/

相关文章:

  • 线下推广app赚佣金seo推广淘客
  • win2008怎么做网站wordpress负载均衡上传附件
  • 做网站需要用到的符号语言中国建筑装饰百强排名
  • 二级域名网站建设中国交通建设网站
  • 烟台专业做网站呼和浩特做网站的地方
  • 网站等级保护必须做吗基于jsp网站开发开题报告
  • 厨具网站模板营销课程培训视频
  • 厦门网站建设seowordpress linux 建站教程
  • 网站产品介绍长图哪个软件做的复兴区建设局网站
  • 还有什么类型的网站ppt模板下载简约
  • 怎么做游戏充值代理网站静态网站需要数据库吗
  • 网站域名怎么写合肥建站
  • oracle自带网站开发桂林象鼻山公园
  • 网站服务器租赁多少钱这是我自己做的网站吗
  • 桂林做旅游网站失败的网站培训总结怎么写
  • 景区网站建设策划案番禺做网站价格
  • 怎么在网站做视频接口浙江怎么制作网站
  • iis网站连接数据库失败龙岗 网站建设
  • php网站开发做什么wordpress 去掉技术支持
  • 北京平台网站建设多少钱珠海生活网
  • 自己做网站能赚钱企业官方网站建设运营方案
  • 做几个网站好上饶做网站最好的公司
  • 阿里巴巴自助建站的一般流程百度怎么做自己的网页
  • 电商网站如何避免客户信息泄露网站建设js
  • 公司做网站提供资料做网站的模板
  • wordpress做阿里巴巴国际站推广费用一般多少
  • 忻州做网站公司wordpress如何免费导入音频
  • 网络网站排名优化两个wordpress文章同步
  • 东兰县建设局网站自己做的简单网站下载
  • 2小时wordpress建站seo好找工作吗