算力单位详解
TOPS
TOPS是Tera Operations Per Second的缩写,1TOPS代表处理器每秒钟可进行一万亿次(10^12)操作。
与此对应的还有GOPS(Giga Operations Per Second),MOPS(Million Operation Per Second)算力单位。1GOPS代表处理器每秒钟可进行十亿次(109)操作,1MOPS代表处理器每秒钟可进行一百万次(106)操作。TOPS同GOPS与MOPS可以换算,都代表每秒钟能处理的次数,单位不同而已。
在某些情况下,还使用 TOPS/W 来作为评价处理器运算能力的一个性能指标,TOPS/W 用于度量在1W功耗的情况下,处理器能进行多少万亿次操作。
GOPS
OPS与FLOPS类似,只不过OPS一个是操作次数,FLOPS一个是浮点操作次数。
FLOP与GOPS之间的换算
(FLOP与GOPS之间的换算需要查相关资料,后续查找资料给出)
不确定的看法是OPS是操作数量,FLOPS为浮点操作数量,两者可近似于相等,FLOPS比OPS稍大。
GOPS与FLOPS
1.1 FLOPS
FLOPS定义
是“每秒所执行的浮点运算次数”(floating-point operations per second)的缩写。它常被用来估算电脑的执行效能,尤其是在使用到大量浮点运算的科学计算领域中。正因为FLOPS字尾的那个S,代表秒,而不是复数,所以不能省略掉。
在这里所谓的“浮点运算”,实际上包括了所有涉及小数的运算。这类运算在某类应用软件中常常出现,而它们也比整数运算更花时间。现今大部分的处理器中,都有一个专门用来处理浮点运算的“浮点运算器”(FPU)。也因此FLOPS所量测的,实际上就是FPU的执行速度。而最常用来测量FLOPS的基准程式(benchmark)之一,就是Linpack。
FLOPS换算
一个MFLOPS(megaFLOPS)等于每秒一百万(=10^6)次的浮点运算,
一个GFLOPS(gigaFLOPS)等于每秒十亿(=10^9)次的浮点运算,
一个TFLOPS(teraFLOPS)等于每秒一万亿(=10^12)次的浮点运算,(1太拉)
一个PFLOPS(petaFLOPS)等于每秒一千万亿(=10^15)次的浮点运算,
前标的十进制与二进制
此处存在疑问,从M到G再到T,到底是1024近似为1000,还是采用二进制的乘以1024,还是确实为十进制的1000
倾向于FLOP的前标与内存一样,是以二进制算,每进一级是1024为单位的。
但是10243是1073741824,可以近似为109。所以采用10^3来近似1024问题不大。
赋常见显卡的算力:
1、RTX3090
35.6 TFLOPS
2、tesla T4:
Single Precision Performance (单精度性能FP32)
8.1 TFLOPS
Mixed Precision(混合精度 FP16/FP32)
65 FP16 TFLOPS
INT8 Precision(INT8 精度)
130 INT8 TOPS
3、tesla A100(40G和80G两种):
常见开发板的算力:
1、英伟达Xavier
30TOPS
2、瑞芯微rk3399开发板
3 TOPS
Junsun Chen: 请教下yolo训练时候conf_thres设置多少, 我看里面是0.001 但是只需要测试的时候,是0.25吗
winner069: 请问怎么查看obj conf 和class conf的数值呢
STCSTC1007: FN可以算啊,就是指的漏检的目标,TP是正确的目标,FP是错检的目标,就只有TN算不了
辣大辣条: 目标检测本身的指标并不需要统计FN,因为确实无法统计FN
辣大辣条: 我解释一下,第二张图里有两个框,一个是人脸上的,这个指的人工标注的,即gt,而另一个框在酒瓶上的才是模型预测的,即模型认为这个框是人脸,但是,实际上,这个框和gt并无交集,所以,该模型预测错了,本来是个负样本,预测成了正阳本,所以,是FP