OnnxRuntime – 模型部署笔记1,OnnxRuntime简介
OnnxRuntime模型部署笔记系列: Onnx Runtime – 模型部署笔记1,Onnx Runtime简介 Onnx Runtime – 模型部署笔记2,在Visual Studio中配置Onnx Rumtime C++开发环境 1 Onnx Runtime Onnx Runtime 官网…
- OnnxRuntime
- 2023-03-20
深度学习 – 归纳轻量级神经网络(长期更新)
SqueezeNet 论文标题:SqueezeNet: AlexNet-level accuracy with 50x fewer parameters and< 0.5 MB model size 论文: Iandola F N, Han S, Moskewicz M W, et al. S…
- 深度学习
- 2023-03-17
深度学习 – 在大数据集下,内存容量与磁盘IO速度影响模型训练速度的问题
1 模型训练时出现的问题 内存容量和磁盘IO速度影响GPU利用率,进而影响模型训练速度 如果要想在模型训练时利用GPU,提高GPU的利用率,不受限于IO瓶颈,一般常用的方式是: 数据预加载,将所有数据都预加载到内存中,内存的读写速度很快,从内存传递数据到GPU速度也很快 数据预先离线处理,然后存储在…
- 深度学习
- 2023-03-16
并发与并行的概念和区别
1 并发与并行的概念和区别 并发对应的英文是concurrency,而并行对应的英文是parallelism。 先来看下书面一点的解释,引自链接: 并行是指两个或者多个事件在同一时刻发生,而并发是指两个或者多个事件在同一时间间隔发生 并行是在不同实体上的多个事件,而并发是在同一实体上的多个事件 再来…
- 编程技术
- 2023-03-09
C++ – 使用cuda api获取本机显卡数量和显卡信息
1 使用cuda api获取本机显卡数量和显卡信息 我们可以在C++中结合CUDA API获取本机显卡数量以及每一个显卡的Memory Clock Rate、Memory Bus Width、Peak Memory Bandwidth等信息。 使用cudaGetDeviceCount函数返回连接到此…
- C++
- 2023-03-08
TensorRT – 基于TensorRT的多线程并发推理方案
1 TensorRT的多线程并发推理方案 TensorRT在对模型推理速度已经有了非常大的提升了,那如果能够基于TensorRT做并行推理,既可以有效降低推理延迟,也能增加服务吞吐量,那岂不是酷毙了? 那么能用TensorRT做多线程并发吗? 我们看看TensorRT的官方开发者文档怎么说: In …
- TensorRT
- 2023-03-06
TensorRT – 计算模型推理时间
1 TensorRT的性能衡量标准 使用 TensorRT 进行模型优化工作之前,必须确定应该测量什么。没有衡量标准,就不可能取得可靠的进展或衡量是否取得了成功 Latency 第一个衡量标准是从输入数据经过网络然后输出的时间,这个时间称为延迟(Latency)。在一些项目中,较低的模型推理延迟是非…
- TensorRT
- 2023-03-06
TensorRT – Using an engine plan file across different models of devices is not recommended and is likely to affect performance or even cause errors
1 TensorRT加载模型出现警告Using an engine plan file across different models of devices is not recommended and is likely to affect performance or even cause er…
- TensorRT
- 2023-03-03
TensorRT – TensorRT was linked against cuBLAS/cuBLAS LT 11.6.1 but loaded cuBLAS/cuBLAS LT 11.5.4错误提示
1 TensorRT was linked against cuBLAS/cuBLAS LT 11.6.1 but loaded cuBLAS/cuBLAS LT 11.5.4 使用TensorRT推理模型时,有时候会看到以下TensorRT自己打出的日志 TensorRT was linked a…
- TensorRT
- 2023-03-02
C++ – Windows/Linux跨平台获取本机CPU核心数
1 在Windows/Linux系统获取本机CPU核心数 1.1 使用Windows和Linux上的系统函数获取cpu的核心数 如果需要创建一个使用线程池的服务,那么线程池中的最大工作线程数目最好是少于本机CPU的核心数,这样既能最大化CPU的性能也能避免创建过多线程造成线程调度的开销,保持处理速度…
- C++
- 2023-03-01
C++ – Windows/Linux跨平台gbk与utf8字符集编码转换
1 Windows/Linux跨平台gbk与utf8字符集编码转换 在Windows系统上使用系统api,在linux上使用iconv进行gbk与utf8字符集编码转换 我已经将上述功能封装为single header的工具类,具体代码如下 #ifndef _CHARACTERSET_CONVERT…
- C++
- 2023-02-27
C++ – 使用标准库std::use_facet和std::codecvt进行跨平台gbk与utf8字符集转换
1 C++标准库中与字符集转换相关的类 1.1 std::use_local和facet C++中的std::local每个本地化环境对象至少包含了以下的标准facet, std::collate、std::collate std::ctype、 std::ctype std::codecvt<…
- C++
- 2023-02-27
最新评论