StubbornHuang Blog|镌刻我的足迹-第 28 页

移动端Android/ios深度学习模型部署框架总结

本文对在移动端深度模型部署时目前常用的框架进行粗略总结。 1 NCNN Github：https://github.com/Tencent/ncnn 企业：腾讯 NCNN是一个为手机端极致优化的高性能神经网络前向计算框架。 ncnn 从设计之初深刻考虑手机端的部署和使用。无第三方依赖，跨平台，手机…

StubbornHuang
模型部署
2023-03-21
5,193
0

OnnxRuntime – 模型部署笔记2，在Visual Studio中配置Onnx Rumtime C++开发环境

Onnx Runtime模型部署笔记系列： Onnx Runtime – 模型部署笔记1，Onnx Runtime简介 Onnx Runtime – 模型部署笔记2，在Visual Studio中配置Onnx Rumtime C++开发环境 1 下载Onnx Runtime Onnx Runtime…

StubbornHuang
OnnxRuntime
2023-03-20
3,889
0

OnnxRuntime – 模型部署笔记1，OnnxRuntime简介

OnnxRuntime模型部署笔记系列： Onnx Runtime – 模型部署笔记1，Onnx Runtime简介 Onnx Runtime – 模型部署笔记2，在Visual Studio中配置Onnx Rumtime C++开发环境 1 Onnx Runtime Onnx Runtime 官网…

StubbornHuang
OnnxRuntime
2023-03-20
4,296
0

深度学习 – 归纳轻量级神经网络（长期更新）

SqueezeNet 论文标题：SqueezeNet: AlexNet-level accuracy with 50x fewer parameters and< 0.5 MB model size 论文： Iandola F N, Han S, Moskewicz M W, et al. S…

StubbornHuang
深度学习
2023-03-17
1,201
0

深度学习 – 在大数据集下，内存容量与磁盘IO速度影响模型训练速度的问题

1 模型训练时出现的问题内存容量和磁盘IO速度影响GPU利用率，进而影响模型训练速度如果要想在模型训练时利用GPU，提高GPU的利用率，不受限于IO瓶颈，一般常用的方式是：数据预加载，将所有数据都预加载到内存中，内存的读写速度很快，从内存传递数据到GPU速度也很快数据预先离线处理，然后存储在…

StubbornHuang
深度学习
2023-03-16
2,040
0

并发与并行的概念和区别

1 并发与并行的概念和区别并发对应的英文是concurrency，而并行对应的英文是parallelism。先来看下书面一点的解释，引自链接：并行是指两个或者多个事件在同一时刻发生，而并发是指两个或者多个事件在同一时间间隔发生并行是在不同实体上的多个事件，而并发是在同一实体上的多个事件再来…

StubbornHuang
编程技术
2023-03-09
1,303
0

C++ – 使用cuda api获取本机显卡数量和显卡信息

1 使用cuda api获取本机显卡数量和显卡信息我们可以在C++中结合CUDA API获取本机显卡数量以及每一个显卡的Memory Clock Rate、Memory Bus Width、Peak Memory Bandwidth等信息。使用cudaGetDeviceCount函数返回连接到此…

StubbornHuang
C++
2023-03-08
1,891
0

TensorRT – 基于TensorRT的多线程并发推理方案

1 TensorRT的多线程并发推理方案 TensorRT在对模型推理速度已经有了非常大的提升了，那如果能够基于TensorRT做并行推理，既可以有效降低推理延迟，也能增加服务吞吐量，那岂不是酷毙了？那么能用TensorRT做多线程并发吗？我们看看TensorRT的官方开发者文档怎么说： In …

StubbornHuang
TensorRT
2023-03-06
3,673
3

TensorRT – 计算模型推理时间

1 TensorRT的性能衡量标准使用 TensorRT 进行模型优化工作之前，必须确定应该测量什么。没有衡量标准，就不可能取得可靠的进展或衡量是否取得了成功 Latency 第一个衡量标准是从输入数据经过网络然后输出的时间，这个时间称为延迟(Latency)。在一些项目中，较低的模型推理延迟是非…

StubbornHuang
TensorRT
2023-03-06
1,693
1

TensorRT – Using an engine plan file across different models of devices is not recommended and is likely to affect performance or even cause errors

1 TensorRT加载模型出现警告Using an engine plan file across different models of devices is not recommended and is likely to affect performance or even cause er…

StubbornHuang
TensorRT
2023-03-03
1,642
0

TensorRT – TensorRT was linked against cuBLAS/cuBLAS LT 11.6.1 but loaded cuBLAS/cuBLAS LT 11.5.4错误提示

1 TensorRT was linked against cuBLAS/cuBLAS LT 11.6.1 but loaded cuBLAS/cuBLAS LT 11.5.4 使用TensorRT推理模型时，有时候会看到以下TensorRT自己打出的日志 TensorRT was linked a…

StubbornHuang
TensorRT
2023-03-02
916
0

C++ – Windows/Linux跨平台获取本机CPU核心数

1 在Windows/Linux系统获取本机CPU核心数 1.1 使用Windows和Linux上的系统函数获取cpu的核心数如果需要创建一个使用线程池的服务，那么线程池中的最大工作线程数目最好是少于本机CPU的核心数，这样既能最大化CPU的性能也能避免创建过多线程造成线程调度的开销，保持处理速度…

StubbornHuang
C++
2023-03-01
1,647
0

联系我

资助我们

随机推荐

资源分享 – Game AI Pro 2 – Collected Wisdom of Game AI Professionals 英文PDF下载

资源分享 – 深度学习入门之Pytorch PDF下载

PaddlePaddle – 使用Paddle2Onnx将Paddle模型导出为onnx模型

Seq2Seq模型和Attention机制

资源分享 – Data Structures and Algorithms for Game Developers 英文PDF下载

Pac – 自定义Pac的编写和语法规则

最新评论