使用自定义数据集微调Real-ESRGAN图片超分模型
1 为什么要微调Real-ESRGAN模型 Real-ESRGAN github仓库放出的开源模型基本上都是基于开源数据集进行训练的,比如DIV2K、Flickr2K等等,在一些特殊场景下其表现得并不是很好,比如商品图超分、书画超分等等,所以我们需要在自己的数据集上微调Real-ESRGAN的预训练…
- 图片超分
- 2025-03-13
视频稳定模型FuSta环境配置和运行踩坑实录和教程
1 FuSta 视频稳定模型 FuSta是目前视频全帧稳定(保持视频稳定后100% FOV)开源程度最高的开源仓库,包含代码,模型权重,以及Google colab。 主页:https://alex04072000.github.io/FuSta/ 论文链接:https://arxiv.org/ab…
- 视频稳定/视频防抖
- 2025-03-03
视频智能分镜/视频转场检测模型TransNetV2导出为onnx和基于onnxruntime的python推理类
1 TransNetV2是一个视频镜头转场检测模型 TransNetV2是一个视频镜头转场检测模型,模型既保持了较高的准确性,又兼顾了快速的推理速度。 Github:https://github.com/soCzech/TransNetV2 1.1 TransNetV2导出为onnx 转换模型对应的…
- 视频智能分镜
- 2025-03-03
视频显著性检测模型TasedNet在移动端的轻量化设计
1 TasedNet轻量化 TASED-Net 是一种用于视频显着性检测的新型全卷积网络架构。主要思想简单但有效:对 3D 视频特征进行空间解码,同时联合聚合所有时间信息。 github:https://github.com/MichiganCOG/TASED-Net TasedNet官方仓库预训练…
- 模型部署
- 2024-11-25
总结目前已发表的视频显著性检测模型
1 视频显著性检测模型 模型名 论文名 是否开源 Github DeepVS DeepVS: A Deep Learning Based Video Saliency ACLNet Revisiting Video Saliency Prediction in the Deep Learning E…
- 深度学习
- 2024-10-30
将smpl、smplh、smplx模型按不同身体部位以不同的颜色进行渲染
1 SMPL/SMPLH/SMPLX 等模型身体部位划分和骨架信息 1.1 身体部位划分 meshcapade.wiki 详细定义了SMPL、SMPLH、STAR、SMPLX、SUPR模型身体部位分割的信息,其中 SMPL、SMPLH、STAR 模型身体部位分割参考此json:https://mes…
- 深度学习
- 2024-09-30
Windows安装Detectron2流程和踩的坑
1 Windows上安装Detectron2 按以下流程安装 git clone https://github.com/facebookresearch/detectron2.git conda create --name detectron2 python=3.9 conda activate d…
- 深度学习
- 2024-09-26
视频显著性检测模型性能排行榜
1 视频显著性检测模型性能排行榜 (Video Saliency Prediction) 地址:Revisiting Video Saliency Prediction in the Deep Learning Era 分别统计了在DHF1K、Hollywood-2、UCF Sports、DIEM、…
- 深度学习
- 2024-09-09
使用huggingface-cli下载模型
1 安装huggingface cli 使用以下命令安装HuggingFace CLI 注意:huggingface_hub 依赖于 Python>=3.8,此外需要安装 0.17.0 及以上的版本,推荐0.19.0+。 pip install -U huggingface_hub 注意,在Wind…
- AI
- 2024-09-05
基于CDLA版面分析数据集使用Yolov8进行文档版面分析实战
1 yolov8 github:https://github.com/ultralytics/ultralytics YOLOv8是一种先进的目标检测算法,它属于You Only Look Once(YOLO)系列的第八代版本。YOLO系列算法因其速度快、性能好而广受欢迎,尤其适用于实时目标检测任务…
- 目标检测
- 2024-04-30
目标检测数据集标注工具、标注原则与数据集采集原则
1 数据集标注工具 1.1 labelme github:https://github.com/labelmeai/labelme Labelme 是一个图像标注工具,允许用户对图像进行像素级别的标注,包括绘制矩形框来识别和定位图像中的对象,以及对图像进行多边形分割。Labelme 支持导出多种数据…
- 目标检测
- 2024-04-29
从模型训练的train loss和test loss分析模型训练存在的问题
在模型训练时,我们可以观察到两个明显的指标就是train loss和test loss,我们可以通过两者差异分析模型所遇到的问题,一般存在以下的情况: train loss 不断下降,test loss 不断下降,说明网络仍在学习; train loss 不断下降,test loss 趋于不变,说明…
- 深度学习
- 2024-03-26