几何尺寸与公差论坛

 找回密码
 注册
查看: 493|回复: 1

史上最详细yolov5环境配置搭建+配置所需文件

[复制链接]
发表于 2022-12-7 17:09:34 | 显示全部楼层 |阅读模式
史上最详细yolov5环境配置搭建+配置所需文件
https://blog.csdn.net/qq_44697805/article/details/107702939
我之前有cuda环境,直接下完git 代码,创建了个python = 3.7的虚拟环境yolov5,激活后,跳到第四步,conda install pytorch torchvision torchaudio cudatoolkit=11.1 -c pytorch
走到第六步,跑了个detect.py, 缺什么包就按照这里的描述装了个相应版本(一路默认,没选版本,安装完核对了下版本号)https://github.com/ultralytics/y ... er/requirements.txt
上图三个蓝色方框内表示Yolov3的三个基本组件:
(1)CBL:Yolov3网络结构中的最小组件,由Conv+Bn+Leaky_relu激活函数三者组成。
(2)Res unit:借鉴Resnet网络中的残差结构,让网络可以构建的更深。
(3)ResX:由一个CBL和X个残差组件构成,是Yolov3中的大组件。每个Res模块前面的CBL都起到下采样的作用,因此经过5次Res模块后,得到的特征图是608->304->152->76->38->19大小。

https://www.jb51.net/article/189766.htm
sigmoid和tanh是“饱和激活函数”,而ReLU及其变体则是“非饱和激活函数”。使用“非饱和激活函数”的优势在于两点:

1.首先,“非饱和激活函数”能解决所谓的“梯度消失”问题。

2.其次,它能加快收敛速度。
用batch normalization作为正则化、加速收敛和避免过拟合的方法,把BN层和leaky relu层接到每一层卷积层之后。
原文链接:https://blog.csdn.net/nan355655600/article/details/106246625
Focus的作用无非是使图片在下采样的过程中,可以一定程度上减少了模型的计算量,并且不会带来信息丢失,为后续的特征提取保留了更完整的图片下采样信息。
https://blog.csdn.net/weixin_44929077/article/details/109882939
 楼主| 发表于 2023-1-7 09:57:49 | 显示全部楼层
您需要登录后才可以回帖 登录 | 注册

本版积分规则

QQ|Archiver|小黑屋|几何尺寸与公差论坛

GMT+8, 2024-12-22 13:02 , Processed in 0.037575 second(s), 22 queries .

Powered by Discuz! X3.4 Licensed

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表