YOLO

模型评价指标

IOU（输出框与真实框的交集/并集）：

TP: T表示True，P表示Positive。True和False表示模型判断的对错，Positive和Negative表示该样本被判断为什么。那么如果一个样被我们判定为好的(Positive)，而且我们判断对了，那么即为一个TP

FP: 同理，FP即为被我们判断为好的(Positive)，但是我们判断错了(即它是错误的样本)，即为FP

TN: 被模型识别为坏的(Negative)，我们判断对了(它确实是坏的)

FN: 被模型识别为坏的(Negative)，但我们判断错了(它实际上是对的)

由此，定义：
$$
Precision\ =\ \frac{TP}{TP\ +\ FP}
$$

$$
Recall\ =\ \frac{TP}{TP\ +\ FN}
$$

在不同的置信度下，计算对应的Precision和Recall，做出图像，计算如下右图的阴影面积

You Only Look Once !

是一个经典的one-stage方法，它将检测问题转化为回归问题，一个CNN搞定问题。

YOLO-v1指定输入图片大小为448*448*3。输入图像经过一系列卷积层，变成7*7*1024的大小。展成一维后，经过两层全连接层，变成1470*1，将其reshape成7*7*30的大小。

将7*7视作二维图像按7*7分后的样子，每个格子有30个值。我们将每个格子看作中心格子，有两种预选框的形状(提前定好的)，这三十个值的前10个值我们视作两组(x, y, w, h, c)，c为置信度，对应两种预选框的参数。后面的20个值为20个分类的概率值。