计算机视觉面试突击

机器学习vs深度学习

机器学习和深度学习是人工智能领域中两个重要的分支。机器学习是一种从数据中学习规律,并用于进行预测或决策的算法技术。深度学习是机器学习中的一种特殊技术,利用深层神经网络对复杂的模式进行建模和分析。

机器学习部分

SVM

支持向量:样本中距离超平面最近的一些点

SVM 想要的就是使得支持向量到超平面的距离尽可能远,也就是找到最大间隔超平面。

由此,支持向量到超平面的距离为 d,其他点到超平面的距离大于 d。

化简得:

y(Wx+b) >= 1

又因为d=y(Wx+b)/(w的模),可知最大化d就是最大化1/(w的模),即最小化0.5*w的模

软间隔

引入松弛变量(每个样本有一个),目标优化函数加上C*(样本们的松弛变量之和),我们通过控制C来决定松弛到什么程度

核函数

不用知道具体的升维度转换公式,直接计算出两个低维度数据在高维度的差异值

线性不可分

KNN

损失函数

人脸识别有哪些算法,你对哪个最熟悉,谈一下怎么实现

经典检测技术

  • 用大量的人脸和非人脸样本图像进行训练,得到一个解决2类分类问题的分类器

  • 检测时用固定大小的窗口对图像从上到下、从左到右扫描,判断窗口里的子图像是否为人脸,这称为滑动窗口技术,对图像进行放大或者缩小实现多尺度滑动窗口

  • 非极大值抑制(NMS)

相机内参数和外参数

内参数:与相机特性有关的参数,如焦距,像素大小等

外参数:在世界坐标系中的参数,如相机位置,旋转方向等

介绍canny边缘检测

ROI polling与RPN

说一下NMS和soft-NMS

why NMS

  • 模型不知道要预测多少物体
  • 提高召回率->远高于实际数量的提议
  • 很多都是堆叠在一起的->NMS筛选

NMS流程

  • 按置信度排序
  • 选择最高的加入到最终输出列表
  • 让所有其他框与它计算IOU,>阈值的删除
  • 再选下一个置信度最高的,以此类推,直至全部用完

Soft NMS

不是直接删除,而是降低它的置信度(通过函数f(iou(M, bi))):

有两种格式:线性加权和高斯加权

设两个框的iou是x,线性加权:新置信度=原置信度*(1-x)

高斯加权:新置信度=原置信度*e^(-x^2/sigma)

最后统一将小于某个阈值的框删掉

目标检测

历史

细说SSD

细说YOLO

细说Fast-RCNN

人脸检测识别

计算机基础

堆内存和栈内存的区别

开放部分

简历上的项目自己负责哪一块,实现了哪部分算法,贡献程度有多少

简历中的医学影像项目我主要负责算法部分和少量前端部分,算法部分我使用SSD目标检测算法对X光图像中的一些

百度文化

  • 做自己喜欢且擅长的事情
  • 专注如一
  • 保持学习心态

最近了解的最新论文是什么,用了什么框架算法,达到了哪种效果?

项目中的参数设置,思路和技巧,其中遇到的最大困难,如何解决