计算机视觉面试突击
计算机视觉面试突击
机器学习vs深度学习
机器学习和深度学习是人工智能领域中两个重要的分支。机器学习是一种从数据中学习规律,并用于进行预测或决策的算法技术。深度学习是机器学习中的一种特殊技术,利用深层神经网络对复杂的模式进行建模和分析。
机器学习部分
SVM
支持向量:样本中距离超平面最近的一些点
SVM 想要的就是使得支持向量到超平面的距离尽可能远,也就是找到最大间隔超平面。
由此,支持向量到超平面的距离为 d,其他点到超平面的距离大于 d。
化简得:
y(Wx+b) >= 1
又因为d=y(Wx+b)/(w的模),可知最大化d就是最大化1/(w的模),即最小化0.5*w的模
软间隔
引入松弛变量(每个样本有一个),目标优化函数加上C*(样本们的松弛变量之和),我们通过控制C来决定松弛到什么程度
核函数
不用知道具体的升维度转换公式,直接计算出两个低维度数据在高维度的差异值
线性不可分
KNN
损失函数
人脸识别有哪些算法,你对哪个最熟悉,谈一下怎么实现
经典检测技术
用大量的人脸和非人脸样本图像进行训练,得到一个解决2类分类问题的分类器
检测时用固定大小的窗口对图像从上到下、从左到右扫描,判断窗口里的子图像是否为人脸,这称为滑动窗口技术,对图像进行放大或者缩小实现多尺度滑动窗口
非极大值抑制(NMS)
相机内参数和外参数
内参数:与相机特性有关的参数,如焦距,像素大小等
外参数:在世界坐标系中的参数,如相机位置,旋转方向等
介绍canny边缘检测
ROI polling与RPN
说一下NMS和soft-NMS
why NMS
- 模型不知道要预测多少物体
- 提高召回率->远高于实际数量的提议
- 很多都是堆叠在一起的->NMS筛选
NMS流程
- 按置信度排序
- 选择最高的加入到最终输出列表
- 让所有其他框与它计算IOU,>阈值的删除
- 再选下一个置信度最高的,以此类推,直至全部用完
Soft NMS
不是直接删除,而是降低它的置信度(通过函数f(iou(M, bi))):
有两种格式:线性加权和高斯加权
设两个框的iou是x,线性加权:新置信度=原置信度*(1-x)
高斯加权:新置信度=原置信度*e^(-x^2/sigma)
最后统一将小于某个阈值的框删掉
目标检测
历史
细说SSD
细说YOLO
细说Fast-RCNN
人脸检测识别
计算机基础
堆内存和栈内存的区别
开放部分
简历上的项目自己负责哪一块,实现了哪部分算法,贡献程度有多少
简历中的医学影像项目我主要负责算法部分和少量前端部分,算法部分我使用SSD目标检测算法对X光图像中的一些
百度文化
- 做自己喜欢且擅长的事情
- 专注如一
- 保持学习心态
最近了解的最新论文是什么,用了什么框架算法,达到了哪种效果?
项目中的参数设置,思路和技巧,其中遇到的最大困难,如何解决
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 Ando's blog!