因果科学
因果关系科学因果关系之梯
第一层——关联:找到变量之间的关联
第二层——干预:如果对X实施…行动,Y会发生什么变化
第三层——反事实:假如当时X没有发生,Y会怎样
因果图概率和因果关系概率角度观点:如果X发生增加了Y发生的概率,那么我们说X导致了Y,记作$P(Y|X)>P(Y)$
但是这种直觉错误在这种概率提高可能是其他因素导致的,比如Y是X的因,或者存在其他变量Z是它们共同的因
因此概率观点只位于因果之梯的第一层
拯救这种观点的正确方法是借助do算子来定义:如果$P(Y|do(X))>P(Y)$,那么我们可以说X导致了Y
do算子表示了干预,这种观点位于因果之梯的第二层
vit
Vit: CV Transformer省流将NLP中的Transformer用到了CV领域
Attention
RCNN
RCNNRCNN
Selective Search(相似合并)得到1k-2k个候选区域(慢,耗时)
将框缩放到227*227,跑卷积(CNN, AlexNet),最后全连接输出特征
将特征输入到SVM中分类
将box输入到全连接进行修正位置
NMS
Fast RCNN
将原图直接卷积得到特征图
ROI按照比例放到特征图上,进行ROI Pooling
SVM -> 全连接层
ROI Pooling: 将每个ROI 均匀分成M*N份,对每一份进行max pooling,从而将ROI大小统一成M*N,送到下一层
Faster RCNN
特征提取部分的网络简称backbone,可替换成VGG16,ResNet等
RPN网络生成预测框,极大提高检验速度
RPN: 包括生成锚框(9种),二分类判断有无物体,位置再进行微调
FPN
as
X2CT
跑通X2CT我们初始的目标就是跑通X2CT,传入一套X光的正侧面,让该网络为我们生成对应的CT 3d模型
test运行命令分析由于我们使用的是正侧两面,即Multi-view,官网给的命令是
1python test.py --ymlpath=./experiment/multiview2500/d2_multiview2500.yml --gpu=0 --dataroot=./data/LIDC-HDF5-256 --dataset=test --tag=d2_multiview2500 --data=LIDC256 --dataset_class=align_ct_xray_views_std --model_class=MultiViewCTGAN --datasetfile=./data/test.txt --resultdir=./multiview --check_point=90 --how_many=3
–ymlpath指定模型参数
–gpu指定0号gpu
–dataroot指定数据源位置(需要改)
–dataset指定我们目标是test
–tag是包含模型的实验名 ...
计算机视觉面试突击
计算机视觉面试突击机器学习vs深度学习机器学习和深度学习是人工智能领域中两个重要的分支。机器学习是一种从数据中学习规律,并用于进行预测或决策的算法技术。深度学习是机器学习中的一种特殊技术,利用深层神经网络对复杂的模式进行建模和分析。
机器学习部分SVM支持向量:样本中距离超平面最近的一些点
SVM 想要的就是使得支持向量到超平面的距离尽可能远,也就是找到最大间隔超平面。
由此,支持向量到超平面的距离为 d,其他点到超平面的距离大于 d。
化简得:
y(Wx+b) >= 1
又因为d=y(Wx+b)/(w的模),可知最大化d就是最大化1/(w的模),即最小化0.5*w的模
软间隔引入松弛变量(每个样本有一个),目标优化函数加上C*(样本们的松弛变量之和),我们通过控制C来决定松弛到什么程度
核函数不用知道具体的升维度转换公式,直接计算出两个低维度数据在高维度的差异值
线性不可分KNN损失函数人脸识别有哪些算法,你对哪个最熟悉,谈一下怎么实现经典检测技术
用大量的人脸和非人脸样本图像进行训练,得到一个解决2类分类问题的分类器
检测时用固定大小 ...
SSD
SSD实现Part0-整体网络模型
VGG Backbone
Extra Layers
Multi-box Layers
Part1-VGG Backbone
SSD首先使用了vgg16作为base网络,但做了一些小修改,即用卷积层替代vgg16原本的FC6,FC7两个全连接层。改动主要如下:
为了能够与在骨干网络之后增加特征提取层,将全连接层fc6和fc7转换为卷积层conv6和conv7,并对fc6和fc7的参数进行二次采样,并移除了fc8层;
将池化层pool5从2×2大小,步长为2更改为3×3大小,步长为1,并使用atrous算法来填充“漏洞”;
由于SSD网络结构移除了VGG16的全连接层,因此防止过拟合的dropout层也被移除;
由于conv4_3与其他特征层相比具有不同的特征比例,因此使用L2归一化将特征图中每个位置的特征比例进行缩放,并在反向传播过程中学习该比例。
先写配置文件:(SSD分为300和512两个版本,这里以300为例)
12345vgg_base = { '300': [64, 64, 'M' ...
OPID
Occluded Prohibited Items Detection: an X-ray Security Inspection Benchmark and De-occlusion Attention Module省流
第一个用于安检的高质量目标检测数据集OPIXray Benchmark,由专业人员人工标注,且测试集分为三个遮挡级别,以更好的了解不同模型的性能。
提出了去遮挡注意模块(DOAM),即插即用。DOAM利用违禁物品的外观信息生成注意力图,有助于改进通用检测器的特征图。
背景以往不同的工作做的基本都是类内遮挡(同一类的物体互相遮挡),而X光安监大部分都是类间遮挡(不同类的物体相互遮挡)。到目前为止,没有针对X光被遮挡的违禁物品检测的数据集。(由于安检的特殊性,目前公布的X-ray数据集非常少)
GDXray包含灰度图像(背景非常简单,与真实环境不符)
SIXray仅包含不到 1% 的图像具有注释的违禁项目
DOAM利用两个子模块,即边缘引导(EG)和材料意识(MA),同时特别强调违禁物品的边缘信息和材料信息。利用上述两个信息生成注意力分布图作为每个输入样本的高质量 ...
杂记
有点耳鸣,仿佛海风吹过生锈的铁丝网
眼下世界里,青草顶天而生,爬虫昼追日,夜逐月
风是透明的河流,雨是冰冷的流星
抽一根烟吧
烟头红火如萤火虫飞在五月的故乡
我在情感上的愚钝就像门窗紧闭的屋子
虽然爱情的脚步在屋前走过去又走过来,我也听到了
可是我觉得那是路过的脚步,那是走向别人的脚步
直到有一天,这个脚步停留在这里
然后门铃响了
期待是一种半清醒半疯狂的燃烧
使焦灼的灵魂幻觉自己生活在未来
plantuml
Plantuml简单上手用例图1234567@startuml aleft to right direction:部门负责人: --> (管理参试人员)@enduml
计网复习-2
物理层2.1 通信基础2.1.1 基本概念
码元:一个固定时长的信号波形表示一位k进制数字,称为k进制码元
信源,信宿,信道:分别是发送数据的源头,接收数据的终点,信号的传输媒介
单向通信:一条信道,无线电广播,电视广播
半双工通信:两条信道,任何一方不能同时发送和接收
全双工通信:两条信道,两个方向的数据传输可以同时进行
码元传输速率(波特率):单位时间内传输的码元数,单位波特
信息传输速率:单位时间内传输的二进制码元个数(比特数),单位比特/秒
带宽:网络的通信线路所能传输数据的能力,表示单位时间内从网络中一点到另一点所能通过的”最高数据率”,单位b/s(Hz)
2.1.2 奈奎斯特定理和香农定理2.1.2.1 奈奎斯特定理
理想低通信道下极限数据传输速率:$2Wlog_2V$。其中W为理想低通信道带宽,V为每个码元离散电平数目。
2.1.2.2 香农定理
香农定理是奈氏准则的推广,它规定了信息传输速率的上限,即信道的最大信息传输速率= $Wlog_2(1\ +\ S/N)$,其中W为信道带宽,S/N为信噪比。信噪比为$10lo ...