双线性插值(Bilinear Interpolation)
线性插值
已知中P1点和P2点,坐标分别为(x1, y1)、(x2, y2),要计算 [x1, x2] 区间内某一位置 x 在直线上的y值:
根据初中的几何知识:
$$
\begin{equation}
\frac{y – y_0}{x – x_0} = \frac{y_1 -[……]
线性插值
已知中P1点和P2点,坐标分别为(x1, y1)、(x2, y2),要计算 [x1, x2] 区间内某一位置 x 在直线上的y值:
根据初中的几何知识:
$$
\begin{equation}
\frac{y – y_0}{x – x_0} = \frac{y_1 -[……]
本文主要讨论Fast R-CNN论文中使用的ROI Pooling(上图中蓝色矩形框部分)。
什么是ROI
ROI是Region of Interest的缩写,是原始图像上的一个Proposed Region。提取ROI的方法有很多,本文不详细讨论。
Fast R-CNN是如何工作[……]
Read More1.tf.multiply()-两个矩阵中对应元素各自相乘
tf.math.multiply()实现将矩阵x和矩阵y逐个元素(element-wise)相乘,返回一个新的矩阵。注意它实现的是元素级别的相乘,也就是两个相乘的数元素各自相乘。
若w为m*1或者1*1的矩阵,x为m*n的矩[……]
Read More本文主要学习在PASCAL VOC2012数据集上训练YOLOv2时的Input Encoding和Output Encoding。
Import PASCAL VOC2012 data
PASCAL VOC2012支持的Object类别如下:
假设PASCAL VOC20[……]
Read More论文链接
《YOLO9000: Better, Faster, Stronger》
https://arxiv.org/abs/1612.08242
YOLO V2
YOLOv1的Detection速度很快,但是精度却不如R-CNN系列方法。
YOLOv2中提出[……]
Read More为什么引入非线性激活函数
如果采用线性激活函数,无论你神经网络有多少层,输出都是输入的线性组合,与没有隐藏层效果相当,这种情况就是最原始的感知机(Perceptron),感知机连最基本的异或问题都无法解决,更别提更复杂的非线性问题,这样的神经网络就没有意义。
常见的非线性激活函数[……]
Read More问题:短期记忆
反向传播(Back Propagation)是一种与最优化方法(比如梯度下降方法)结合、用来训练人工神经网络的常见方法。该方法对网络中所有权重计算损失函数的梯度,然后将梯度反馈给最优化方法,用来更新网络权重以最小化损失函数。
在神经网络中一个典型的问题就是梯度消失(Gra[……]
Read More本文完整代码和数据已经上传到Github.
https://github.com/YoungTimes/GNN/tree/master/GAT
1. GCN的另一个缺陷
GraphSAGE通过采样邻居的策略解决了GCN只能采用Full Patch训练的问题。在GAT中指出了GCN的另外两个[……]
Read MoreMean Shift算法建立在核密度估计(kernel density estimation,KDE)的基础之上,它假设数据点集是从Probability Distribution中采样获取的,Kernel Density Estimation是从数据点集估计Probability Distribu[……]
Read MoreYOLO之前的Object Detection方法主要是通过Region Proposal产生大量的Bounding Box,再用Classifier判断每个Bounding Box是否包含Object,以及Object所属类别的Probability。
YOLO提出了一种新的Object[……]
Read More