| by msbeta | No comments

机器学习-Mean Shift聚类算法

Mean Shift算法建立在核密度估计(kernel density estimation,KDE)的基础之上,它假设数据点集是从Probability Distribution中采样获取的,Kernel Density Estimation是从数据点集估计Probability Distribution的非参数估计方法。

1.Kernel Density Estimation

给定n个数据点$x_i \in R^d$,使用Radially Symmetric Kernel的Multivariate Kernel Density Estimate的形式如下:

$\hat{f[……]

继续阅读

Read More
| by msbeta | No comments

Google Waymo自动驾驶安全技术报告(二)

Waymo的技术在公开道路上、封闭测试场、仿真器进行了广泛的测试,所以可以保证自动驾驶系统的每一部分在其ODD内都有强大、可靠、安全的处理能力。

Waymo的自动驾驶系统由三个相互独立、严格测试的子系统组成:

1)经过OEM认证的基础车辆系统;

2)传感器和计算机等内部硬件系统;

3)做出所有驾驶决策的自动驾驶软件系统;

这些子系统组合起来构成一个完整的自动驾驶系统,然后我们对其进行进一步的测试和验证。对各个系统的测试和验证可以确保自动驾驶车辆满足我们对系统设定的所有安全要求。

3. Testing and Validation Methods

3.[……]

继续阅读

Read More
| by msbeta | No comments

Real-Time Object Detection-YOLO V1学习笔记

YOLO之前的Object Detection方法主要是通过Region Proposal产生大量的Bounding Box,再用Classifier判断每个Bounding Box是否包含Object,以及Object所属类别的Probability。

YOLO提出了一种新的Object Detection方法,它将Object Detection作为一个空间分离的Bounding Box和对应Class Probability的Regression问题来处理。YOLO使用单个神经网络直接从整幅图像预测Bounding Box和Class Probability,也正因为整个检测过程[……]

继续阅读

Read More
| by msbeta | No comments

Google Waymo自动驾驶安全技术报告(一)

2017年10月Google Waymo向美国交通部提交了一份43页的安全报告,报告中详细说明了Waymo如何装备和训练自动驾驶车辆,从而避免驾驶中的一般和意外情况发生。这份报告对Waymo的自动驾驶技术进行了详细的解读,希望能够对自动驾驶从业者带来一些启发。

完整的waymo自动驾驶安全报告地址:
https://storage.googleapis.com/sdc-prod/v1/safety-report/waymo-safety-report-2017-10.pdf

自动驾驶技术的必要性

2013年在全球有120万人死于交通事故;2016年美国有37461人死于[……]

继续阅读

Read More
| by msbeta | No comments

Faster-RCNN中Anchor锚框生成

Anchor是Faster RCNN中的一个重要的概念,在对图像中的物体进行分类检测之前,先要生成一系列候选的检测框,以便于神经网络进行分类和识别。

1.什么是Anchor

论文中的描述如下:

An anchor is centered at the sliding window in question, and is associated with a scale and aspect ratio.

如图1所示,Anchor是以待检测位置为中心,以指定的大小和高宽比构成一组锚框。
假设Feature Map的宽度为W,宽度为H,在每个待检测的位置生成的锚框数目为K,[……]

继续阅读

Read More
| by msbeta | No comments

目标检测(Object Detection)的评估指标mAP

在Faster RCNN论文中与Fast RCNN的对比效果如下:

官方公布的Fast R-CNN在COCO test-dev数据集上的mAP@.5为35.9%,mAP@[.5,.95]为19.7;

作者在论文中自己实现的Fast R-CNN在COCO test-dev上的mAP@.5为39.3%,mAP@[.5,.95]为19.3%,之所以比官方公布的指标高,作者认为原因在于:

We conjecture that the reason for this gap is mainly
due to the definition of the negative samples[……]

继续阅读

Read More
| by msbeta | No comments

目标检测(Object Detection)-Faster RCNN中的ROI Pooling层

1.什么是ROI Pooling

ROI(Region Of Interest)是从目标图像中识别出的候选识别区域。在Faster RCNN中,候选识别区域(ROIs)是把从RPN(Region Proposal Network)产生的候选识别框映射到Feature Map上得到的。
ROI Pooling的作用就是把大小形状各不相同的候选识别区域归一化为固定尺寸的目标识别区域。

2.ROI Pooling算法

ROI Pooling不同于CNN 网络中的池化层,它通过分块池化的方法得到固定尺寸的输出。
假设ROI Pooling层的输出大小为$w_2 * h_2$,输入候选[……]

继续阅读

Read More
| by msbeta | No comments

计算几何-线段集的所有交点

1.问题描述

给定N条线段,计算这些线段彼此之间的所有交点。

2.Bentley Ottmann Algorithm

2.1 算法的前提假设:
a) 不存在两条线段的终点和交点有相同的x坐标;
b) 不存在多于两条的线段相交于一点;
c) 不存在两条线段完全相互重叠;

2.2 关键的观察结论:
a) 两条相交的线段必然是相邻近的;
b) 两条线段相交后,会交换位置,在上面的线段在经过交点后,会到另一条线段的下面;

扫描线算法的Events
所有线段的终点和交点(由于交点是动态计算出来,所以采用优先级队列记录Events)。

扫描线算法的Active Set
所有与扫描线相[……]

继续阅读

Read More
| by msbeta | No comments

深度残差网络(ResNet)论文学习(附代码实现)

本文结合50层深度残差网络的实现学习何博士的大作-Deep Residual Learning for Image Recognition。理论上,深层网络结构包含了浅层网络结构所有可能的解空间,但是实际网络训练中,随着网络深度的增加,网络的准确度出现饱和,甚至下降的现象,这个现象可以在下图直观看出来:56层的网络比20层网络效果还要差。但是这种退化并不是因为过拟合导致的,因为56层的神经网络的训练误差同样高。[……]

继续阅读

Read More
| by msbeta | No comments

计算几何-道格拉斯普克(Douglas-Peuker)算法

Douglas-Peukcer算法由D.Douglas和T.Peueker于1973年提出,是线状要素抽稀的经典算法。用它处理大量冗余的几何数据点,既可以达到数据量精简的目的,有可以在很大程度上保留几何形状的骨架。

算法的基本思路

将待处理曲线的首末点虚连一条直线,求所有中间点与直线的距离,并找出最大距离值dmax ,用dmax与抽稀阈值threshold相比较:

若dmax < threshold,这条曲线上的中间点全部舍去;

若dmax ≥ threshold,则以该点为界,把曲线分为两部分,对这两部分曲线重复上述过程,直至所有的点都被处理完成。

算[……]

继续阅读

Read More