检测宝宝三围的意义 计算机视觉的定义及其应用

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

计算机视觉(Computer Vision, CV)是一门研究如何让计算机达到人类那样“看”的学科。更准确点说,它是利用摄像机和电脑代替人眼使得计算机拥有类似于人类的那种对目标进行分割、分类、识别、跟踪、判别决策的功能。作为一个新兴学科,计算机视觉是通过对相关的理论和技术进行研究,从而试图建立从图像或多维数据中获取“信息”的人工智能系统。

它是一门综合性的科学技术,主要包括计算机科学与工程、信号处理、物理学、应用数学与统计、神经生理学和认知科学等。

目前,计算机视觉技术已经应用在制造业、工业检验、文档分析、医疗诊断、军事目标跟踪、自主导航等系统当中。

(10)根据车辆前方的摄像头成像来判断前方车辆与当前车辆的距离,从而决定是否需要提速或检测;

上面的例子对于人类了来说是非常简单的,不过,对于计算机来讲,却异常复杂。原因在于人类经过几年甚至十多几十年的学习、认识和了解,已经对现实世界中存在的各种事物有了一个准确完善的分类归纳能力。而计算机则因为没有经过一个长久的、完整的学习和理解过程而显得比人类笨拙许多。试想一下,一个刚出生的婴儿,除了具备吃奶这样一个哺乳动物天生就有的能力外,他能够分清不同的人么?他能够分清不同的颜色、不同的形状、不同的外观、不同的表情么?很显然,不能!而一个三岁的小孩,应该可以基本分清常见的一些亲人了,但是,他却很难分清哪个是电脑哪个是DVD那个是Xbox360;另外,对于一个不具备医学知识的成年人来说,即使给他一张CT图片,他也很难判断这个CT图片的来判断是患病还是健康。究其原因,跟刚才提到的三岁小孩一样,都没有经过一个完整的、系统的、长久的、专业的学习训练过程。同样的道理,让计算机来达到人类所具备的这些能力,也需要一个完善的学习过程。如果完全不对计算机进行训练,那么它就跟刚出生的婴儿没什么区别,什么也不会。如果对他进行一些不完善的学习,那么它的某些视觉判断能力估计也就跟三岁小孩差不多。显然,如果想要让计算机对所“看见”的事物具有同正常成年人相接近的理解能力,就需要大量的样本来对计算机进行完善的、系统的学习和训练。

提出一种新的基于RGB-D数据的人体检测方法,其灵感来自HOG(the Histogram of Oriented Gradients),设计了一个稳定的基于稠密深度数据的人体检测方法,称之为HOD(Histogram of Oriented Depths)。HOD对局部深度变化的方向进行编码,并且依靠的是一个预知深度信息的尺度空间搜索,该搜索使检测过程获得3倍的加速。随后提出了Combo-HOD,一个以一定概率结合了HOD和HOG的RGB-D检测器。通过该方法和几个检测方法的综合比较,包括HOG方法、几个HOD的变形方法、用于3D点云的几何体检测器以及基于Haar的AdaBoost检测器。在最远8米范围内,等错误率为85%的情况下,实验结果显示HOD和Combo-HOD在用kinect传感器获得的室内环境的真实数据集上具有鲁棒性。

1 提出了一个健壮的基于稠密深度信息的人体检测方法HOD(Histogram of Oriented Depths),其灵感来源于Histogram of Oriented Gradients(HOG)和Kinect RGB-D传感器的深度特征;

2 基于一个已训练的尺度到深度的映射和一个新的积分图使用方式进行预知深度信息的尺度空间搜索;

3 提出了Combo-HOD,一个新的利用RGB-D数据进行人体检测的融合方法;

4 实验对比采用了很多方法综合比较,比如HOG方法、几个HOD的变形方法、用于3D点云的几何体检测器以及基于Haar的AdaBoost检测器。

此方法使用一个固定尺寸的检测窗口,窗口被划分为以cell为单位的均匀网格。计算每个cell中像素的梯度方向并统计到一个一维直方图中。直观的表述就是局部外观和形状可以被局部梯度的分布很好地描述,而不需要知道这些梯度在网格中的精确位置。将一组cell聚合成blocks,进行局部对比度归一化。将所有block中的直方图串接起来,构成检测窗口的描述子向量,此描述子向量被用来训练线性SVM分类器。检测人体时,在图像的不同尺度空间滑动检测窗口,计算每个位置和尺度的HOG描述子,然后用学习好的SVM分类器进行分类。

1.基本定义:从单张RGB图像中,精确地识别出多个人体的位置以及骨架上的稀疏的关键点位置。

2.基本任务:给定一张RGB图像,定位图像中人体的关键点位置,并确定其隶属的人体。 按照人的直观视觉理解的话,主要会涉及到以下问题: 关键点及周围的局部特征是什么样的?

关键点之间、人体肢体的空间约束关系是什么样的,以及层级的人体部件关系是什么样的?

基于Deep CNN的方法的试图通过神经网络的拟合能力,建立一种隐式的预测模型来避开上述的显式问题:基于去显式分析人体姿态问题的方法是有的,传统的Pictorial Structure是其中一个较为经典的算法思路,目前也有少数方法用part-based的层级树结构建立人体姿态模型并利用CNN,来进行学习与预测。

当下多数深度CNN回归的方式, 试图用模型强大的拟合能力去回避以上的显式问题,而从大量的图像数据和标签监督信息中用神经网络去学习图像数据与构建的标签信息之间的映射。

3.当前主流研究的基础问题和难点:神经网络结构的设计是个永远(当下)都会伴随的问题(假如深度学习的热潮没有退去的话)

曲线美是衡量女性形体美的重要标志,而女性“三围”(胸围、腰围、臀围)又是构成曲线美的核心因素。输入您的身高,立刻检测出您的三围,并判断你的三围是否标准。

甲胎蛋白的检查首先是可以对一些先天性的疾病做出诊断,由于甲胎蛋白可以经过胎儿尿液进入羊水再经胎盘渗入或经胎血进入母体血液,因此对母亲血液中甲胎蛋白的检查可以判断胎儿的情况,有助于某些先天性疾病的出生前诊断,比如神经管缺损、脊柱裂、无脑儿、唐氏综合征等。

甲胎蛋白检测还是诊断原发性肝癌的重要手段之一,比一些常用的诊断肝癌的方法比如B型超声波、同位素扫描和血液生化测定等更加敏感,需要知道的是,其他消化道肿瘤,如胃癌、胰腺癌、结肠癌、胆管细胞癌等也可导致甲胎蛋白升高,但肝转移癌却极少增高,甲胎蛋白的检查可以帮助诊断这类疾病。

上一篇:什么是初乳,过渡乳,成熟乳和晚乳

下一篇:如何更好选购童鞋