论文投稿百科

行人检测论文源码环境搭建运行

发布时间:2024-07-07 17:24:47

行人检测论文源码环境搭建运行

姓名:王梦妮 学号:20021210873 学院:电子工程学院 【嵌牛导读】本文主要介绍了无人驾驶中所需的行人检测算法 【嵌牛鼻子】无人驾驶 环境感知 计算机视觉 SVM Adaboost算法 【嵌牛提问】无人驾驶中所用到的行人检测算法有哪些 【嵌牛正文】 在同样的交通路况下,无人车通过对自身运动状态及行驶环境信息进行分析,决策出最佳行驶策略和行驶方案代替驾驶员完成一系列驾驶行为,从而降低道路交通事故的发生率。而在无人驾驶中最为重要的技术便是环境感知,而在城市道路上有大量的行人出行,只有准确快速地检测出行人与对其进行跟踪,才能避免车撞人。 计算机视觉是研究赋予机器“人眼”功能的科学,通过多个传感器来获取一定范围内的色彩数据,用算法分析得到的数据从而理解周围环境,这个过程模拟了人眼以及大脑的处理过程,从而赋予机器视觉感知能力。现有的行人检测技术大多都是检测照片中的行人目标,这种照片的拍摄大多是拍摄的静止目标,图像的分辨率和像素点包含的语义信息都及其丰富,对应的算法在这样的图片上往往能取得理想的效果,但是用于无人车的“眼睛”,算法的鲁棒性就表现的非常差。这是因为在实际的道路环境中,摄像头需要搭载的车身上,在行进过程中跟随车以一定的速度移动,并且在实际道路中,行人目标往往是在运动的,由此提取出拍摄视频中的一帧就会出现背景虚化,造成像素点包含的语义信息大量减少,增加了行人检测的难度。 行人检测是计算机视觉领域的一个重要研究课题。在实际生活中,行人大多处于人口密集、背景复杂的城市环境中,并且行人的姿态各不相同,如何将行人从色彩丰富、形状相似的环境中快速准确地提取出来,是行人检测算法的难点。 行人检测算法分为两大类,一类是基于传统图像处理,另一类是基于深度学习的方法。近年来随着计算机计算速度的大幅提升,基于深度学习的方法有着越来越高的检测速度与检测精度,在行人检测领域应用越加广泛。 (一)基于传统图像处理的行人检测算法 使用传统的图像处理方法来做行人检测一般都是由两个步骤组成,第一就是需要手工设计一个合理的特征,第二就是需要设计一个合理的分类器。手工设计特征就是找到一种方法对图像内容进行数学描述,用于后续计算机能够区分该图像区域是什么物体,分类器即是通过提取的特征判断该图像区域属于行人目标还是属于背景。在传统的图像处理领域,手工特征有许多种,比如颜色特征、边缘特征(canny算子和sobel算子)以及基于特征点的描述子(方向梯度直方图)等。 学者们一致认为方向梯度直方图是最适合行人检测的人工特征,其主要原理是对图像的梯度方向直方图进行统计来表征图像。该特征是由Dalal于2005提出的,并与SVM分类器相结合,在行人检测领域取得了前所未有的成功。 传统的行人检测方法首先需要通过提取手工设计特征,再使用提取好的特征来训练分类器,得到一个鲁棒性良好的模型。在行人检测中应用最广泛的分类器就是SVM和Adaboost。SVM分类器就是要找到一个超平面用来分割正负样本,这个超平面的满足条件就是超平面两侧的样本到超平面的距离要最大,即最大化正负样本边界。下图即为线性SVM的示意图。Adaboost分类算法的主要原理不难理解,就是采用不同的方法训练得到一系列的弱分类器,通过级联所有的弱分类器来组成一个具有更高分类精度的强分类器,属于一种迭代算法。原理简单易于理解且有着良好的分类效果,唯一不足就是练多个弱分类器非常耗时。下图为面对一个二分类问题,Adaboost算法实现的细节。               (二)基于深度学习的行人检测算法     近年来,随着硬件计算能力的不断增强,基于卷积神经网络的深度学习飞速发展,在目标检测领域取得了更好的成绩。卷积神经网络不再需要去手动设计特征,只需要将图片输入进网络中,通过多个卷积层的卷积操作,提取出图像的深层语义特征。要想通过深度学习的方法得到一个性能良好的模型,需要大量的样本数据,如果样本过少,就很难学习到泛化能力好的特征,同时在训练时,由于涉及到大量的卷积操作,需要进行大量计算,要求硬件设备具有极高的算力,同时训练起来也很耗时。随着深度学习的飞速发展,越来越多基于深度学习的模型和方法不断被提出,深度学习在目标检测领域会有更加宽广的发展空间。 Ross Girshick团队提出了系列行人检测算法,其中Faster R—CNN 算法通过一个区域提议网络来生成行人候选框,在最后的特征图上滑动来确定候选框。Faster RCNN是首个实现端到端训练的网络,通过一个网络实现了特征提取、候选框生成、边界框回归和分类,这样的框架大大提高了整个网络的检测速度。 He Kaiming等人在2017年提出Mask R—CNN算法,该算法改进了Faster·R—CNN, 在原有的网络结构上增加了一个分支进行语义分割,并用ROI Align替代了ROI Pooling,取得了COCO数据集比赛的冠军。

问题一:在软件测试中如何搭建测试环境? 听您这提问,估计您是没做过测试吧。 什么是测试环境呢?大白话讲就是可以基本准确的将测试用例执行出来,并且结果是有参考意义的那么个环境~ 这前题是你的测试用例是有效的。那撇掉这个不管的情况下,测试环境就不可能是固定的。 有时候,测试环境可能就是一个系统。P如你这个软件,什么都不用管,你只要测能不能装在XP系统上,那此时,一个完整的XP系统就是测试环境。 有时候,你要测一个网站支持不支持多种浏览器。那此时,你的测试环境就是一个安装了多种浏览器的操作系统。 我说的你明白了么?所谓的搭建测试环境(招聘的老有这要求,会搭建环境),就是你能搭出可供测试用的环境。简单了说~是操作系统~复杂了说,是装了特定软件做了特定设置的操作系统~ 问题二:什么是测试环境?如何搭建测试环境? 硬件:包括PC机、笔记本、服务器、各种终端等。例如要测试photoshop软件,是要在PC机上测,还是笔记本上测?是在cpu为酷睿的计算机上测,还是要在炫龙的cpu上测?不同的硬件环境photoshop的处理速度是不一样的。 软件:这里主要指的是软件运行的操作系统。例如测试photoshop,是指windows xp下测试还是在vista下测试?可能会有兼容性问题。软件环境还包括与其他各类软件共存同一系统时的兼容性问题。 一般来说,配置测试环境可遵循下列原则: 1、真实:尽量模拟用户的真实使用环境。这里需要提一点,关于项目软件与产品软件需要不同看待。项目软件由于只针对某一群体的用户,所以测试的环境比较单一。但产品软件针对的是广大群众,所以测试环境比较复杂,要多方面考虑。 2、干净:测试环境中尽量不要安装与被测软件无关的软件。笔者就遇到这种事情,两台机器,针对一个功能,一台测试OK,另一台测试NG,最后根据调查发现,测试OK的机器上安装了客户根本不会安装的VC++开发环境,测试NG的机器正因为没有安装VC,所以测试出了这个bug:软件中缺少必要的动态链接库支持。但这个干净也不是必须的,有时还要刻意去测试某个软件去其他软件并存时的兼容性问题。 问题三:windows怎么搭建测试环境 第1步、下载IIS 1、如果不是很清楚自己的装有Microsoft Windows XP 操作系统的电脑上是否安装了IIS,可以打开IE浏览器,在其地址栏输入并回车,如下图 2 如果能正常打开上面的网页,说明本台电脑已安装了IIS(Internet信息服务)。如果打不开上面的网页,我们就得自己来安装IIS。下面介绍的是如何来安装IIS,如果你已会,完全可以跳过本部分,不会的可以一起来学习一下。 3 2、系统安装光盘中带有IIS的安装程序,但因为现在大部分朋友的电脑都是GHOST系统,所以可以用搜索引擎,下载IIS独立安装包。打开百度,输入“IIS for xp”,找到相关链接网站,下载所需要IIS安装包,如下图 4 3、下载下来的“IIS for XP”安装包一般都为压缩文件,所以使用它前,得先行解压,如下图 5 第2步、安装IIS 1、我们依次打开“开始”→“控制面板”,找到并双击”添加或删除程序“,打开了”添加或删除程序“窗口,如下图 6 2、点击窗口左侧的“添加/删除Windows组件”,如下图 7 3、勾选“Internet信息服务”,并点击“下一步”命令按钮,如下图 8 4、弹出“所需文件”对话框,点击窗口右下角的“浏览”命令按钮,打开“查找”对话框,找到我们刚才从网上下载下来,并解压的IIS FO XP 安装包,找到所需的文件,选择打开后,然后再点“确定”命令按钮,继续IIS的安装,以后安装过程中再需要什么文件的话,找到安装包后,选择文件就可以了。如下图 9 点击“完成”命令按钮,完成IIS的安装,如下图 10 第3步、测试IIS 打开IE 浏览器,在其地址栏输入”“后回车,看到如下图所示的界面,就证明IIS安装成功了,如下图 11 至此,我们已成功安装IIS,IIS的安装讲解完毕,接下来讲解如何测试我们自己的ASP网站。 12 第4步、架设网站 1、我们把自己的ASP网站源代码拷贝到电脑任意一个磁盘分区,比如D盘,如下图 13 2、打开“计算机”管理。在“我的电脑”上右击,选择并点击“管理”,这样我们就打开了“计算机管理”窗口,在该窗口左侧依次点击“服务和应用程序”→“Internet信息服务”→“网站”,然后在“默认网站”上右击,选择“新建”→“虚拟目录”,如下图 14 3、新建虚拟目录。点击“虚拟目录”,打开“虚拟目录创建向导”对话框,点击“下一步”命令按钮,输入虚拟目录“别名”,比如:glxt,然后再点“下一步”命令按钮,通过“浏览”的方式找到网站源代码所在的目录,我们刚才把源代码放在了:D:\bysjASP,如下图 15 4、完成向导。目录选择好后,我们点“下一步”,在“访问权限”对话框,按照下图所示选择就可以了,再点“下一步”命令按钮,出现“已成功完成虚拟目录创建向导”对话框,点击“完成”,完成虚拟目录的创建工作,如下图 16 第5步、测试网站 1、我们在“计算机管理”窗口的“默认网站”下面,找到我们刚才创建成功的虚拟目录“glxt”,然后点击这个虚拟目录,如下图 17 2、在窗口的右侧,找到我们网站的首页:,然后右击这个文件,在弹出的快捷菜单中选择并点击“浏览”,如下图 18 这样我们就打开了我们自己的网站,如果程序没有错误,网站是可以正常打开的;如果程序有错误,则网......>> 问题四:如何搭建一个稳定、可重复的测试环境 innodb_data_home_dir = /longxibendi/mysql/mysql/var/ #innodb_data_file_path = ibdata1:1G:autoextend innodb_data_file_path = ibdata1:500M;ibdata2:2210M:autoextend #表空间 innodb_file_io_threads = 4 #io线程数 问题五:什么是android测试环境搭建 android 官网之前发布过ADT版本的Eclipse,建议使用官网提供的集成开发环境IDE(已上传附件),即官方已经集成好ADT CDT SDK Eclipse,不需要再做任何的配置,直接解压就可以用了。 问题六:面试问到软件测试中怎么搭建测试环境 搭建测试环境实际就是部署环境,比如window+mysql+tomcat部署这些 问题七:软件测试搭建环境具体是怎么做的 这个要看实际工作环境、软件的运行环境来决定的,总体来说从: 1、操作系统:win还是Linux 2、软件架构: B/S还是C/S 3、数据库类型:orcale还是mssql,db2deng 。。。。 问题八:前端的开发调试测试的环境怎么搭建 前端环境搭建系列的目的是把前端团队作为一个整体,如何有效的团队协同开发,第一部分开发环境。 1.代码版本管理 SVN是必不可少了,版本号的规划按照项目三位版本,开发四位版本来部署。比如我要做A项目,版本号为,我第一次提测的代码版本为。每次四位版本按照tag区分。QA按照这个tag部署测试代码,OP则部署线上代码。 如果多个项目同时开发,就开分支。这些需要一个项目管理平台来管理版本。 2. 开发环境 我假设前端team的范畴是HTML CSS JS MVC中的V 和 C。最佳的环境是每个人一个开发环境,代码通过SVN同步别人的代码。但是文件的路径全部都一致。 比如 css的 js的 flash的 后台环境,假设每个后端开发也都有独立的环境,如果和谁联调代码就让他把配置指向你的V C目录进行调试。 QA环境的debug问题,你的环境和QA环境代码部署一致,能够通过host切换静态文件,如css js flash。毕竟前端的大部分问题是前端代码的问题,V 和 C的问题就在自己的环境调试了,静态资源切换到QA的host。 数据问题,最后有个大的造数据平台,通用一份数据库,提供数据增加和修改的接口,这是理想状态,当然这个平台也会很麻烦,实在不行就通过后端的数据操作接口操作数据。 3.编译环境 可恶的前端代码裸上,会有很多问题,大部分是性能问题,还有部分是缓存问题。 所以需要提供编译环境,编译流程放在提测前是安全的,因为会经过QA的质量检测,如果在OP环节应该比较麻烦,编译代码的bug也没人去测。 编译一般解决的事情 1、批量的一些操作,比如版本号 2、代码的合并和压缩 3、代码的优化或者职能替换,比如资源打包 我遇到过的开发状况都不乐观。所以有时间自己搭下试试有多复杂。 一般有公用开发环境,就一台机器一个host,不管主干分支都放在那里,可想又多混乱,还有前端无版本管理软件,人肉维护多个并发版本。 或者有版本管理,开发环境还是多人一个,而且没有host,静态资源引入都是通过模板conf管理路径的。这样的代码不利于资源路径管理,特别是图片,加入png半透明的需要全路径,多个css合并的最好是根目录路径。 各种悲剧,此文到此结束。下篇为开发模式和模块化。

如果要在本地运行php文件的话需要搭载一个本地的服务器,一般都是用Apache+php+Mysql搭建的,windows下有一个很方便的整合到一块的包,wamp,百度一下就有。然后把你的php代码文件拷贝到wamp下的www下就可以查看了

毕业论文源码运行

我有计算机专业图书管理系统毕业论文

代码可以选择在附录中展示一部分,也可以不在论文中展示代码

先使用文本介绍程序实现的思路,然后将代码帖到论文中。如果代码太长,那么无疑是不适合直接复制粘贴的,你可以选择使用伪码来描述一下你程序的实现过程,中间不重要的代码可以使用省略号略去,只写关键逻辑的处理即可。贴代码图片是不可取的,因为图片可能会存在缩放问题,导致字体模糊不清。同时,排版、字体格式,都有可能会收到影响。不知道你的导师和审稿人会怎么看,但是我的论文是因为几个字母格式不对都被打回来改。而且一般不建议贴源代码,源代码一般需要关联的信息太多,篇幅大,直接贴说不明白。如果有贴代码的必要,可以写伪代码,抽象点。

毕业论文格式包括:

题目,摘要,关键词,目录,正文,致谢,参考文献,注释,附录

软件相关专业根据其专业的特殊性,与一般论文有所不同

环境检测行业论文发表

可以尝试下(环境保护前沿)呗

环境监测与评价主要侧重环境监测与管理。就业面向:环保部门及生产企业的环境监测部门从事环境监测、评价及管理工作。 环境监测与治理技术培养具有环境污染治理方面的职业技能和职业素质,能够从事三废处理与处置、环境监测等岗位技术工作的高技能应用型人才。本专业毕业生的就业方向趋于多样化,主要包括:(1)与大气污染、水污染治理及监测有关的企、事业单位,大、中型企、事业单位水处理部门从事除污设备、净化装置的采购、安装、调试、使用、检修、维护等岗位。(2)环保仪器设备的制造、销售等环境服务行业。 (3)环境监测、样品分析和环境管理等。

毕业论文的写作格式、流程与写作技巧 广义来说,凡属论述科学技术内容的作品,都称作科学著述,如原始论著(论文)、简报、综合报告、进展报告、文献综述、述评、专著、汇编、教科书和科普读物等。但其中只有原始论著及其简报是原始的、主要的、第一性的、涉及到创造发明等知识产权的。其它的当然也很重要,但都是加工的、发展的、为特定应用目的和对象而撰写的。下面仅就论文的撰写谈一些体会。在讨论论文写作时也不准备谈有关稿件撰写的各种规定及细则。主要谈的是论文写作中容易发生的问题和经验,是论文写作道德和书写内容的规范问题。论文写作的要求下面按论文的结构顺序依次叙述。(一)论文——题目科学论文都有题目,不能“无题”。论文题目一般20字左右。题目大小应与内容符合,尽量不设副题,不用第1报、第2报之类。论文题目都用直叙口气,不用惊叹号或问号,也不能将科学论文题目写成广告语或新闻报道用语。(二)论文——署名科学论文应该署真名和真实的工作单位。主要体现责任、成果归属并便于后人追踪研究。严格意义上的论文作者是指对选题、论证、查阅文献、方案设计、建立方法、实验操作、整理资料、归纳总结、撰写成文等全过程负责的人,应该是能解答论文的有关问题者。现在往往把参加工作的人全部列上,那就应该以贡献大小依次排列。论文署名应征得本人同意。学术指导人根据实际情况既可以列为论文作者,也可以一般致谢。行政领导人一般不署名。(三)论文——引言 是论文引人入胜之言,很重要,要写好。一段好的论文引言常能使读者明白你这份工作的发展历程和在这一研究方向中的位置。要写出论文立题依据、基础、背景、研究目的。要复习必要的文献、写明问题的发展。文字要简练。(四)论文——材料和方法 按规定如实写出实验对象、器材、动物和试剂及其规格,写出实验方法、指标、判断标准等,写出实验设计、分组、统计方法等。这些按杂志 对论文投稿规定办即可。(五)论文——实验结果 应高度归纳,精心分析,合乎逻辑地铺述。应该去粗取精,去伪存真,但不能因不符合自己的意图而主观取舍,更不能弄虚作假。只有在技术不熟练或仪器不稳定时期所得的数据、在技术故障或操作错误时所得的数据和不符合实验条件时所得的数据才能废弃不用。而且必须在发现问题当时就在原始记录上注明原因,不能在总结处理时因不合常态而任意剔除。废弃这类数据时应将在同样条件下、同一时期的实验数据一并废弃,不能只废弃不合己意者。实验结果的整理应紧扣主题,删繁就简,有些数据不一定适合于这一篇论文,可留作它用,不要硬行拼凑到一篇论文中。论文行文应尽量采用专业术语。能用表的不要用图,可以不用图表的最好不要用图表,以免多占篇幅,增加排版困难。文、表、图互不重复。实验中的偶然现象和意外变故等特殊情况应作必要的交代,不要随意丢弃。(六)论文——讨论 是论文中比较重要,也是比较难写的一部分。应统观全局,抓住主要的有争议问题,从感性认识提高到理性认识进行论说。要对实验结果作出分析、推理,而不要重复叙述实验结果。应着重对国内外相关文献中的结果与观点作出讨论,表明自己的观点,尤其不应回避相对立的观点。 论文的讨论中可以提出假设,提出本题的发展设想,但分寸应该恰当,不能写成“科幻”或“畅想”。(七)论文——结语或结论 论文的结语应写出明确可靠的结果,写出确凿的结论。论文的文字应简洁,可逐条写出。不要用“小结”之类含糊其辞的词。(八)论文——参考义献 这是论文中很重要、也是存在问题较多的一部分。列出论文参考文献的目的是让读者了解论文研究命题的来龙去脉,便于查找,同时也是尊重前人劳动,对自己的工作有准确的定位。因此这里既有技术问题,也有科学道德问题。一篇论文中几乎自始至终都有需要引用参考文献之处。如论文引言中应引上对本题最重要、最直接有关的文献;在方法中应引上所采用或借鉴的方法;在结果中有时要引上与文献对比的资料;在讨论中更应引上与 论文有关的各种支持的或有矛盾的结果或观点等。一切粗心大意,不查文献;故意不引,自鸣创新;贬低别人,抬高自己;避重就轻,故作姿态的做法都是错误的。而这种现象现在在很多论文中还是时有所见的,这应该看成是利研工作者的大忌。其中,不查文献、漏掉重要文献、故意不引别人文献或有意贬损别人工作等错误是比较明显、容易发现的。有些做法则比较隐蔽,如将该引在引言中的,把它引到讨论中。这就将原本是你论文的基础或先导,放到和你论文平起平坐的位置。又如 科研工作总是逐渐深人发展的,你的工作总是在前人工作基石出上发展起来做成的。正确的写法应是,某年某人对本题做出了什么结果,某年某人在这基础上又做出了什么结果,现在我在他们基础上完成了这一研究。这是实事求是的态度,这样表述丝毫无损于你的贡献。有些论文作者却不这样表述,而是说,某年某人做过本题没有做成,某年某人又做过本题仍没有做成,现在我做成了。这就不是实事求是的态度。这样有时可以糊弄一些不明真相的外行人,但只需内行人一戳,纸老虎就破,结果弄巧成拙,丧失信誉。这种现象在现实生活中还是不少见的。(九)论文——致谢 论文的指导者、技术协助者、提供特殊试剂或器材者、经费资助者和提出过重要建议者都属于致谢对象。论文致谢应该是真诚的、实在的,不要庸俗化。不要泛泛地致谢、不要只谢教授不谢旁人。写论文致谢前应征得被致谢者的同意,不能拉大旗作虎皮。(十)论文——摘要或提要:以200字左右简要地概括论文全文。常放篇首。论文摘要需精心撰写,有吸引力。要让读者看了论文摘要就像看到了论文的缩影,或者看了论文摘要就想继续看论文的有关部分。此外,还应给出几个关键词,关键词应写出真正关键的学术词汇,不要硬凑一般性用词。

国内的环境类核心:1.环境科学 2.环境化学 3.中国环境科学 4.环境科学学报 5.上海环境科学 6.环境污染与防治 7.环境工程 8.环境保护 9.中国环境监测 10.重庆环境科学 11.农业环境保护 12.环境科学进展 13.环境科学与技术 14.环境科学研究 15.分析化学 16.城市环境与城市生态 17.环境与健康杂志 is.农村生态环境 19.干旱环境监测 20 .海洋环境科学英文的就更多了,ES&T, Water Research, Chemosphere, Environment International …………vaughn(站内联系TA)呵呵,踏实工作,多看文献,有底子才行。ysqlym(站内联系TA)在ES&T发表确实很难啊!个人感受。weizhang721(站内联系TA)搞水的,还可以水方面的期刊发一下,比如,《给水排水》,《中国给水排水》,《工业给排水》,等等,有好多,总之,好论文不愁没地儿发表,呵呵呵:Dweizhang721(站内联系TA)对了,还有各名校的学报也可以呀xiaoz(站内联系TA)10.重庆环境科学好像几年前就停刊了吧,^_^zhaowu_81(站内联系TA)3.中国环境科学 4.环境科学学报是属于国内环境科学方面的唯一两个一级学报,只要做得好,4.环境科学学报上发表还是比较容易;其他的核心期刊如果你老板是某一刊物的委员,也很好发表;另外,在你做论文实验的所在高校或者科研院所举办的刊物上发表,也相对比较容易。其他刊物上发表有的为了钱,有的是靠关系,就发得快。

毕业论文要运行源代码

必须提交代码。 不可以只交毕业论文不写代码,这个代码是你的毕业论文的重要支撑,如果没有代码也就没有你的论文,更不能证明你的论文中的主要观点的正确性以及可实现性,没有代码可能你的论文中的数据或者论文中的主要观点不正确,还有可能你的论文是瞎编的

一般要求完整的源代码哦,论文里面只需要部分的模块代码就行了演示程序会在答辩时候做建议你参考下键盘论文网,他们很多计算机毕业论文方面的东西,有很多程序和代码其实都是改改就行了,呵呵

行人检测论文

深度嵌入聚类算法研究 基于机器视觉的行人重识别算法的分析与实现 基于动力学模型的属性网络重叠社团发现 基于Spring-Boot框架的一体化运维监控应用的研究与实现 Android系统中基于手写密码与笔迹信息的综合认证技术研究 公交线路准点预测方法研究 基于深度学习的医学图像分割算法研究 基于CNN的高速公路流量预测 服务器安全防护与管理综合平台实现 JavaScript全栈视频播放系统设计与实现快速行人检测算法的研发 基于数据挖掘的药物分子筛选方法研究 基于消息队列的自定义审批流程管理系统设计与实现 基于CRF的初等数学命名实体识别 基于多尺度 CNN的图片语义分割研究 基于图像分割技术的连通区域提取算法的研究 基于背景因素推理的目标关系识别算法研究与实现 基于智能移动设备的非接触式人机交互系统设计与实现 分布式数据库物理查询计划调度优化算法研究 基于遮挡的人脸特征提取算法研究与实现 表情识别应用系统的设计与实现 基于CloudSim的云计算与大数据系统的可靠性仿真研究 多源数据库数据采集系统设计与实现 基于Android和WiFi的无线自组织网络P2P通信系统设计与实现 矩阵分解中的流形结构学习研究 基于无监督的OSN恶意账号检测 深度学习在基于视频的人体动作识别上的应用 用户评分的隐式成分信息的研究 线性规划求解算法的实现与应用 基于freeRTOS的嵌入式操作系统分析与实验设计 基于深度强化学习的信息检索的研究与实现 CPM语言编译链接系统的实现 基于SSD的Pascal Voc数据集目标检测设计与实现 复杂网络关键节点识别算法比较研究 基于对抗网络和知识表示的可视问答 基于FPGA实现存储器及虚拟存储器管理 匿名可信身份共享区块链的设计与实现 基于图像的场景分类算法的设计与实现 恶意APK静态检测技术研究与实现 车辆再识别技术研究

Since we combine region proposals   with CNNs, we call our method R-CNN: Regions with CNN features. 下面先介绍R-CNN和Fast R-CNN中所用到的边框回归方法。 为什么要做Bounding-box regression? 如上图所示,绿色的框为飞机的Ground Truth,红色的框是提取的Region Proposal。那么即便红色的框被分类器识别为飞机,但是由于红色的框定位不准(IoU<),那么这张图相当于没有正确的检测出飞机。如果我们能对红色的框进行微调,使得经过微调后的窗口跟Ground Truth更接近,这样岂不是定位会更准确。确实,Bounding-box regression 就是用来微调这个窗口的。 那么经过何种变换才能从图11中的窗口P变为窗口呢?比较简单的思路就是: 注意:只有当Proposal和Ground Truth比较接近时(线性问题),我们才能将其作为训练样本训练我们的线性回归模型,否则会导致训练的回归模型不work(当Proposal跟GT离得较远,就是复杂的非线性问题了,此时用线性回归建模显然不合理)。这个也是G-CNN: an Iterative Grid Based Object Detector多次迭代实现目标准确定位的关键。 PASCAL VOC为图像识别和分类提供了一整套标准化的优秀的数据集,从2005年到2012年每年都会举行一场图像识别challenge。模型详解 RCNN全程就是Regions with CNN features,从名字也可以看出,RCNN的检测算法是基于传统方法来找出一些可能是物体的区域,再把该区域的尺寸归一化成卷积网络输入的尺寸,最后判断该区域到底是不是物体,是哪个物体,以及对是物体的区域进行进一步回归的微微调整(与深度学习里的finetune去分开,我想表达的就只是对框的位置进行微微调整)学习,使得框的更加准确。        正如上面所说的,RCNN的核心思想就是把图片区域内容送给深度网络,然后提取出深度网络某层的特征,并用这个特征来判断是什么物体(文章把背景也当成一种类别,故如果是判断是不是20个物体时,实际上在实现是判断21个类。),最后再对是物体的区域进行微微调整。实际上文章内容也说过用我之前所说的方法(先学习分类器,然后sliding windows),不过论文用了更直观的方式来说明这样的消耗非常大。它说一个深度网络(alexNet)在conv5上的感受野是195×195,按照我的理解,就是195×195的区域经过五层卷积后,才变成一个点,所以想在conv5上有一个区域性的大小(7×7)则需要原图为227×227,这样的滑窗每次都要对这么大尺度的内容进行计算,消耗可想而知,故论文得下结论,不能用sliding windows的方式去做检测(消耗一次用的不恰当,望各位看官能说个更加准确的词)。不过论文也没有提为什么作者会使用先找可能区域,再进行判断这种方式,只是说他们根据09年的另一篇论文[1],而做的。这也算是大神们与常人不同的积累量吧。中间的深度网络通过ILSVRC分类问题来进行训练,即利用训练图片和训练的分类监督信号,来学习出这个网络,再根据这个网络提取的特征,来训练21个分类器和其相应的回归器,不过分类器和回归器可以放在网络中学习,R-CNN 模型如果要拟人化比喻,那 R-CNN 肯定是 Faster R-CNN 的祖父了。换句话说,R-CNN 是一切的开端。 R-CNN,或称 Region-based Convolutional Neural Network,其工作包含了三个步骤: 1.借助一个可以生成约 2000 个 region proposal 的「选择性搜索」(Selective Search)算法,R-CNN 可以对输入图像进行扫描,来获取可能出现的目标。 2.在每个 region proposal 上都运行一个卷积神经网络(CNN)。 3.将每个 CNN 的输出都输入进:a)一个支持向量机(SVM),以对上述区域进行分类。b)一个线性回归器,以收缩目标周围的边界框,前提是这样的目标存在。 下图具体描绘了上述 3 个步骤:Abstract :                  R-CNN的两个贡献:卷积层的能力很强,可以遍历候选区域达到精确的定位。2.当有标签的数据很少的时候,我们可以事前进行有标签(别的数据集上?)的预训练作为辅助任务,然后对特定的区域进行微调。Introduction:                 这篇文章最开始是在PASCAL VOC上在图像分类和目标检测方面取得了很好的效果。                为了达到很好的效果,文章主要关注了两个问题:1.用深层网络进行目标的定位。2.如何用少量的带标签的检测数据来训练模型                 对于 对一个问题目标定位 ,通常有两个思路可以走:                      1.把定位看成回归问题。效果不是很好。                      2.建立划窗检测器。                 CNN一直采用建立划窗这个方式,但是也只是局限于人脸和行人的检测问题上。               本文使用了五个卷积层(感受野食195*195),在输入时移动步长是32*32。               除此之外,对于定位问题,我们采用区域识别的策略。                在测试阶段,本文的方法产生了大约2000个类别独立的候选区域作为cnn的输入。然           后得到一个修正后的特征向量。然后对于特定的类别用线性SVM分类器分类。我们用简             单的方法(放射图像变形)来将候选区域变成固定大小。                   对于第二个缺少标签数据的问题                     目前有一个思路就是无监督的预训练,然后再加入有监督的微调。                    作为本文最大的贡献之二:在ILSVRC数据集上,我们先进行有监督的预训练。然                  后我们在PASCAL这个小数据集上我们进行特定区域的微调。在我们的实验中,微调                  可以提升8%的mAP。                     本文的贡献;效率高                      仅仅是特别类别的计算是合乎情理的矩阵运算,和非极大值抑制算法。他们共享权                值,并且都是低维特征向量。相比于直接将区域向量作为输入,维数更低。                本文方法处理能实现目标检测,还以为实现语义分割。 2.用R-CNN进行目标检测:             有3个Model:            (1)产生独立的候选区域。            (2)CNN产生固定长度的特征向量。             (3)针对特别类别的一群svm分类器。 模块的设计 候选区域:                   之前有大量的文章都提过如果产生候选区域。本文采用SS(selective search )方法。参考文献【34】+【36】 特征抽取:                 对于每个候选区域,我们采用cnn之后得到4096维向量。 测试阶段的检测               在测试阶段,我们用选择性搜素的方式在测试图片上选取了2000个候选区域,如上图所示的步骤进行。 运行时间分析: 总之当时相比很快。 训练模型 有监督的预训练: 我们使用了大量的ILSVRC的数据集来进行预训练CNN,但是这个标签是图片层的。换句话说没有带边界这样的标签。 特定区域的微调: 我们调整VOC数据集的候选区域的大小,并且我们把ImageNet上午1000类,变成了21类(20个类别+1个背景)。我们把候选区域(和真实区域重叠的)大于的标记为正数,其他的标记为负数。然后用32个正窗口和96个负窗口组成128的mini-batch。 目标类别分类器:         对于区域紧紧的包括着目标的时候,这肯定就是正样本。对于区域里面全部都是背景的,这也十分好区分就是负样本。但是某个区域里面既有目标也有背景的时候,我们不知道如歌标记。本文为了解决这个,提出了一个阈值:IoU覆盖阈值,小于这个阈值,我们标记为负样本。大于这个阈值的我们标记为正样本。我们设置为。这个是一个超参数优化问题。我们使用验证集的方法来优化这个参数。然而这个参数对于我们的最后的性能有很大的帮助。         一旦,我们得到特征向量。因为训练数据太大了。我们采用standard hard negative mining method(标准难分样本的挖掘)。这个策略也是的收敛更快。 Results on PASCAL VOC 201012 . Visualization, ablation, and modes of error . Visualizing learned features      提出了一个非参数的方法,直接展现出我们的网络学习到了什么。这个想法是将一个特定的单元(特性)放在其中使用它,就好像它自己是一个对象检测器正确的。具体方法就是:我们在大量候选区域中,计算每个单元的激励函数。按从最高到最低排序激活输出,执行非最大值抑制,然后显示得分最高的区域。我们的方法让选定的单元“为自己说话”通过显示它所触发的输入。我们避免平均为了看到不同的视觉模式和获得洞察力为单位计算的不变性。我们可以看到来着第五个maxpooling返回的区域。第五层输出的每一个单元的接受野对应输出227*227的其中的195*195的像素区域。所以中心那个点单元有全局的视觉。. Ablation studies 实际上ablation study就是为了研究模型中所提出的一些结构是否有效而设计的实验。比如你提出了某某结构,但是要想确定这个结构是否有利于最终的效果,那就要将去掉该结构的网络与加上该结构的网络所得到的结果进行对比,这就是ablation study。 Performance layer-by-layer, without fine-tuning. 我们只观察了最后三层Performance layer-by-layer, with fine-tuning. 微调之后,fc6和fc7的性能要比pool5大得多。从ImageNet中学习的pool5特性是一般的,而且大部分的提升都是从在它们之上的特定领域的非线性分类器学习中获得的。Comparison to recent feature learning methods.              见上图 . Detection error analysis           CNN的特征比HOG更加有区分。. Bounding box regression 有了对错误的分析,我们加入了一种方法来减少我们的定位错误。我们训练了一个线性的回归模型HOG和SIFT很慢。但是我们可以由此得到启发,利用有顺序等级和多阶段的处理方式,来实现特征的计算。生物启发的等级和移不变性,本文采用。但是缺少有监督学习的算法。使得卷积训练变得有效率。第一层的卷积层可以可视化。 【23】本文采用这个模型,来得到特征向量  ImageNet Large Scale Visual Recognition Competition用了非线性的激励函数,以及dropout的方法。【34】直接将区域向量作为输入,维数较高。IoU覆盖阈值=,而本文设置为,能提高5个百分点。产生候选区域的方式:selective search 也是本文所采取的方式是结合【34】+【36】。【5】产生候选区域的方式为:限制参数最小割bounding box regression HOG-based DPM文章中的对比试验。缩略图概率。[18][26][28]文章中的对比试验。

相关百科
热门百科
首页
发表服务