论文投稿百科

目标检测最新论文2022

发布时间:2024-07-02 23:07:55

目标检测最新论文2022

34篇。京东探索研究院共34篇论文被CVPR收录,论文涵盖包括目标检测与识别、表征学习、知识蒸馏、图像生成、文本语义识别等领域。

论文原文:

YOLO(you only look once)是继RCNN、faster-RCNN之后,又一里程碑式的目标检测算法。yolo在保持不错的准确度的情况下,解决了当时基于深度学习的检测中的痛点---速度问题。下图是各目标检测系统的检测性能对比:

如果说faster-RCNN是真正实现了完全基于深度学习的端到端的检测,那么yolo则是更进一步,将 目标区域预测 与 目标类别判断 整合到单个神经网络模型中。各检测算法结构见下图:

每个网格要预测B个bounding box,每个bounding box除了要回归自身的位置之外,还要附带预测一个confidence值。这个confidence代表了所预测的box中含有object的置信度和这个box预测的有多准两重信息,其值是这样计算的:

其中如果有object落在一个grid cell里,第一项取1,否则取0。第二项是预测的bounding box和实际的groundtruth之间的IoU值。

每个bounding box要预测(x, y, w, h)和confidence共5个值,每个网格还要预测一个类别信息,记为C类。即SxS个网格,每个网格除了要预测B个bounding box外,还要预测C个categories。输出就是S x S x (5*B+C)的一个tensor。(注意:class信息是针对每个网格的,即一个网格只预测一组类别而不管里面有多少个bounding box,而confidence信息是针对每个bounding box的。)

举例说明: 在PASCAL VOC中,图像输入为448x448,取S=7,B=2,一共有20个类别(C=20)。则输出就是7x7x30的一个tensor。整个网络结构如下图所示:

在test的时候,每个网格预测的class信息和bounding box预测的confidence信息相乘,就得到每个bounding box的class-specific confidence score:

等式左边第一项就是每个网格预测的类别信息,第二三项就是每个bounding box预测的confidence。这个乘积即encode了预测的box属于某一类的概率,也有该box准确度的信息。

得到每个box的class-specific confidence score以后,设置阈值,滤掉得分低的boxes,对保留的boxes进行NMS(非极大值抑制non-maximum suppresssion)处理,就得到最终的检测结果。

1、每个grid因为预测两个bounding box有30维(30=2*5+20),这30维中,8维是回归box的坐标,2维是box的confidence,还有20维是类别。其中坐标的x,y用bounding box相对grid的offset归一化到0-1之间,w,h除以图像的width和height也归一化到0-1之间。

2、对不同大小的box预测中,相比于大box预测偏一点,小box预测偏一点肯定更不能被忍受的。而sum-square error loss中对同样的偏移loss是一样。为了缓和这个问题,作者用了一个比较取巧的办法,就是将box的width和height取平方根代替原本的height和width。这个参考下面的图很容易理解,小box的横轴值较小,发生偏移时,反应到y轴上相比大box要大。其实就是让算法对小box预测的偏移更加敏感。

3、一个网格预测多个box,希望的是每个box predictor专门负责预测某个object。具体做法就是看当前预测的box与ground truth box中哪个IoU大,就负责哪个。这种做法称作box predictor的specialization。

4、损失函数公式见下图:

在实现中,最主要的就是怎么设计损失函数,坐标(x,y,w,h),confidence,classification 让这个三个方面得到很好的平衡。简单的全部采用sum-squared error loss来做这件事会有以下不足:

解决方法:

只有当某个网格中有object的时候才对classification error进行惩罚。只有当某个box predictor对某个ground truth box负责的时候,才会对box的coordinate error进行惩罚,而对哪个ground truth box负责就看其预测值和ground truth box的IoU是不是在那个cell的所有box中最大。

作者采用ImageNet 1000-class 数据集来预训练卷积层。预训练阶段,采用网络中的前20卷积层,外加average-pooling层和全连接层。模型训练了一周,获得了top-5 accuracy为(ImageNet2012 validation set),与GoogleNet模型准确率相当。

然后,将模型转换为检测模型。作者向预训练模型中加入了4个卷积层和两层全连接层,提高了模型输入分辨率(224×224->448×448)。顶层预测类别概率和bounding box协调值。bounding box的宽和高通过输入图像宽和高归一化到0-1区间。顶层采用linear activation,其它层使用 leaky rectified linear。

作者采用sum-squared error为目标函数来优化,增加bounding box loss权重,减少置信度权重,实验中,设定为\lambda _{coord} =5 and\lambda _{noobj}= 。

作者在PASCAL VOC2007和PASCAL VOC2012数据集上进行了训练和测试。训练135轮,batch size为64,动量为,学习速率延迟为。Learning schedule为:第一轮,学习速率从缓慢增加到(因为如果初始为高学习速率,会导致模型发散);保持速率到75轮;然后在后30轮中,下降到;最后30轮,学习速率为。

作者还采用了dropout和 data augmentation来预防过拟合。dropout值为;data augmentation包括:random scaling,translation,adjust exposure和saturation。

YOLO模型相对于之前的物体检测方法有多个优点:

1、 YOLO检测物体非常快

因为没有复杂的检测流程,只需要将图像输入到神经网络就可以得到检测结果,YOLO可以非常快的完成物体检测任务。标准版本的YOLO在Titan X 的 GPU 上能达到45 FPS。更快的Fast YOLO检测速度可以达到155 FPS。而且,YOLO的mAP是之前其他实时物体检测系统的两倍以上。

2、 YOLO可以很好的避免背景错误,产生false positives

不像其他物体检测系统使用了滑窗或region proposal,分类器只能得到图像的局部信息。YOLO在训练和测试时都能够看到一整张图像的信息,因此YOLO在检测物体时能很好的利用上下文信息,从而不容易在背景上预测出错误的物体信息。和Fast-R-CNN相比,YOLO的背景错误不到Fast-R-CNN的一半。

3、 YOLO可以学到物体的泛化特征

当YOLO在自然图像上做训练,在艺术作品上做测试时,YOLO表现的性能比DPM、R-CNN等之前的物体检测系统要好很多。因为YOLO可以学习到高度泛化的特征,从而迁移到其他领域。

尽管YOLO有这些优点,它也有一些缺点:

1、YOLO的物体检测精度低于其他state-of-the-art的物体检测系统。

2、YOLO容易产生物体的定位错误。

3、YOLO对小物体的检测效果不好(尤其是密集的小物体,因为一个栅格只能预测2个物体)。

目标检测2022顶会论文

2022投稿的人工智能顶会论文一周之内有结果。根据查阅相关公开信息显示:一周之内就会出结果会议论文相对于普通的论文来讲,其要求比较低,大部分的会议论文在一周之内就会出结果,如果论文的查重率比较低。

论文原文:

YOLO(you only look once)是继RCNN、faster-RCNN之后,又一里程碑式的目标检测算法。yolo在保持不错的准确度的情况下,解决了当时基于深度学习的检测中的痛点---速度问题。下图是各目标检测系统的检测性能对比:

如果说faster-RCNN是真正实现了完全基于深度学习的端到端的检测,那么yolo则是更进一步,将 目标区域预测 与 目标类别判断 整合到单个神经网络模型中。各检测算法结构见下图:

每个网格要预测B个bounding box,每个bounding box除了要回归自身的位置之外,还要附带预测一个confidence值。这个confidence代表了所预测的box中含有object的置信度和这个box预测的有多准两重信息,其值是这样计算的:

其中如果有object落在一个grid cell里,第一项取1,否则取0。第二项是预测的bounding box和实际的groundtruth之间的IoU值。

每个bounding box要预测(x, y, w, h)和confidence共5个值,每个网格还要预测一个类别信息,记为C类。即SxS个网格,每个网格除了要预测B个bounding box外,还要预测C个categories。输出就是S x S x (5*B+C)的一个tensor。(注意:class信息是针对每个网格的,即一个网格只预测一组类别而不管里面有多少个bounding box,而confidence信息是针对每个bounding box的。)

举例说明: 在PASCAL VOC中,图像输入为448x448,取S=7,B=2,一共有20个类别(C=20)。则输出就是7x7x30的一个tensor。整个网络结构如下图所示:

在test的时候,每个网格预测的class信息和bounding box预测的confidence信息相乘,就得到每个bounding box的class-specific confidence score:

等式左边第一项就是每个网格预测的类别信息,第二三项就是每个bounding box预测的confidence。这个乘积即encode了预测的box属于某一类的概率,也有该box准确度的信息。

得到每个box的class-specific confidence score以后,设置阈值,滤掉得分低的boxes,对保留的boxes进行NMS(非极大值抑制non-maximum suppresssion)处理,就得到最终的检测结果。

1、每个grid因为预测两个bounding box有30维(30=2*5+20),这30维中,8维是回归box的坐标,2维是box的confidence,还有20维是类别。其中坐标的x,y用bounding box相对grid的offset归一化到0-1之间,w,h除以图像的width和height也归一化到0-1之间。

2、对不同大小的box预测中,相比于大box预测偏一点,小box预测偏一点肯定更不能被忍受的。而sum-square error loss中对同样的偏移loss是一样。为了缓和这个问题,作者用了一个比较取巧的办法,就是将box的width和height取平方根代替原本的height和width。这个参考下面的图很容易理解,小box的横轴值较小,发生偏移时,反应到y轴上相比大box要大。其实就是让算法对小box预测的偏移更加敏感。

3、一个网格预测多个box,希望的是每个box predictor专门负责预测某个object。具体做法就是看当前预测的box与ground truth box中哪个IoU大,就负责哪个。这种做法称作box predictor的specialization。

4、损失函数公式见下图:

在实现中,最主要的就是怎么设计损失函数,坐标(x,y,w,h),confidence,classification 让这个三个方面得到很好的平衡。简单的全部采用sum-squared error loss来做这件事会有以下不足:

解决方法:

只有当某个网格中有object的时候才对classification error进行惩罚。只有当某个box predictor对某个ground truth box负责的时候,才会对box的coordinate error进行惩罚,而对哪个ground truth box负责就看其预测值和ground truth box的IoU是不是在那个cell的所有box中最大。

作者采用ImageNet 1000-class 数据集来预训练卷积层。预训练阶段,采用网络中的前20卷积层,外加average-pooling层和全连接层。模型训练了一周,获得了top-5 accuracy为(ImageNet2012 validation set),与GoogleNet模型准确率相当。

然后,将模型转换为检测模型。作者向预训练模型中加入了4个卷积层和两层全连接层,提高了模型输入分辨率(224×224->448×448)。顶层预测类别概率和bounding box协调值。bounding box的宽和高通过输入图像宽和高归一化到0-1区间。顶层采用linear activation,其它层使用 leaky rectified linear。

作者采用sum-squared error为目标函数来优化,增加bounding box loss权重,减少置信度权重,实验中,设定为\lambda _{coord} =5 and\lambda _{noobj}= 。

作者在PASCAL VOC2007和PASCAL VOC2012数据集上进行了训练和测试。训练135轮,batch size为64,动量为,学习速率延迟为。Learning schedule为:第一轮,学习速率从缓慢增加到(因为如果初始为高学习速率,会导致模型发散);保持速率到75轮;然后在后30轮中,下降到;最后30轮,学习速率为。

作者还采用了dropout和 data augmentation来预防过拟合。dropout值为;data augmentation包括:random scaling,translation,adjust exposure和saturation。

YOLO模型相对于之前的物体检测方法有多个优点:

1、 YOLO检测物体非常快

因为没有复杂的检测流程,只需要将图像输入到神经网络就可以得到检测结果,YOLO可以非常快的完成物体检测任务。标准版本的YOLO在Titan X 的 GPU 上能达到45 FPS。更快的Fast YOLO检测速度可以达到155 FPS。而且,YOLO的mAP是之前其他实时物体检测系统的两倍以上。

2、 YOLO可以很好的避免背景错误,产生false positives

不像其他物体检测系统使用了滑窗或region proposal,分类器只能得到图像的局部信息。YOLO在训练和测试时都能够看到一整张图像的信息,因此YOLO在检测物体时能很好的利用上下文信息,从而不容易在背景上预测出错误的物体信息。和Fast-R-CNN相比,YOLO的背景错误不到Fast-R-CNN的一半。

3、 YOLO可以学到物体的泛化特征

当YOLO在自然图像上做训练,在艺术作品上做测试时,YOLO表现的性能比DPM、R-CNN等之前的物体检测系统要好很多。因为YOLO可以学习到高度泛化的特征,从而迁移到其他领域。

尽管YOLO有这些优点,它也有一些缺点:

1、YOLO的物体检测精度低于其他state-of-the-art的物体检测系统。

2、YOLO容易产生物体的定位错误。

3、YOLO对小物体的检测效果不好(尤其是密集的小物体,因为一个栅格只能预测2个物体)。

2022最新护理论文题目

护理的话一般来说就是护理一些。特殊的疾病呀,或者是护理老人。或者是护理宝宝,可能论文题目会比较好,写一点吧。

护理方面的论文可以说已经被多少学生写了一遍又一遍,所以现在很少有比较好的题目,如果你想写的话,可以从比较传统的题目中发表出自己新的见解,结合时代的新意,以及现代护理技术的新标准来入手

学术堂整理了十五个好写的护理论文题目供你进行参考:1、协同护理模式对结肠造口患者自我护理能力的干预效果研究2、基于医院的延续性护理对慢性心力衰竭患者自我护理能力及生活质量的影响3、肠造口患者自我管理现状及医院-社区-家庭护理模式构建的研究4、综合护理干预对中青年慢性心力衰竭患者负性情绪及预后的影响5、山东省三级医院护理人力资源现状调查研究6、精神病患者照料家属的护理压力及应对策略研究7、护理硕士研究生临床实践能力提升方案的制定、实施及效果评价8、膜滤对药品和个人护理品的去除特性研究9、安徽某卫生职业技术学院护理系学生无偿献血知识、态度、行为及其相关因素的调查研究10、护理教育研究的文献计量分析11、灾害护理专科护士培训课程核心知识体系的构建12、护理硕士研究生科研能力评价指标的初步研究13、运用ECS评价护理本科生临床综合能力指标体系的研究14、医院志愿者活动对护理本科生评判性思维影响的研究--以某省属医科大学为例15、护生实习前后护理伦理认知现状及培养策略的研究

护理论文哪些题目好写:

参考下(护理学)上的文献,看看别人的题目是怎么写的,你找你自己擅长的领域写就可以了。

护理方面的论文可以说已经被多少学生写了一遍又一遍,所以现在很少有比较好的题目,如果你想写的话,可以从比较传统的题目中发表出自己新的见解,结合时代的新意,以及现代护理技术的新标准来入手

护理的话一般来说就是护理一些。特殊的疾病呀,或者是护理老人。或者是护理宝宝,可能论文题目会比较好,写一点吧。

适合护理专业的论文题目

1、循证护理在预防化疗期白血病患者口腔溃疡中的应用2、宫颈癌根治术后尿潴留的预防性护理3、高血压患者不遵医饮食行为的原因分析和对策4、神经外科危重病人人工气道的护理研究5、脊髓损伤患者膀胱功能的早期康复训练及效果分析6、护理干预对糖尿病遵医行为影响的研究7、医院专职陪护人员压力因素的分析8、腹腔镜异位妊娠手术患者的护理查房9、急诊护理质量管理应用ISO9001标准的实践探讨10、医院供应室护士职业危害与自我防护措施11、新生儿头皮静脉留置针应用问题分析与对策12、护士在护患纠纷中的心理应激与对策

护理学专业毕业论文题目简单一点的有哪些

论文主体。论文的主要组成部分,主要包括选题背景、方案论证、过程论述、结果分析、结论或总结等内容。要求层次清楚,文字简练、通顺,重点突出,(论文)文字数,一般应不少于8000字(或20个页码)。师哥这里有大把的范文能提供。

护理本科毕业论文选题哪个最好写

护理的话,选择一些比较常见的卧床疾病比较好写,但一般都要样本的,没有样本,光是理论,你就得看很多文献才行。

最快的目标检测技术论文

食品快速检验检测技术以其简捷性和便携性两大优势得到了快速发展。 下面是我为大家整理的食品快速检测技术论文,希望你们喜欢。

食品的快速检验检测技术

摘要:食品安全已成为社会关注的焦点问题。文章介绍了目前常用的食品安全快检技术,并展望了其发展方向。

关键词:食品安全 快检 技术综述

引言

食品安全(food safety)是指食品无毒、无害,符合应当有的营养要求,对人体健康不造成任何急性、亚急性或者慢性危害。俗话说“民以食为天”,食品安全关系到人民群众的身体健康和生命安全,关系到社会和谐稳定,而近年来食品安全问题层出不穷,加了吊白块的面粉,有毒的大米,注了水的鸡肉,掺了石蜡的火锅底料,硫酸泡过的荔枝,以及假酒假烟假蜂蜜劣质奶粉充斥着市场,真让老百姓担心起这片“天”。因此,对食品的生产、加工和销售环节实施监测监控势在必行,食品安全分析检测技术应运而生。

传统的食品安全分析检测技术主要是指化学分析法和大型仪器检测法,相对成熟。但它们的操作只能局限于实验室,操作复杂,耗时长,不能满足对食品质量安全实时监督掌控的需求,尤其在突发事件时,快速检验检测技术以其简捷性和便携性两大优势得到了快速发展。

1、食品快速检验检测技术的研究现状

化学速测技术

化学速测技术主要是根据待测成分的某些化学性质,将样品与特定试剂发生水解、氧化、磺酸化或络合等化学反应,通过与标准品的颜色比较或特定波长下的吸光度比较,以获得检测结果,通常也成为化学比色分析法。

利用普通化学原理的速测法主要包括检测试剂和试纸,随着检测仪器的不断发展,国内外均已有与测试剂相配套的微型光电比色计。针对试纸检测的仪器也有报道,如硝酸盐试纸条[1],主要是将硝酸盐还原为亚硝酸盐,在弱酸性条件下与对氨基苯磺酸重氮化后,和N-1-盐酸萘乙二胺偶合形成紫红色染料,试纸变色,插入检测仪读数即可。德国默克公司生产的与试纸联用的光反射仪技术相对成熟,国内尚无商品化仪器问世。

利用生物化学原理的速测法主要应用于微生物的检测,商品化成品以美国3M公司的PerrifilmTM Plate系列微生物测试片为代表,在检测金黄色葡萄球菌时,只需要测试片与确认片配套使用即可。测试片有上下两层薄膜组成,下层的聚乙烯薄膜上印有网格,便于计数,同时覆盖着含有特异性显色物质和抗生素的培养基,若样品中含有金黄色葡萄球菌,无须增菌,直接接种纸片培养24h后便可观察到显示出特殊颜色的菌落;确认片与测试片相似,只是含有不同的特异性显色物质,将有疑似菌落的测试片影印到确认片后,培养1-3h即可观察,不需进行繁琐的生理生化鉴定。而常规的Baird-Parker平板计数法耗时长达78h。

酶抑制速测技术

酶抑制速测技术主要用于食品中农药残留和重金属的快速检测。这些物质可通过键合作用造成酶的化学性质和结构的改变,产生的酶-底物结合体会发生颜色、吸光度或者pH值的变化,通过测定这些变化以达到定性或定量检测的目的。根据检测方式的不同,可分为试纸法、pH计法和光度法。相比而言,试纸法成本低、操作简单,更易于推广。它主要是将酶和底物分别固定在两张试纸片上,当样品中有待测组分时,会对酶产生抑制作用,两张试纸片接触后,酶和底物结合便会发生显著地颜色变化,比较适合农贸市场和超市等一些食品集散地的实时安全监管。由于该方法的检出限和保存性等方面的局限,只适用于初筛检测[2]。

生物传感器速测技术

生物传感器技术是利用生物感应元件的专一性,按照一定的规律将被测量转换成可用信号,使这种信号强度与待测物浓度形成一定的比例关系,具有快速、灵敏、高效的特点,是目前食品安全检测技术的研究热点,广泛应用于食品中农药残留、兽药残留等方面的检测,与传统的离线分析技术相比,它更适应于在复杂的体系内进行快速在线连续监测,在现场快速检测领域有着不可逾越的优势,按照传感器类型又可分为免疫传感器、酶传感器、细胞传感器、组织传感器、微生物传感器等等。

免疫传感器是在抗原抗体结合免疫反应的基础上发展起来的生物传感器。利用压电免疫传感器检测食品中常见肠道细菌时,通过葡萄球菌蛋白A将肠道菌共同抗原的单克隆抗体宝贝在10MHz的石英晶体表面,以大肠菌群为例,响应值可达10-6-10-9。

免疫速测技术

免疫速测是利用抗原抗体的专一、特异性反应建立起来的方法,根据选用的标记物可分为放射免疫检测、酶免疫检测、荧光免疫检测、发光免疫检测、胶体金免疫检测等。酶联免疫吸附检测法是应用较为广泛的一种免疫速测技术。它将酶标记在抗体/抗原分子上,形成酶标抗体/抗原即酶结合物,抗原抗体反应信号放大后,作用于能呈现出颜色的底物上,可通过仪器或肉眼进行辨别。目前,黄曲霉毒素酶联免疫试剂盒已广泛应用于食品检测中。

分子生物学速测技术

聚合酶链式反应(PCR)是近年来分子生物学领域中迅速发展并运用的一种技术,在食品检测中主要用于微生物的检测。它利用是否能从待测样品所提取的DNA序列中扩增出与目标菌种同源性的核酸序列来判定是否为阳性,该方法从富集菌体、提取遗传物质、PCR扩增到电泳、测序鉴定,可控制在24h,而致病菌的传统培养检测至少需要4-5天。

随着研究的逐深入,由PCR技术派生出的实时荧光PCR法、DNA指纹图谱法、免疫捕获PCR法、基因芯片法等也逐步得到了应用。基因芯片技术可以在很小的面积内预置千万个核酸分子的微阵列,利用细菌的共有基因作为靶基因,选用通用引物进行扩增,利用特异性探针检测这些共有基因的独特性碱基,从而区分出不同的细菌微生物。该法特异性强、敏感性高,可实现微生物检测的高通量和并行性检测。

2、食品快速检验检测技术的发展方向

食品安全快检法以其简捷性和便携性两大优势得到了快速发展,但缺点也显而易见,需要完善的地方依然很多:

简单 速检验检测技术往往是由一些非专业技术人员使用,因此,检测方法采样、处理、检测、分析等各个环节简单、易行是该方法的一大发展趋势。

准确 检法前处理简单,势必导致待测样品纯度不高,基体干扰大。因此,在今后方法的研究中,应更多关注与如何避免假阳性结果,尤其是在分子生物学速测法中,增强靶基因的特异性、引物的特异性、排除死菌体造成的假阳性应得到进一步探索。

便携 着微电子技术、智能制造技术、芯片技术的发展,检测仪器应向微型化、集约化、便携化方向发展,以满足更多的现场、实时、动态的检测要求。

经济 测成本的高低直接决定着检测技术能否得到广泛的推广和应用,如何在确保又好又快的检测基础上,尽最大可能的降低成本也是今后的研究方向。

标准化前,我国尚未制定出与食品安全快速检测技术相关的标准和规范,这也阻碍了快检法的推广和应用。随着技术的提高和检测中对快检法的需要,应及时制定出相关标准规范以增强快检结果的认可性和权威性。

参考文献

[1]房彦军,周焕英,杨伟群。试纸-光电检测仪快速测定食品中亚硝酸盐的研究【J】解放军预防医学杂志,2004,22(17):18-21

[2]易良键。食品安全快速检测方法的应用和研究【J】中国信息科技,2012,3:46

点击下页还有更多>>>食品快速检测技术论文

论文: EfficientDet: Scalable and Efficient Object Detection

目前目标检测领域,高精度的模型通常需要很大的参数量和计算量,而轻量级的网络则一般都会牺牲精度。因此,论文希望建立一个可伸缩的高精度且高性能的检测框架。论文基于one-stage的检测网络范式,进行了多种主干网络、特征融合和class/box预测的结构尝试,主要面临两个挑战:

FPN是目前最广泛的多尺度融合方法,最近也有PANet和NAS-FPN一类跨尺度特征融合方法。对于融合不同的特征,最初的方法都只是简单地直接相加,然而由于不同的特征是不同的分辨率,对融合输出特征的共享应该是不相等的。为了解决这一问题,论文提出简单但高效加权的bi-directional feature pyramid network(BiFPN),该方法使用可学习的权重来学习不同特征的重要性,同时反复地进行top-down和bottom-up的多尺度融合

论文认为除了缩放主干网络和输入图片的分辨率,特征网络(feature network)和box/class预测网络的缩放对准确率和性能也是很重要的。作者借鉴EfficientNet,提出针对检测网络的混合缩放方法(compound scaling method),同时对主干网络,特征网络和box/class预测网络的分辨率/深度/宽度进行缩放

最后,论文将EfficientNet作为主干,结合BiFPN和混合缩放,提出新的检测系列EfficientDet,精度高且轻量,COCO上的结果如图1,论文的贡献有以下3点:

定义多尺寸特征 ,论文的目标是找到变化函数 来高效融合不同的特征,输出新特征 。具体地,图2a展示了top-down FPN网络结构,一般FPN只有一层,这里应该为了对比写了repeat形式。FPN获取3-7层的输入 , 代表一个分辨率为 的特征层

top-down FPN操作如上所示, 为上采用或下采样来对齐分辨率, 通常是特征处理的卷积操作

top-down FPN受限于单向的信息流,为了解决这一问题,PANet(图2b)增加了额外的bottom-up路径的融合网络,NAS_FPN(图2c)使用神经架构搜索来获取更好的跨尺度特征网络的拓扑结构,但需要大量资源进行搜索。其中准确率最高的是PANet,但是其需要太多的参数和计算量,为了提高性能,论文对跨尺寸连接做了几点改进:

大多的特征融合方法都将输入特征平等对待,而论文观察到不同分辨率的输入对融合输出的特征的贡献应该是不同的。为了解决这一问题,论文提出在融合时对输入特征添加额外的权重预测,主要有以下方法:

, 是可学习的权重,可以是标量(per-feature),也可以是向量(per-channel),或者是多维tensor(per-pixel)。论文发现标量形式已经足够提高准确率,且不增加计算量,但是由于标量是无限制的,容易造成训练不稳定,因此,要对其进行归一化限制

,利用softmax来归一化所有的权重,但softmax操作会导致GPU性能的下降,后面会详细说明

,Relu保证 , 保证数值稳定。这样,归一化的权重也落在 ,由于没有softmax操作,效率更高,大约加速30%

BiFPN集合了双向跨尺寸的连接和快速归一化融合,level 6的融合操作如上, 为top-down路径的中间特征, 是bottom-up路径的输出特征,其它层的特征也是类似的构造方法。为了进一步提高效率,论文特征融合时采用depthwise spearable convolution,并在每个卷积后面添加batch normalization和activation

EfficientDet的结构如图3所示,基于one-stage检测器的范式,将ImageNet-pretrained的EfficientNet作为主干,BiFPN将主干的3-7层特征作为输入,然后重复进行top-down和bottom-up的双向特征融合,所有层共享class和box网络

之前检测算法的缩放都是针对单一维度的,从EfficientNet得到启发,论文提出检测网络的新混合缩放方法,该方法使用混合因子 来同时缩放主干网络的宽度和深度、BiFPN网络、class/box网络和分辨率。由于缩放的维度过多,EfficientNet使用的网格搜索效率太慢,论文改用heuristic-based的缩放方法来同时缩放网络的所有维度

EfficientDet重复使用EfficientNet的宽度和深度因子,EfficinetNet-B0至EfficientNet-B6

论文以指数形式来缩放BiFPN宽度 (#channels),而以线性形式增加深度 (#layers),因为深度需要限制在较小的数字

box/class预测网络的宽度固定与BiFPN的宽度一致,而用公式2线性增加深度(#layers)

因为BiFPN使用3-7层的特征,因此输入图片的分辨率必需能被 整除,所以使用公式3线性增加分辨率

结合公式1-3和不同的 ,论文提出EfficientDet-D0到EfficientDet-D6,具体参数如Table 1,EfficientDet-D7没有使用 ,而是在D6的基础上增大输入分辨率

模型训练使用momentum=和weight decay=4e-5的SGD优化器,在初始的5%warm up阶段,学习率线性从0增加到,之后使用余弦衰减规律(cosine decay rule)下降,每个卷积后面都添加Batch normalization,batch norm decay=,epsilon=1e-4,梯度使用指数滑动平均,decay=,采用 和 的focal loss,bbox的长宽比为 ,32块GPU,batch size=128,D0-D4采用RetinaNet的预处理方法,D5-D7采用NAS-FPN的增强方法

Table 2展示了EfficientDet与其它算法的对比结果,EfficientDet准确率更高且性能更好。在低准确率区域,Efficient-D0跟YOLOv3的相同准确率但是只用了1/28的计算量。而与RetianaNet和Mask-RCNN对比,相同的准确率只使用了1/8参数和1/25的计算量。在高准确率区域,EfficientDet-D7达到了,比NAS-FPN少使用4x参数量和计算量,而anchor也仅使用3x3,非9x9

论文在实际的机器上对模型的推理速度进行了对比,结果如图4所示,EfficientDet在GPU和CPU上分别有和加速

论文对主干网络和BiFPN的具体贡献进行了实验对比,结果表明主干网络和BiFPN都是很重要的。这里要注意的是,第一个模型应该是RetinaNet-R50(640),第二和第三个模型应该是896输入,所以准确率的提升有一部分是这个原因。另外使用BiFPN后模型精简了很多,主要得益于channel的降低,FPN的channel都是256和512的,而BiFPN只使用160维,这里应该没有repeat

Table 4展示了Figure 2中同一网络使用不同跨尺寸连接的准确率和复杂度,BiFPN在准确率和复杂度上都是相当不错的

Table 5展示了不同model size下两种加权方法的对比,在精度损失不大的情况下,论文提出的fast normalized fusion能提升26%-31%的速度

figure 5展示了两种方法在训练时的权重变化过程,fast normalizaed fusion的变化过程与softmax方法十分相似。另外,可以看到权重的变化十分快速,这证明不同的特征的确贡献是不同的,

论文对比了混合缩放方法与其它方法,尽管开始的时候相差不多,但是随着模型的增大,混合精度的作用越来越明显

论文提出BiFPN这一轻量级的跨尺寸FPN以及定制的检测版混合缩放方法,基于这些优化,推出了EfficientDet系列算法,既保持高精度也保持了高性能,EfficientDet-D7达到了SOTA。整体而言,论文的idea基于之前的EfficientNet,创新点可能没有之前那么惊艳,但是从实验来看,论文推出的新检测框架十分实用,期待作者的开源

最新行人检测论文

一、发表期刊论文查重率合格。 发表期刊论文对于需要评定职称的人来说非常重要,在发表论文之前,也需要查重。一般来说,期刊上发表的论文查重率取决于杂志或学报的要求。如果你想知道你需要发表期刊的查重率,你可以查看杂志上发表论文的查重规定。如果没有,请参考以下查重范围值: 1.普通(省级或国家级)期刊的查重率在25%-30%之间。 2.核心期刊的查重率一般应控制在5%-10%以内。 二、期刊论文查重软件有哪些? 很多作者在提交论文到杂志或学报之前都会主动查重论文,但面对复杂的查重软件,作者通常会感到困惑,不知道杂志或学报用什么查重软件来检查论文的重复率。 一般来说,杂志和学报发表的论文都需要通过内容查重系统检测,期刊内部检测系统主要分为科技期刊学术不端文献检测系统(AMLC)和社会科学期刊学术不端文献检测系统(SMLC),涵盖的数据库和收录的文章有很大的不同。 如果使用这两种查重系统进行检测,作者必须根据自己的文章是科技期刊还是社会科学期刊,然后选择合适的论文查重系统来检测要发表的论文。 paperfree 和papertime ,由于价格优势,也有很多人用来检测他们的论文初稿和中稿。但需要提醒大家的是,在提交之前,一定要及时了解杂志或学报使用什么样的论文检测系统。最终定稿时,一定要用杂志规定的系统进行检测。

发表论文的查重率是是低于百分之二十,在这个之内就是合格的,但是还是要看具体的要求。

期刊使用查重软件查重论文,大多数用户希望了解查重率的要求。一般来说,如果用户在普通期刊上发表论文,对查重率的要求将在30%以内。例如,核心期刊上发表的论文查重率一般应在15%以内。

期刊上发表的论文的质量必须是一个主要指标。论文上的查重率太高,证明论文上很可能有抄袭,会受到严重打击。那么发表的论文查重率为多少合格?

提交的paperbye论文查重率需要满足要求,才能通过审核,后续才能顺利发表。一般来说,我们的论文提交期刊后,期刊使用查重软件查重论文,用户希望了解查重率的要求。一般来说,如果用户在普通期刊上发表论文,查重率的要求会在30%以内。比如核心期刊上发表的论文查重率一般要保证在15%以内。

论文查重率检查

首先每所学校对论文重复率要求是不同的,都是学校自行决定。部分高校的重复率要求在30%以内,还有的重复率要求在15%以内。学校在准备写论文前基本都会提前下发论文要求。因此我们在写论文前要留意学校的通知内容,就算没有看到也可以问导师。

论文检测系统中的重复内容规则

每所高校都是使用权威的论文查重系统对学生论文进行统一检测。那检测系统对重复内容有何规定?一般论文检测是将上传的论文分为最小单位的句子,数据库文献同样也是被分成所有的句子,对比的时候,假如某段话有连续13字以上相似的就会判定为抄袭,在查重报告里面会被标红。论文查重率是重复部分字符占论文总字数的百分比。一旦查重率没有达到学校的要求,就会被直接退回重新修改,严重的还会导致答辩时间推迟毕业时间推迟。

相关百科
热门百科
首页
发表服务