全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210759294.0 (22)申请日 2022.06.30 (71)申请人 西安电子科技大 学 地址 710071 陕西省西安市太白南路2号 (72)发明人 郭亮 祁文平 李亚超 熊涛  荆丹 许晴 吕艳 邢孟道  (74)专利代理 机构 西安嘉思特知识产权代理事 务所(普通 合伙) 6123 0 专利代理师 万艳艳 (51)Int.Cl. G06V 20/10(2022.01) G06V 10/764(2022.01) G06V 10/766(2022.01) G06V 10/774(2022.01) G06V 10/80(2022.01)G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 基于深度学习的遥感影像任意方向目标检 测方法 (57)摘要 本发明公开了一种基于深度学习的遥感影 像任意方向目标检测方法, 包括: 获取遥感影像 数据集, 并将其划分为训练集和测试集; 对训练 集进行数据增强并进行标记; 构建具有SAN结构 的深度学习网络模型; 基于构建的网络模型设计 OVAL_IOU损失函数, 并利用训练集对网络模型进 行训练; 利用训练好的网络模型对测试集进行测 试, 得到检测结果; 对检测结果进行后处理, 得到 最终的目标位置信息。 本发明提供的方法克服了 现有技术中虚警率高和漏检率高的问题, 提升了 检测精度和检测效率。 权利要求书2页 说明书9页 附图3页 CN 115115936 A 2022.09.27 CN 115115936 A 1.一种基于深度学习的遥感影 像任意方向目标检测方法, 其特 征在于, 包括: 获取遥感影 像数据集, 并将其划分为训练集和 测试集; 对所述训练集进行 数据增强并进行 标记; 构建具有SAN结构的深度学习网络模型; 基于构建的网络模型设计OVAL_IOU损失函数, 并利用所述训练集对网络模型进行训 练; 利用训练好的网络模型对所述测试集进行测试, 得到检测结果; 对所述检测结果进行后处 理, 得到最终的目标位置信息 。 2.根据权利要求1所述的基于深度学习的遥感影像任意方向目标检测方法, 其特征在 于, 对所述训练集进行 数据增强, 并进行 标记包括: 将所述训练集的数据切割成合 适的尺寸并对其进行 数据增强; 采用OpenCV 表示法对训练集中的目标框进行 标记; 将OpenCV 表示法转 化为长边表示法, 则训练集中的目标框标记为: {xc,yc,w_l,h_l, θ _l}; 其中, (xc,yc)是目标框的中心坐标, w表示x轴顺时针旋转碰到的第一条边, h为相邻的 另一边, w_l>=h_l, θ为旋转经过的角度, θ∈(0 °,90°], θ_l表示x轴顺时针旋转到w_l经过 的角度, θ _l∈(0 °,180°]。 3.根据权利要求1所述的基于深度学习的遥感影像任意方向目标检测方法, 其特征在 于, 构建具有SAN结构的深度学习网络模型包括: 采用darknet53作 为主干特征提取网络搭建深度学习网络框架, 其包括特征提取模块、 SAN模块、 特 征融合模块以及特 征整合模块; 其中, 所述特征提取模块以待检图像作为输入, 经 过特征提取后, 输出 特征图至SAN模块; 所述SAN模块用于对特征提取模块输出的特征图进行特征增强, 并输出增强的特征图 至特征融合模块; 所述特征融合模块用于根据注意力模块输出的特征图, 将语义信 息丰富的深层特征上 采样并与轮廓信息 丰富的浅层特 征进行融合, 得到融合特 征; 所述特征整合模块用于对所述融合特 征进行特征整合, 得到不同尺度的检测结果。 4.根据权利要求3所述的基于深度学习的遥感影像任意方向目标检测方法, 其特征在 于, 所述SAN模块包括CAM模块和S ‑SAM模块, 以从不同角度对特征图进行权重划分, 从而实 现特征增强。 5.根据权利要求1所述的基于深度学习的遥感影像任意方向目标检测方法, 其特征在 于, 所述损失函数为: Loss=Lconf+Lcls+Lattention+Lreg 其中, Lconf表示置信度损失, Lcls表示类别损失, Lattention表示注意力损失, Lreg表示位置 回归损失。 6.根据权利要求5所述的基于深度学习的遥感影像任意方向目标检测方法, 其特征在权 利 要 求 书 1/2 页 2 CN 115115936 A 2于, 所述置信度损失Lconf的计算公式为: 其中, N表示所有预测框的数量; 表示第k个预测框内是否有目标, 有为1, 否则为0; 表示第k个预测框内是否没有目标, 没有为1, 否则为0; pk表示第k个预测框中含有目标 的概率, yk表示第k个预测框中是否有目标的标签值, yk=1表示有目标, yk=0表示没有目 标; BCE为交叉熵损失函数。 7.根据权利要求5所述的基于深度学习的遥感影像任意方向目标检测方法, 其特征在 于, 所述类别损失Lcls的计算公式为: 其中, N表示所有预测框的数量, 为二进制值, 表示第n个预测框 中包含目标, 表示第n个预测框中不包含目标, BCE为交叉熵损失函数, pn(c)表示第n个预测框为 第c类的概 率, tn(c)为对应的标签值。 8.根据权利要求5所述的基于深度学习的遥感影像任意方向目标检测方法, 其特征在 于, 所述注意力损失Lattention的计算公式为: 其中, h,w分别表示特征层 经过S‑SAM模块后前景得分图的高和宽, BCE为交叉熵损失函 数, uij表示第i,j位置像素的前景得分, 表示对应位置的标签值, 当该位置属于前景时 否则 9.根据权利要求5所述的基于深度学习的遥感影像任意方向目标检测方法, 其特征在 于, 所述位置回归损失Lreg的计算公式为: 其中, N表示所有预测框的数量; 为二进制值, 表示第n个预测框中包含目标, 表示第n个预测框 中不包含目标, OVAL_IOU为用椭圆近似计算两个任意方向矩形框 IOU的函数。 10.根据权利要求1所述的基于深度 学习的遥感影像任意方向目标检测方法, 其特征在 于, 对所述测试 结果进行后处 理, 得到目标的位置信息包括: 根据所述检测结果计算每 个网格的置信度值; 根据所述检测结果和锚框位置信息计算预测框; 基于所述置信度值对所述预测框进行筛 选, 以得到最终的目标位置信息 。权 利 要 求 书 2/2 页 3 CN 115115936 A 3

.PDF文档 专利 基于深度学习的遥感影像任意方向目标检测方法

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于深度学习的遥感影像任意方向目标检测方法 第 1 页 专利 基于深度学习的遥感影像任意方向目标检测方法 第 2 页 专利 基于深度学习的遥感影像任意方向目标检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:30:29上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。