遥感大数据的检索
遥感大数据的检索
遥感大数据的自动分析是进行遥感大数据信息挖掘、实现遥感观测数据向知识转化的前提,其主要目的是建立统一、紧凑和语义的遥感大数据表示,从而为后续的数据挖掘奠定基础。遥感大数据的自动分析主要包含数据的表达、检索和理解等方面。
遥感大数据的检索
遥感大数据应用正朝着网络化、集成化的方向发展。世界各国也纷纷制定了国家级别空间数据基础设施的计划,旨在通过网络的方式,提供高程、正射影像、水文、行政边界、交通网络、地籍、大地控制以及各种专题数据的访问与下载服务。例如,美国政府建立的空间信息门户,其目标在于建立一站式地理空间站点,以提高政府工作效率以及为大众提供空间信息服务,在一定程度上方便了信息的获取。然而,这种服务模式主要是通过目录搜索的方式提供数据下载,对于数据的处理和分析还远远不够,难以实现对用户需求的按需服务。现有的地理信息和遥感数据服务链还难以对任务需求变化和动态环境变化进行自适应处理,也难以在任务并发情况下进行服务协同优化。
为了从海量遥感大数据中检索出符合用户需求和感兴趣的数据,必须对数据间的相似性和相异性进行度量。在此基础上的高效遥感大数据组织、管理和检索,可以实现从多源多模态数据中快速地检索感兴趣目标,提高遥感大数据的利用效率。对于遥感场景数据的检索目前基本实现了基于影像特征的搜索。然而,在遥感大数据中,同一地物的不同观测数据存在大量的冗余性和相似性,如何利用这些冗余信息,研究图像的相似性或差异性、充分挖掘图像的语义信息,有效提高检索效率是遥感大数据利用的关键问题。仅针对某一类型图像的传统遥感图像检索方法已难以适用于遥感大数据的检索,发展知识驱动的遥感大数据检索方法是有效途径之一(如图1所示), 主要包括:
(1)场景检索服务链的建立:由于遥感图像描述的是地表信息,不存在明确或单一的主题信息,而传感器和成像条件的多样化又导致了遥感图像的多样化,因此,需要在遥感影像语义特征提取、目标识别、场景识别与自主学习的基础上,针对不同类型遥感数据的特点,建立适合数据类型与用于需求的场景检索服务链, 获取不同类型遥感数据所共有的地学知识,为检索多源异质数据提供知识基础。
(2)多源海量复杂场景数据智能检索系统:海量场景数据智能检索系统基于用户给定的待检索信息(文本描述、 场景图像等)对多源海量遥感数据进行检索, 快速返回用户所需的场景。
(3)融入用户感知信息的知识更新方法:相关反馈技术作为一种监督的自主学习方法, 是基于内容的图像检索中提高图像检索性能的重要手段。相关反馈是一种通过用户对检索结果的反馈,把低层次特征与高层语义进行实时关联的机制,其基本思想是:查询时,首先由系统对用户提供查询结果,然后用户反馈给系统其对于结果的满意程度,从而锻炼和提高系统的学习能力以模拟人类的对图像的感知能力,达到高层语义检索的目的。广西善图科技有限公司
图1 遥感大数据场景检索策略