详细信息:
互联网、物联网和广电网等多源网络产生的海量视频已成为体量最大的大数据。然而,现有技术存在压缩效率不够高、分析识别算法不够鲁棒、采用集中式分析架构导致大规模视频分析任务成本过高,使得实际应用中视频大数据“用不好”:全国 45000 多路电视节目主要采用人工方式进行监播,成本高效率低;大量涌现的网络视频直播缺乏自动监测,乱象频发;城市监控视频仍大量使用“人海战术、事后取证”的应用模式,难以实时响应和综合分析利用。。传统的基于视频编码技术的大数据解决方案将视频进行压缩后再传输到云端,然而视频压缩效率的发展已经难以满足视频大数据对高压缩率的需求。针对数据量巨大、存储分散而价值密度极低所导致的视频大数据汇聚分析难题,本成果首次提出面向视频大数据处理分析的数字视网膜架构,建立了端边云协同的视频大数据处理新范式,突破了数字视网膜架构下超高清视频编码、视频紧凑特征表达、视觉对象识别和精准检索、开集行为识别等一系列关键技术:围绕 “视频大数据高效表达与压缩问题”和“大规模视觉对象和行为的分析与识别问题”,借鉴“人类视网膜同时具有影像编码与特征编码功能”这一特性,建立“特征实时汇聚 + 视频按需调取 + 模型增量更新”的视频大数据处理新范式——数字视网膜架构,在此架构下突破了视频大数据高效编码、特征表达、对象识别、行为分析等一系列关键技术。