基于深度學習的時序動作檢測研究
發布時間:2024-07-07 07:04
近年來,隨著全球移動互聯網技術以及數字化設備的快速發展和普及,互聯網上的視頻數據每天都在以驚人的速度增長,依靠人工的方式處理如此海量的視頻數據并不現實,基于深度學習的時序動作檢測研究引起了廣大研究者們的興趣,已經成為了目前智能視頻分析領域中的研究熱點。該研究涉及計算機視覺、圖像處理、視頻分析、目標檢測等諸多研究領域,具有重要的科學意義,可以廣泛應用于智能安防、機器人視覺、虛擬現實、視頻監控、人機交互等多個領域,具有良好的應用前景。時序動作檢測是給定一段未裁剪的視頻,實現視頻中動作片段的檢測,包括開始時間、結束時間和動作類別,是智能視頻分析領域中的研究熱點之一。基于手工特征提取的傳統方法對于復雜多變的動作類型魯棒性較差,基于深度學習的方法可以有效地學習到不同動作之間的差異,在視頻動作分析領域已取得了大量的研究成果。然而時序動作檢測的性能嚴重依賴于目標動作的時序提議效果,有效的時序提議對動作檢測效果起到了決定性的作用,而視頻數據結構復雜、目標動作變化多樣且動作持續時間長短不一等問題,使得時序動作檢測中時序提議方法存在著視頻特征利用不充分、目標動作邊界檢測困難等問題。針對以上所存在的問題,本...
【文章頁數】:58 頁
【學位級別】:碩士
【部分圖文】:
本文編號:4003332
【文章頁數】:58 頁
【學位級別】:碩士
【部分圖文】:
圖2.1卷積操作示例
華中科技大學碩士學位論文轉換為另一個。常用的神經元層由三種類型:卷積層,池化層,以通過一系列隱藏層將輸入圖像轉換為輸出向量。每個隱藏層由一對其輸入應用線性變換,即用于卷積層的卷積和用于全連接層的通常會緊隨一個激活函數,例如ReLU,Sigmoid等非線性函數。和輸出是稱為特征....
圖2.2ReLU函數示意圖
設卷積步長值為S,將每個卷積核滑過輸入特征圖。當S1時跳過S像素,將產生一個空間下采樣的特征圖。最后,設對應填像素的數為P。通常我們使用它來保證輸入特征圖的空間大小,因度和高度是相同的。入特征圖的空間大小為WWD。則輸出特征圖的大小為MMW....
圖2.4FasterR-CNN網絡結構簡圖
圖2.4FasterR-CNN網絡結構簡圖[75]RPN被放置在最后的共享卷積層conv5之后,并在特征圖上滑動以確定該區否為目標。值得注意的是,RPN網絡與目標檢測層是共享的。具體來說,圖像入網絡,在經過conv5層的卷積操作之后,特征圖被傳到RPN網絡....
圖3.1特征提取采樣示意圖
和內存容量的問題,整個視頻無法直接輸入網絡。因此,需要對視頻進行一定的處理,在獲得準確有效的特征圖的前提下,盡量減小內存的占用。首先,需要確定的是采樣的方式。設現有視頻V,以25fps/s的幀率將視頻拆分為圖像,拆分后的總幀數為T,則有1={f}TttV,ft代表視....
本文編號:4003332
本文鏈接:http://www.malleg.cn/kejilunwen/zidonghuakongzhilunwen/4003332.html
上一篇:基于深度學習的植物葉片識別研究與實現
下一篇:沒有了
下一篇:沒有了

