在”目標導向前景物件影像抽取技術”這篇技術報告中,我看到了一個令我印象非常深刻的東西,就是關於背景的定義,何謂背景?如文章所說的我們的直覺就是「一段時間固定不動的物體」,那麼相對於前景就是「移動或短暫出現的物體」。"但在現實環境中,很多物體應該是屬於背景的一部分,但是卻是在移動的,例如:隨風搖曳的樹枝;而一個會動的物體(如人和車),如果在視訊畫面中一段時間都未移動,應該將該物體視為背景的一部分",所以依據以上想法就產生了相對於背景的前景新定義,那就是「移動或短暫出現且有明顯分析意義的物體」,如此一來,我們對於影像中什麼樣的東西是我們必須追蹤、focus on的人、物都很明白了,這樣我們才能對有監視做有效率的監控。
另外,看了首頁「人員自動追蹤技術」中的"晶片與ptz攝影機的整合",也就是錄製逢甲大學停車場的那一段,ptz攝影機會對影像中移動的人、物進行追蹤,這時我思考到一個問題,用這個攝影機錄製一個人經過的情況時是還好,攝影機能很準確的追蹤目標物直到目標物離去,但我發現當影片中一群人走過時,它會focus最後面的目標物,這麼一來前面的目標物也許在做什麼事情,就無法掌控了,再來,如果在錄製一個目標物的期間,有另一個移動物進入畫面,又該怎麼辦呢?或許是它可以利用其他不同種功能的攝影機搭配應用or遇到這種多個目標物的情況時,它可以轉換全畫面模式之類的,當然這也只是我在猜想而已。
還有在看完首頁"影像視訊融合技術於監控系統之應用"的影片之後,這真的是太震懾了,首先,片頭畫面從Googl earth藍色地球的鏡頭開始一直聚焦…一直聚焦...一直聚焦到台灣交通大學大概十公尺的上空上,你不但可以轉動、拉近,更可以清清楚楚看到人們的在畫面中移動,這未免也真是太太太扯了,這也不難想像為什麼Google earth會牽扯到關於隱私權的問題。
還有首頁的”系統整合影片展示”也是相當厲害,利用多重相機、ptz攝影機、PDA、還有一個伺服器就可以對大樓作智慧型的監控,影片中分成室外環境監控跟室內手勢分析,室外不但可以對可疑車牌進行追蹤,還可以判斷不屬於本大樓之人員比對資料庫進行人臉辨識,異常行為分析,人物移動到下一個畫面的平順轉場技術,還有室內的手勢分析,我想都是相當實用而且完備的,更何況智慧型監控還可以用PDA來控制,相信對於環境安全有很大的助益。
最後我看了"人臉識別最新發展現況"的技術報導,其實有很多都看不大懂,向降維減少資料量跟一些沒看過的理論技術,不過大致上了解了人臉分析可分為整體特徵方法以及局部特徵方法兩種,整體特徵方法就是將一張臉當作單一個特徵來做辨識,而局部特徵方法就是找出臉部特徵器官,鼻子、眼睛之類的,對這些器官做局部的分析,然後到最後在把它統合起來得到結果,局部特徵方法會比整體特徵方法具有更高的準確度,可是卻也會有實作上的困難。另外,文章中也提到人臉辨識公認的兩個難題,一是不同光源的問題,二是不同角度的問題,光源問題可以2D轉成3D的方式,而角度問題可以用動態影像辨識方法來解決,也就是利用動態影像來建立容許不同視角下的人臉辨識系統也可以利用兩兩前後影像的關係來處理有部分遮蔽的情況,這比傳統的靜態影像辨識還有擁有更多優勢,但文中最後也提到這兩個公認的難題,還是有很多狀況需要去克服,這就有待技術的發展來改善了。
做完這次的作業後,其實收穫真的蠻多的,如同統計老師所說的學習的深度和學習的廣度是很重要的,雖然我並不是想走多媒體這個學程的,而我也只是淺看了一些實際上的應用,理論上的東西都不懂,但也許以後會碰到相關的產品,或是類似東西旁徵博引的應用,我相信多看看額外的東西,我也會有比較多的能力或者是更多背景知識的來面對及處理這方面的情況。
沒有留言:
張貼留言