2008年4月30日 星期三

Eye Toy報告

我第一個看的是關於PS3發佈的PS3 Eye Toy,他展示了類似遊戲王的遊戲,我看到了玩家的首,就像真的是在玩遊戲王一樣,這樣感覺挺真實的,如果問我想玩甚麼的話,我想如果用Eye Toy玩CS應該會很有趣,不過應該挺累的吧,SONY會推出新一代的PS Eye,有很大辨識能力,強大的PS3運算能力來達到更多即時的感應能力,相對於Wii又是一大突破,我在網路上查到,它是使用USB 的 Camera,利用影像偵測的技術,當作輸入的裝置來取代原先的搖桿,利用的是EyeToy™ USB Camera (for "PlayStation 2")

這是一篇關於PS EYE的報導

國新力電腦娛樂(SCEA)研發部專案經理 Richard Marks,14 日在美國 PS 官方部落格釋出了 3 段研發中的 PS Eye 影像辨識技術展示影片,展現視訊玩法潛力。  Richard Marks 於 2003 年一手催生廣受玩家歡迎的 PS2 視訊遊戲產品「EyeToy」,被視為「EyeToy 之父」,後並主導 PS3 視訊攝影機「PLAYSTATION Eye」相關技術的研發。  本次 Richard Marks 在美國 PS 官方部落格中,釋出了 3 段由 PlayStation 研究開發實驗室新成員 Anton Mikhailov 所製作的 PS Eye 影像辨識玩法技術展示的影片,示範以 PS Eye 視訊攝影機,將手邊各種物件(紙上圖形、實際物品等)轉化成遊戲內容的操作。  影片中研發人員以安裝在《審判魔眼》同梱立架上的 PS Eye 拍攝紙上圖形或是物品,來轉化成螢幕上具備互動性的遊戲物件,像是在紙上畫出山峰與火箭,並使用 PS3 控制器操控火箭降落到山峰上;或是拍攝坦克圖形、模型或任意物品,並以紙上圖形或桌面擺設當成關卡,來進行坦克大戰;或是讓攝入物品在螢幕中展現物理模擬互動效果等。  Richard Marks 表示影片中所展示的玩法只是技術展示,並非實際產品,主要是想讓玩家知道研發團隊一些異想天開的瘋狂點子以及 PS Eye 未來可能的遊戲應用方式。喜愛 PS2 EyeToy 遊戲的玩家,不妨參考看看,並留意後續應用相關技術的實際產品公布。

2008年4月17日 星期四

no tittle

關於 capOverlay,我要使用 capOverlay 模式預覽畫面,
卻只會在 panel 上顯示一張靜止不動的影像,無法像 capPreview 一樣
動態的顯示視訊。。。

有關用視訊錄影
主要是使用 capFileSetCaptureFile( ) 和 capCaptureSequence( ) 這兩個函數
capFileSetCaptureFile 是再同一個目錄資料夾內建立一個 avi 檔
capCaptureSequence 就是把 panel 的內容存進檔案中
然後再使用 capDriverDisconnect( ) 截斷視訊就可以停止錄影了

/* 錄影 */
capFileSetCaptureFile(hwndCapture,"001.avi"); // 檔名 001.avi
capCaptureSequence(hwndCapture);
/* 停止錄影 */
capDriverDisconnect(hwndCapture);
capDriverConnect(hwndCapture,0);

BCB Programming 遭遇問題與解決過程之描述

關於Programming的部份,回去有嘗試著寫過,但儲存影像陣列部分還是寫不出來,只能看講義的程式碼
關於capSetCallbackOnFrame和FrameCallBack的函數
即Byte *ptr;
LPVIDEOHDR CaptureData;
LRESULT CALLBACK FrameCallBack( HWND hwndCapture, Longint lpvhdr )
{
// To get capture data
CaptureData=LPVIDEOHDR(lpvhdr);
ptr=CaptureData->lpData;
for(k=0,i=BitmapInfoHead.biHeight-1;i>=0;i--)
{
}......
不過很多名稱都不太一樣,光這個就搞好久...

BCB問題及解決過程

對於互動媒體專題這門課,
從不習慣上課的模式,一直慢慢的去適應,
上這門課,我想最關鍵的應該就是自發自學,
如何與webcan建立連結、如何擷取影像、如何將影像儲存到陣列等,
這些的函數講義上都有給了,只是要怎麼去運用才不會出現error,
這便是一個很大的學問了。

我目前遇到最大的困難,應該就是在儲存影像陣列的部份,
講義上的程式碼,前幾行就看不懂了,

例如:

TCanvas *csBuf=new TCanvas;
//TCanvas是要做什麼用的?為什麼要宣告一個csBuf為一個新的TCanvas?
/*
上網查了TCanvas,但只查到BCB裡TCanvas這個類別中所包含的函數,
但我還是不懂這整句程式碼在這里的意思是什麼....
額外的發現是,CopyRect是屬於TCanvas這個類別中的。
*/

HDC hDC=GetDC(pane1->Handle);
//這里的 HDC 跟 hDC 的差別是什麼?為什麼這里的程式碼是這樣寫的?涵義是什麼?
/*
hDC我上網查了,是裝置代碼,那HDC呢?是做宣告的動作嗎?還是沒有查到是什麼意思...
*/

Graphics::TBitmap*Source=new Graphics::TBitmap();
//Graphics在這里的用途是什麼?還有"::"在這里是做什麼用的?
/*
後來上了知識查,查到的資料是說:
「::」是C++的語法,它的意思是範圍運算子,
例如Graphics::TBitmap,是表示TBitmap這個結構是來自於Graphics這個物件
*/


還有下面一點的:

Source->Canvas->CopyRect(Rect(0, 0, Source->Width, Source->Height), csBuf, Rect(0, 0, pane1->Width, Pane1->Height));
//這行看起來實在是非常複雜,Rect(0, 0, Source->Width, Source->Height)這些數據的意思是?
/*
這行我上了知識查,都沒有看到相關的資料,不知道是我輸入的keyword錯誤還是....?
*/


我想這些是我目前所遇到的問題,
所以對於儲存影像陣列這個章節我還是沒有很懂,
也許是我比較吹毛求疵吧@@"

嗯..要考試了

這是一個在撰寫用FrameCallBack儲存攝影機影像時碰到的問題
如圖:

簡單的說...這項程式碼無法在Bitbtn下使用
經由神秘高人指點必須放至在外
可是...

放置於外的時候卻發生了執行上的問題
由於
LRESULT CALLBACK FrameCallBack( HWND hwndCapture, Longint lpvhdr )
並無斷行導致程式判定為錯誤的格式
但是若是加上斷行..

如圖...加上斷行後..Bitbtn內的程式就被視為無宣告了

心得...

這次的作業 儲存影像陣列
比上次難 我花了很多時間
去做但是還是有很多bug
第一個要加上
Byte *ptr;
我一直沒加所以一直有錯誤
雖然程式寫了
但是還是有些不懂
第2個的

if(Clipboard()->HasFormat(CF_DIB))
{
Image->Picture->Bitmap->Assign(Clipboard());
}

不了解他的意思

BCB

這次一樣如往常的先copy講義上的程式,在debug。

我試的是1.2.2的第三種儲存影像陣列的方法。

除了一些容易看出是需要宣告變數的bug外,另外沒能自己解決的問題:

1、


這裡是因為少加了Image元件,所以插入後並將名稱改為與程式中用到的一樣,就ok了。

2、

BitmapInfoHead要宣告成 static BITMAPINFOHEADER BitmapInfoHead;

在1.2.3的程式裡找到的~

3、

這裡的錯誤敘述跟真正的錯誤完全不一樣=.=

經由老師的指導後,才知道...

LRESULT CALLBACK FrameCallBack( HWND hwndCapture, Longint lpvhdr ) 是一個副函式,必需要放在主函式外。

雖然compile過後,可以跑了,但是...不知道是否是真的ok了,因為不知道要如何測試。

可能要寫到後面的程式才能得知了~

week8

編碼簿(code book)的產生

- 目的是產生一群具有代表性的碼向量(codewords)來組成編碼簿(codebook)

- 相同的編碼簿會同時儲存在壓縮端與解壓縮端

- 從文獻中我們知道Linde-Buzo-Gray (LBG)演算法是最常用來設計編碼簿的方法

- 這個方法同時又被稱為k-means 演算法或是Generalized Lloyd 演算法


code vector(code words)-碼向量


向量編碼(Vector Quantization, VQ)所產生出來的編碼簿(Codebook)針對編碼簿中的碼向量(code vector)作一個有效的排序產生不同的編碼簿,並利用這些編碼簿去重新對影像進行編碼,所得到的索引值來作為影像的特徵值。如此將資料壓縮與影像特徵擷取合而為一的做法更能縮短查詢時間,適合網路上的應用。


在VQ的系統中,我們先將影像切成一塊一塊並且視其為一個向量。向量的來源可以有許多的方式,例如在黑白影像中的一個 的矩形,或是彩色影像中的R.G.B。一個向量所含的元素個數我們定義為它的維度,每一個向量 ,與一組代表性樣本或碼向量(codevetors), 來作比對的工作。這些碼向量的維度也是 ,而且共同組成所謂的編碼簿(codebook)最接近於原向量 的碼向量會被選出來。

BCB問題與解決過程

把儲存影像陣列章節的程式放到BCB跑
出現很多undefined 應該是有些東西沒宣告吧
講義裡沒寫要怎麼宣告 所以去班網爬個文
有人這樣宣告:
static BITMAPINFOHEADER BitmapInfoHead;
Byte *ptr;
int k,j,i;
int ***source;

嗯嗯 同學高明

色彩差距的觀念

在色彩學裡,二色樣在色彩空間(CIEXYZ;CIELAB等)之接近的程度稱之色差。

當人眼無法分辨出二色之間的色彩差異時,此種色差稱為"恰可察覺"(just-noticeable)色差。

若二色之色差大於恰可察覺色差,但仍可為他人接受時,稱為"可接受"(acceptable)色差。

色差之用途,可決定配方與樣品之色彩接近程度,借此判定允收/拒收標準。





參考資料
奇摩知識+

codebook

話說上次的編碼簿問題讓我增長許多知識
也有許多同學熱心的上網尋求解答
非常感謝 (雖然那篇論文我也看不太懂)
不過老師上課所交的一些基本觀念 大致上都還清楚
也有一定的了解

資料都被人發表完了 我也不知道要打什麼了...


期中考快到了 大家加油吧!!

再寫一次!?(加長版?)

BCB Programming 遭遇問題與解決過程之描述:

前些日子,我的學習進度,
是到1.2.2的儲存影像陣列.

當時因為某樣東西沒宣告,
所以,
一直跑出以下的錯誤訊息:Undefined symbol 'BitmapInfoHead'

1.2.2並沒有多加說明'BitmapInfoHead'是屬於哪種型態??
一時之間...我也不可能突然會寫.

無奈之餘...
我也只好將實驗教學手冊,
再向後翻翻看,
找找看有沒有什麼可用的程式.

雖然不確定是不是用在這種情況.
但是在1.2.3有行程式碼是這麼寫的:
static BITMAPINFOHEADER BitmapInfoHead;

原本只想要隨便試試.
說也奇怪...,
就這麼巧,錯誤訊息就這麼消失了.
我想...該不會
'BitmapInfoHead'就是要宣告成' BITMAPINFOHEADER '吧!

雖然還有不少地方,我還看不太懂.不過我會慢慢去試,去體會的.

===(以下內容有要寫嗎??如沒有,請自行略過~)===

回答方泓智同學關於 Codebook 的疑問

關於codebook和codevector
我在網路上查到這則論文:
利用LBG 群聚法之向量量化影像壓縮演算法
裡面有提到一些~
截取一小部份出來看.
-----------(以下為部份截取內容)------------------
向量量化(Vector Quantization,簡稱VQ)為影像壓縮演算法中很常出現的特徵量表示方式,VQ 根據輸入影像製造碼簿,再將輸入影像各個區塊以碼簿內的碼字來近似,藉此達到壓縮位元率的目的,但也因此造成影像的失真.
向量量化
設f=【f1,f2,………,fN】T 表示一N 維向量,它是由N 個實數連續純量值fi 所組成。在VQ 中,f 將被映射到另一個N 維向量r=【r1,r2,………,rN】T。 f 的VQ 是將一個N 維向量空間分割成L 個決策區域Ci,1 ≤ i ≤L,每一個決策區域包圍一個重建向量ri。在編碼的文獻中常將ri 稱為碼向量(codevector),並將碼向量所形成的集合稱為碼簿(codebook)。

設fp 代表f 量化的結果,則可寫成
fp=VQ(f)=ri,f∈Ci
其中VQ 代表向量量化的動作。[1]
在向量量化編碼時,不同的碼向量分別給予不同的指標,藉由指標而非向量本身的傳送,可以降低表達此影像時所需花費的位元數,這就是以向量量化做影像壓縮減少資料量的原因。

圖1 為向量量化的流程圖。其中編碼端及解碼端的碼簿均相同。每輸入一個向量,編碼端會到碼簿中去尋找和此向量有最短距離的碼向量,並將代表此一碼向量的指標傳送至解碼端。解碼端主要為查表的動作,將此一指標所對應的碼向量取出當作輸出向量,完成解碼動作。


資料來源:
-----------(以上為部份截取內容)------------------


不曉得是不是有點難,
我也不是很瞭它在說什麼..(謎:其實是你太笨orz)
不過不知道對同學有沒有幫助.(所以就先po文)

=====================================

解釋 色彩差距(color distance) 的觀念

老師課堂上都講過了,
所以我就不多說了~

久違了

話說~距離上次打開這個已經過了好久

在這之中經歷了好多事

電腦中毒

電腦蟲冠

電腦換主機板

種種的問題

結果出現了一些WINDOW主程式部分的檔案LOST了

怪怪的

看來又要崇慣了

那之前我沒有買課本

所以我都是跟朋友借的

但是這樣也很麻煩

借來借去

後來有一位同學

很好心的

給了一個RAR檔

裡面是課文的內容

在這裡要感謝啦

姜涵君小妹妹

謝啦

繼上次問題後

我就看講義裡面的程式碼

上面都有講解

雖然不是非常詳細之易懂

不過還OK的

雖然我沒看很多

但是我覺得實際操作絕對比紙上談兵效果來的好

所以囉

我要盡快處理電腦問題

BCB的問題...

來看圖說故事吧= =





一開始...照著講義上的打...出現很多錯誤是正常的....


譬如上圖...很多東西都沒宣告...有些是自己的物件名稱跟講義上的不同...


就自己加一加改一改吧....



跑出了一個BitmapInfoHead.biHeight沒定義...把它改成Hight看看....
run了一下...沒錯....ok...找下一個....
這次是ptr沒定義...
跑去問學長給了我一個很直接的答案.......那就定義阿....
所以跑去最上面加上Byte *ptr....
然後source也跑出沒定義....我也跑去最上面定義了一下...
一開始我有給他大小...後來跑出下面這張圖...
好像是說你webcam的影像超出你儲存的範圍了...
那我source不設範圍看看....
結果還是要我設值就是了....
最後最後的結論是......我問的同學不會....問了學長他說沒學過也不會....
上網找不到跟講義相似的東西...(我的搜尋引擎太懶了...)
所以...就是還不會用儲存影像陣列....

考前ㄧ週了~

噗~老師說要找的東西
有同學已經PO了(自己在PO的話很無趣@@)
不過,老師有跟我們說要我們找什麼
因為有去找或看,更增加了一些知識還有概念
像色彩差距原來有一套公式去評斷人的接受程度
ΔE=[(L1-L2)2+(a1-a2)2+(b1-b2)2]1/2

這禮拜的BCB寫了儲存影像
都有把講義上的寫上去
不過方法ABC裡,只完成了方法A和B
Compile方法C的時候,沒辦法儲存@@

(到時候再去學校擷取圖
宿舍電腦沒辦法用BCB,所以要在學校用XD
晚點在用囉~)
如果按調整影像大小的話,會當機>"<
噗~問題多多

2008年4月16日 星期三

要考試了齁!!!!!

codebook就是編碼簿
然後我查到的,同學都已經PO了,
所以我就...沒得寫啦@"@

BCB程式的部分
我目前還沒有新的東西出現說!!!
不過之前調整解析度部分
我用講義上的寫法,是可以開啟對話盒子
可是我在我的電腦上並不能使用!!!
然後,我找到了另一種寫法,
只有一行指令

capDlgVideoFormat(hwndCapture);

這樣我在我的電腦就可以調整解析度
不過從大變成小的時候都會留下殘影
這個倒是還沒有解決


可是我很無聊的加了個背景@"@


建立背景的部分還沒有寫好啦!!!!


WEEK8

<一>CodeVector
圖中的黑點及CodeVector,將所有的黑點連起來所成的區域,及CodeBook。因該是如此
編碼簿的產生在整個 在整個VQVQ的過程中,的過程中,最重要的工作便是最重要的工作便是CodeBook的設計。所謂CodeBook,指的是一群CodeVector或CodeVector的集合,而我們最終的目標,便是以這些挑選出來的CodeVector來代表該空間中全部的資料向量。舉例來說,如下圖所示,在一個二維的空間中,我舉例來說,我們將整個空間分割成若干等分,每個等分以一個 們將整個空間分割成若干等分,每個等分以一個CodeVectorCodeVector來代表,如此一來,空間中全部的向量都可以用這些有限的CodeVector來代替,這便是VQ的精神所在。
------------------------------------------------------------------------------
<二>色彩差距的觀念:
色差的定義:是指比較兩種色物體時,眼睛感覺色彩的差距大小,簡稱為ΔE。
一般所指的ΔE為1976年CIE所製定的CIELAB均勻色彩空間的色差公式。
ΔE=[(L1-L2)2+(a1-a2)2+(b1-b2)2]1/2
一般而言
1.Delta E > 6:不可接受,人眼視覺很容易辨識其顏色差異。
2.Delta E < 4:尚可接受,人眼視覺可辨識其顏色差異,但不是十分明顯。
3.Delta E < 2:人眼視覺幾乎無法辨識其顏色差異。

2008年4月15日 星期二

暫無

關於codebook和codevector的問題:
Codebook即編碼簿,而對應到編碼簿中的向量稱為Codevector(碼向量),也可以說是碼向量的集合。每個碼向量皆會被對應到一個索引值,稱為Codeword(編碼字)。在參考資料以後得知:Codebook是向量量化時必須用到的,而向量量化是為了達到影像壓縮或資料壓縮的方法。
Codeword->Codevector->Codebook->Vector Quantization(VQ)->Image Compression 大概是這樣吧...

2008年4月10日 星期四

又是標頭檔

BCB Programming 遭遇問題與解決過程之描述
寫程式,不可能完全照著講義上打,
因為我打過之後就發現其實要多寫一些什麼之類的,
不然compile的時候一定會一堆問題出現,
像標頭檔 Byte *ptr;
     int ***source;
      ↑為什麼這麼多星,也是要問人~
或是變數之類東西,講義不會多加去寫,
畢竟有些是自己就要會的!程式碼的部份...還要問問別人吧,
我不是很厲害的人...請教別人,自己回去練習,這就是最好的方法@@
其實程式碼講義上都有
不過要瞭解裡面所有的指令才會更懂程式
這也是要多看程式才會更厲害~


←他沒有偵測到我的WEBCAM
常常會犯錯,Panel的名,要改一些東西

←儲存影像,下面那個才是
       調整影像大小,因為我webcam測不到
       會一直當機XD,有機會再放~

BCB Programming 遭遇問題與解決過程之描述

在上次老師介紹的程式裡~我看了大家寫的程式碼~

在我的感覺~如果現在要我去馬上寫出來是不可能的~

因為我對於此程式的架構以及指令及內容還不了解~

還有其操作的方式一開始覺得還蠻複雜的~

雖然說他有許多和C++有相同的地方~

但是還是有些關鍵字不一樣~

加上我的C++沒學好~以至於很多都看不太懂~

或許是太不認真~才會導致有這樣的結果~

如果先把C++弄懂~間接就可以弄懂一些在BCB裡面用到的C++的規則~

然後再多接觸BCB~可能就可以比較瞭解他~這樣才能寫出想要的程式~!!

BCB programing遭遇問題

BCB程式撰寫過程心得:
一開始常常忽略物件指向的位置
例如要用一個button對一image1做動作
名稱卻指到image2之類簡單的錯誤
又像是擷取RGB三原色之類的影像處理程式
會寫出編譯時出現藍色網底字的bug
像那個我就不知道該怎麼處理
那種情形會導致整個程式當掉
而且沒有顯示哪行錯誤 手邊沒留下當時的程式
所以就沒辦法具體的貼出來

監控系統心得

看完監視系統影片,它所介紹的攝影機跟我映像中的不一樣,在過去電視上所看到攝影機的畫面都是很模糊的,而且畫面中的人動作不是很順暢,動作都是頓頓的,但是在影片中所看到的,跟我去過所知道的攝影機有大不同,在片中的他是影機的性能明顯比過去強的太多了,在加上它的監控系統會隨著人從鏡頭經過,機器它本身鏡頭跟著人移動並會跟擷取鏡中人的相貌,影片中也有說到,他們這套系統包含了車輛經過他會記錄下車牌號碼,和發現有人遺留下東西沒有帶走,會有機器人車會把所遺留下的東西給收走,這影片是交大所製作的,看完後覺得研發這套系統的團隊很厲害,再回頭看自己,自己在這方面的程式都不是很了解,光是影像擷取程式都用了很久才搞定覺得自己很遜.看完後多多少少會刺激人想要努力的的動力,想把程式給學好.

BCB

這次寫的BCB是讓程式播放出攝影機拍的畫面,不知道跟上次看到洛克人的遊戲是否有相關聯.可以用BCB寫出類似只要攝影的對想做什麼動作,遊戲裡的角色就會跟著不同動作做出不衣樣的動作.而這次寫的BCB程式碼比較不懂的地方就是為啥要用for迴圈做十次,後來聽了阿德的解釋,原來一台電腦裡面只能有十個視訊,而另一個問題就是影像的清晰度,好像不管怎麼改BCB的程式碼,都無法像攝影機直接波出的畫面那樣清晰.

「多媒體訊號處理於監控系統之應用」心得

自己看了「多媒體訊號處理於監控系統之應用」的影片後,一瞬間反而沒有什麼想法
畢竟影片中展示的功能非常強大,但是稍微思考一下影片中功能其實還是有不少疑慮


首先就是之中許多高精度的抓取跟辨識功能,越是要求精準的功能,同時代表誤差發生的機會變高,這類監視系統若是廣用於人流度高的辦公大樓或是商場

同時還要面對天氣跟昶所亮度
亙甚至目標物難以辨識(車牌太髒/剛好反光,臉醜之類...)
若是精度不夠導致誤判,很容易就會產生錯誤的情報
對應系統反應過快也可能造成擾民的情況

另外就是高精度的監控系統的效率是否與成本相符合
影片中一個賣點在於"防範未然"這點,但是一個沒弄好就會造成擾民的情況
而然若沒有"防範未然"這個優點,只作於事後取證等功能的時候(目前監控系統基本上也都只有這部份)
但是若是這些功能一般的攝影機就能達到,高成本監控系統是否真的有所需要呢?
畢竟高精度的監視系統不管在軟體或著硬體上都有較高的維護成本,這套系統對於犯罪率的壓抑程度是否符合成本也是需要考慮的
另外就是隱私權的問題,監視系統對於隱私權的爭議一直存在,小至攝影機大至太空衛星,當然太複雜的東西我也講不來....

我相信監控"技術"日新月異對於人類社會絕對有正面幫助的
不過就目前影片所展示的內容是否立刻投入現場還是保持保留的態度

BCB Prqgramming 遭遇問題與解決過程之描述

其實,在一開始時我打開BCB時完全不知道要做什麼事,真是不好意思!
連Panel都不知道該怎樣開...程式也都不知道該如何寫,
就連Ctrl+C和Ctrl+V都不知道該給它Ctrl在哪裡...,
可是後來就慢慢的問同學還有去看其他人po的文漸漸知道該如何下手...
雖然有出現一堆bug,但是在我一陣亂試下慢慢的變少...
不過,之前我有點忘記ㄌ,
如果想要把連線視訊裝置的那段程式碼改成不需跑迴圈,
直接指定的話該怎樣改...(因為就只有一個裝置嘛~!)

week8 <電腦視覺監控>心得

影片<影像視訊融合技術於監控系統之應用>
從影片一開始的Google Earth轉到nctu的場景
突然切換成3D模型場景,讓我感到很疑惑

如果要依照這樣的模式對每個地方進行監控,
就要針對監控的地方去建立3D模型

畫面上移動的人物應該是把攝影機拍到的人物投射到3D場景上
可是攝影機的背景應該還是2D的,這之間的差異轉換還滿神奇的

技術文章<淺談行人偵測>
這一篇裡面講了很多我看不懂的名詞@@
我比較注意到的是文章裡面說,
人臉偵測目前已經有演算法可以快速且準確的進行,
所以現在在做行人偵測的研究

比起單純的物件偵測,
行人偵測還多出了很多必須考慮的條件,如衣服、遮蔽等等
使得演算法困難許多
只是不知道行人偵測的實際有效功用有哪些??

WEEK 8

這次的作業要討論電腦視覺監控產學研聯盟網站裡,影像監控與相關應用的發展近況。在美國遭到恐怖攻擊後,視訊安全監控的研究開始受到各國重視,而成立了”電腦視覺監控產學研聯盟”來做相關技術的研究。

淺談於視訊中進行物件偵測與物件切割技術
偵測與識別物件和對物件輪廓的處理,偵測辨別物件方法是在物件上找出特徵點
取出其鄰近區塊後視為物件code然後組成codebook,在進行物件偵測即可進行
比對。再對codebook進行處理可作出物体的輪廓切割。

手持移動光源之偵測與追蹤
可判斷夜晚中光源位置與軌跡,漆黑環境中辨別光源不太容易,須考慮很多變異(光體周圍的光暈或者環境物體的反射等),會影響光源正確位置的辨別,不同的移動光源具有不同的特性:打火機移動時,其變異區域較具規則性,而手電筒則較不具規則性。利用光源點數量、光暈點數量及兩者之比例,來預測手持者可能的所在位置。感覺有點不可靠,如果能作出更精密可判斷更多種光源則對火災的第一時間通報會很幫助。

以Cross-Ratio為基礎之自動車夜間視覺定位
可在夜間巡邏的機器車…裝有定位系統和紅外線夜視攝影機,可透過無線網路,與遠端中控室的電腦進行即時的連線與操作。以智慧型自動車替代保全警衛,節省人力降低成本。電影裡機器人到處跑的景象好像快出現了…

彩色人臉資料庫介紹
用在電腦視覺中的人臉偵測與識別技術的研究,可以協助研究人員在實作上得到較準確的效果….沒什麼特別的。

智慧型攝影機開發
提升現有攝影機之性能,開發成具有智慧功能之攝影機,整合“移動人員偵測與追蹤”之智慧型演算法,期望開發接近商品化之雛形系統,以協助專業攝影機製造廠商提升其先進技術能力。
“移動人員偵測與追蹤”之演算法主要有三項功能:人形探測、臉孔探測、人員追蹤。
可以即時偵測監視畫面中是否有移動人員,配合行為判斷系統進行追可疑的人、自動調整聚焦拍下人臉,很實用的技術。

電腦視覺技術應用於超商監控系統
利用電腦視覺等技術,提升超商的防衛能力。
為超商場所設計研發相關技術,分別為:
1. 超商收銀機檢核畫面摘要監視系統
分成三部份:
(1) 收銀櫃台監控
結合收銀機即時及交易資料和截取監控系統所拍攝的櫃台監控畫面達到交互查詢索引的功能。
(2) 入口區監控
偵測可疑顧客,例如穿戴安全帽或口罩等,即時對店員發出提示,增加店員的反應時間。
(3) 貨品區監控。
利用行人追蹤的技術透過監視器記錄滯留的行為模式。
2. 超商櫃臺區域非工作人員進入偵測
利用其必須穿著制服之特性,擷取其色彩特徵,對進入者之身分合法性進行判別,則系統會自動的發出警告、通知與記錄,提醒安全人員注意。
3. 臉型遮罩偵測系統
協助保全人員監看畫面,於可能犯罪行為發生之前,主動從監控畫面中找出穿戴安全帽或口罩的嫌疑人物,適時提出警告以防範未燃。
但是超商最常遇到的還是商品遭竊,報警後通常也是不了了之,可在入口用畫數較高的攝影機、入口附近街上裝可辨識車牌的攝影機,增加警察找出竊賊的機會。


PS:再借一下帳號

電腦視覺監控產業研究心得報告

看完電腦視覺監控產業研究的影片後,裡面有入侵者監控系統、車牌辨識系統、遺留物辨識系統、異常行為分析、人臉偵測、追蹤與辨識、巡邏車自動巡邏等等的研究,我覺得監控系統最大的難度在如果在移動的畫面中,找出需要的部分進行分析、比較,這些技術性的問題以入侵者監控來說,系統需要進行順暢的場景切換,並且獲取入侵者的位置,車牌辨識的話則要在移動中的車輛找出它的車牌的位置,並且取得車牌的畫面,再進行車牌的辨識動作,遺留物辨識我覺得比較容易,但是必須要可以把畫面中的位置,對應到實際的位置,讓機器人可以得到該遺留物的位置,進行遺留物排除的動作,而異常行為分析就更為困難了,因為人的動作有非常的多種,但要如何去判斷這個人的行為是異常的,我覺得很困難,人臉偵測則要先去追蹤人的臉部在哪裡,再去進行判斷,可是人臉的角度並不可能完全是同一個角度的,所以不同角度的判斷也是一門很大的學問。看完這些系統,我覺得需要非常多的專業技術,也需要我們更加的努力去鑽研我們有興趣的部分。

電腦視覺監控產業研究

電腦視覺監控產業研究心得:

電腦監控技術的發展
促進了Safety、Securty、Carebusiness的成長
針對兩個「系統整合影片展示系」的影片
由室內延伸到戶外的概念


還可分為1.車牌辨識 2.智慧型PTZ攝影機 3.平順轉場 4.全向攝影 5.自動車


我還特別去查了PTZ攝影機相關設備和平順轉場的圖到底長怎樣

參考網頁:http://www.twisu.com.tw/3/authorware/author1/au105.htm

我也找了一下 什麼是科專計畫
http://r608-04.eic.nctu.edu.tw/cvrc/research_1_1.htm
主要是國科會推動的樣子
看完後才想到 這種技術的結合
目的涵蓋真的很廣
除了平常看到 以及影片介紹的「安全」這點外
也可應用在
˙互動式看護服務系統 - 人工看護服務,需要一對一24小時的照顧。
產業發展後可達到
偵測非語音資訊如眼睛呆滯、頭的動作反應、臉部表情與手臂的搖動等。
偵測語音資訊如呻吟聲、哀號聲等。
提供人機交談界面以現場資訊作緊急狀況的判斷。

這不僅可以節省人力的消耗
更可以有效率的管理病人的健康情況


˙自動車導航與機動性環境偵測系統 - 國內產業尚無自動車導航技術。
產業發展後可達到
可技轉導航及環境偵測技術給相關產業。

針對這部份 我覺得這個應用很好
不僅可以用在自動拆除危險物品
我覺得也可以發展在無人駕駛的導航車上
例如喝酒的人 就可以用導航車安全回家之類的

這類的產業還滿熱門的
這個網站也有很多實例
http://www.huperlab.com/chinese/product/hupervision/keyFeature_1.htm

QQQQQQQQQQ

看完電腦視覺監控的影片後,覺得他判斷人臉的方式很有趣,到底它是如何去分析是否人臉.去看了他們網站有關監視系統之影像處理技術,大致了解開發以「影像處理」方法為基礎的方法,其分別應用於監視攝影機的「畫面遮蔽」的議題,以及應用於監視畫面中「特定物體遺失的狀態偵測」.

[畫面遮蔽]他們使用影像處理的方法為Histogram與Edge這兩個特徵來作為畫面當中是否有特定物體針對攝影機畫面有所遮蔽的意圖。

[特定物體遺失的狀態偵測] 他們使用多種影像處理的方法,簡單的說Histogram、Template match、Rotation與Edge這幾個主要特徵來辨識畫面中特定物體是否遺失的狀況發生。

而且他們設定的監控系統還可透過網路連線傳給使用者,加上還能分析動作來判定是否危險人物,實在是非常讓人驚訝.

95360361電腦視覺監控產學研聯盟

我在電腦視覺監控產學研聯盟的網頁看了兩部影片~
第一部是介紹入侵者監控系統~
這個系統主要是用室內室外聯合監控~
她主要是由5種技術所組成~
1.車牌辨識
2.智慧型PTZ攝影機
3.平順轉場
4.全向攝影
5.自動車
用了這5向技術幾乎可以全面監控到入侵者的行蹤以及作為~
首先是車牌辨識的技術~只要是不同於這個地方內的車子~
都會先記錄下來~並且連到攝影機(智慧型PTZ攝影機)告知~
如有人從這台車出來~就全面對此人做監控~避免有事發生~
但是我覺得這個有個小缺點~
就是如果是同地方的人進出~那不就比較無法掌控了嗎~
然後再利用平順轉場的技術~
當離開了當下的攝影機範圍時~
連線到智慧型PTZ攝影機~告知它並計續監控此人~
但是如果此人有留下任何物品在此地的話~
就由全向攝影技術以及自動車聯合來處理此物品~
首先由全向攝影傳座標給自動車~然後由自動車去清理它~
這項監控的技術~覺得已經能盡量的防範了~
雖有一些小缺點~但基本上已經算是不錯了~
-------------------------------------------------------------
而第2部的影片是介紹智慧監控系統~
它主要是由室外環場監控系統和室內的手勢辨識系統~
室外的系統主要是由伺服器,多重攝影機,PTZ攝影機,PDA的平台等等
這項系統主要有4項技術~
1.異常行為分析
2.人臉偵測
3.追蹤與辨識
4.巡邏車自動巡邏
當有人走進範圍時~會先用人臉偵測來判斷是否為人臉~
如果是的話~將積極的對此人做監控~
而當有不是屬於原本的走動行為時就會特別的注意以及監控~
然後就可利用室內手勢辨認系統去控制巡邏車~
然後由巡邏車所拍到的畫面傳到伺服器~以進行全面無死角的監控~
我覺得這個系統比較不錯~因為當有怪異的行為時都會比較注意~
這樣比起之前第一部影片介紹的系統是好一點~
因為它並沒有針對不正常行為做注意的焦點~
加上第2部介紹的能用PDA做監控~事實上其實也是很方便的~
但也不是說第一部介紹的不好~其實是各有優缺點的~
這是我的感覺~因為目前能做到這樣已經不錯了~
未來一定還會有更進一步的系統出來~
以所能達到的近乎完美的地步~!!

電腦視覺監控心得

看過網站裡的影片,
覺得跟以前的監控系統比起來要好的太多ㄌ,
除ㄌ影像變的更清晰之外,
還可以自動對焦,
而且利用感應的方式做到無死角,
每個角度都拍得到,
還可以判斷畫面裡的人是不是有非善意的企圖
(只不過我覺得好像除ㄌ走路之外,只要做出非行走的動作就會被視為危險動作的感覺...)。
另外,如果有不明異物出現的話,
就會利用無線傳物體的地點座標給機器人,
讓機器人將不明物體移到其他位置,
這樣的話如果到時候有疑似爆裂物出現的話,
就可以叫機器人把它移開,也比較安全!
而最主要的功能是還可以做到隨時監控的目的,
可以利用PDA,手機等介面繼續達到監控的目的,
即使人不在監控系統前面也可以達到監控的作用,應該對管理員有非常大的幫助吧!
像是去巡邏時,還可以邊看監控系統,機器人也可以幫到忙~!
也有一段影片是介紹利用衛星做監控的動作,畫面也非常的清晰,
以前高中軍訓課時教官也有用過類似的東西給我們看,
只不過看的東西是機場...,
衛星是很好用沒錯,可是是不是也會造成反效果?!
像是可看到軍方的基地等...
另外,還看到除ㄌ監控系統之外的安全保護措施,像是虹膜比對等,都很有趣。
我從來不知道虹膜到底是怎樣比對ㄉ,可是這樣準確嗎?因為它難道不會改變嗎?!
因為好像有一個比對的項目是眼睛的大小?!

電腦視覺監控產學研聯盟

看了電腦視覺監控產學研聯盟的網業,我在首頁有看到兩部影片可以下載,
所以我就把兩部影片都下載下來看,第一部是在講入侵監控系統,原來現在
監控系統這麼發達,攝影機之間還可以互相聯繫,真的是太酷了,而且如果
有可疑物,攝影機還會自動偵測,然後派自動車處理可疑物,原來攝影機還
會自己自動處理,還有,在戶外設置的攝影機還可以自動偵測車牌,攝影機
會把偵測到的車牌框起來,然後來即時辨識車牌號碼,真的非常厲害,還會
在動態的狀態下,正確的把車牌號碼框起來,影片最後說到監控市場好像會
成為產業的重點,我記得老師好像也有講過類似的話,所以我覺得,老師上課
教的WEBCAM程式要好好學,第二部影片是在說智慧監控系統,它會分析異常
行為,還有臉部偵測,追蹤與辨識和巡邏車自動巡邏,臉部偵測讓我想到上次
上課老師要我們在課堂上看的第三屆由田機器視覺獎,裡面也有人臉偵測的
項目,我想人臉偵測應該很難做,還能正確地把臉部部位框起來,真的是非常
不容易,所以,這兩部影片告訴我們要好好的學習機器視覺,對將來應該會有
幫助。

電腦視覺監控心得

電腦視覺監控產學研聯盟的網站中的技術專區看了幾篇,
挑了其中比較有心得的來寫:

多攝影機間進行目標物追蹤之現況簡介
在這篇中提到的目標物追蹤問題可廣泛定義成三類找對應關係的問題,而這三類問題都好像必需結合人臉辨識系統,不過在不同地方的cam所拍攝的角度也不同,要如何分辨是否為同一人也是個難題,這樣也為人臉辨識系統沿伸出另一個可以討論的議題。因此雖然使用多攝影機監控網路來進行大範圍區域的視訊安全監控是個發展趨勢,但目前才發展沒多久,尚有許多挑戰與困難存在。

全方位安全監控自動車之開發
運用搭載攝影機並可以全方位移動的自動車,來解決無法觀測巡邏的盲點,而且為了讓自動車的用途更為廣泛,在機器人身上還搭載了紅外線和超音波感測器用於偵測障礙物,以及偵測氣體的感測器,並架設環場攝影機用來呈現360度的場景來辨識環境影像,此外更做出語音系統來與人互動,讓原來只是用來補足巡邏車缺點的監控系統,不只可以用來巡邏,另外還可以進行導覽的功能。

除了看技術專區,也看了一下首頁的影片,總體來講,感覺在實作上還是只能用於有固定人員或少人出入的大樓,而不能廣泛運用到人潮多的地方;不過隨著技術的進步與需求的增加,賦予視訊安全監控系統更多的智慧型功能,應該會更加完備,以達到防患於未然。

BCB Programming 遭遇問題與解決過程之描述

這次上課,老師有開放時間讓我們跟同學討論
之前有練習過的BCB程式,也就是WEBCAM顯示在
Panel視窗上,所以我就找同學問程式碼裡面在
做什麼,問了之後,發現還是很多都不太懂,像是
裡面有個程式碼用for迴圈做了十次,問了同學
才知道為什麼要做十次,因為一台電腦裡面只能
有十個視訊,超過好像就找不到。現在還在熟悉
BCB當中~所以只能拿之前上課照打的程式碼拿來
RUN,而不能每一行都能懂程式碼的意思,希望能盡
快跟上大家的腳步。

電腦視覺監控...

看完還覺得很有趣XD

不過看到大家都寫這麼多...好大壓力阿XDD
===========================================

自己看了「系統整合影片展示」的影片後,
想到一個問題
如果負責監控的控制人員
當天他的臉型因為一些不可抗拒的原因而變形(例如:可能不小心撞到什麼東西而導致臉上出現傷痕)此時必定和資料庫裡的人臉不一樣
這時候如果他必須要進入檢控房的話,
而電腦辨識必定會說他不是合法的臉,這時候有什麼方法來進去?
總不能等到說臉型便會原本的樣子吧...
再說每個人的臉在不同的時段都有不同的樣子,(人一生的樣子總會改變的八...)
總不能要用戶每次出錯的時候再去修改...
這一點都不人性阿(雖然說可能只需要交一張照片就可以了事了XDD)

我想到的是
臉部辨識是用在於監控當天進入該棟建築物的人的活動(至少不需要辨識XD)
再來就是當人進入該建築物時,
用該攝影機來擷取該名人員的臉
以利以後需要追蹤時的必要檔案...
(這好像老師有說過XD)
反正大概就是這個意思...
不過動作的監控就比較有趣了


不過總的來說...現在很多的都是單一人員的
沒辦法達到多人同時監控
多人時應該會出錯八XD
而且人一多起來,攝影機就沒辦法全部補抓到全部的人
可能這就是缺點吧XDD

//不過我對他們的自己做的攝影機有興趣阿XDD

電腦視覺監控產學研聯盟心得

一開始先看了聯盟成立宗旨,傳統上對於居家環境與公共空間的視訊安全監控,主要是採用被動式的錄影方式,亦即錄影的結果大多只能在事件發生後提供警方辦案之用。然而,隨著技術的進步與需求的增加,如何賦予視訊安全監控系統更多的智慧型功能,以期能防患於未然,已成為最新的發展趨勢。


→傳統的攝影機都是以量克制各個死角,之前在台中的交流道出口的地方,就有快七、八台以上的攝影機監控著路口,感覺上裝設了這麼多台的攝影機,而且都還是固定式的,要是每個路口都裝設這麼多台的話,整個花費金額應該就太高了吧,但是如果改裝設轉動式的攝影機,又會擔心,歹徒利用轉過去的空檔,趁機作案或逃走,所以其實還蠻矛盾的。


在首頁上看到-系統整合影片展示-兩部影片,在第一部影片中,車牌偵測與辨識技術,感覺好像還蠻不錯的,但在車種與車牌之間的漏洞,也許可以跟警察局和監理所連線,做到車牌與車種的整合,以防止他人掛假車牌,闖入做壞事;在第二部影片中,室外環場監控系統裡的行為分析系統,雖然影片中有解釋,設定一般人的正常行為模式,可是每個人的走路方式應該都不一樣吧,像是年輕人、中年人、老年人,在走路的動作上就有很多種模式,兩腳步伐的間距也大都不同;而在這兩部影片中都是以單一個物體為主在做監控動作,雖然整合式攝影機是蠻不錯的概念,從外部攝影機抓取到第一個物體進入,隨之傳送給內部攝影機,一個接一個的傳送,那如果這時候第二個物體在這時與第一個物體,間隔了大概一小段距離或是時間差上,這時候攝影機不知道會以哪種方式呈現,感覺整篇文章好像有點吹毛求疵的感覺...。

BCB Programming 遭遇問題與解決過程之描述

上次完成視訊擷取之後
一直不懂那個
for(i=0;i<10;i++)
{
if(capDriverConnect(hwndCapture,i))
break;
if(i==10)
ShowMessage("Cant connect to any capture");
exit(EXIT_FAILURE);
}
的程式是在做甚麼
後來問了同學才知道
原來是電腦它不知道是哪個接收端有接收到視訊畫面
所以 i值就從0跑到10去尋找有收到畫面的接收端
如果找到就跳出
如果沒找到i=10則告訴使用者沒有一個接收端有收到畫面

所以這個問題就這樣解決了


於是
我就接著下去去做儲存陣列
可是課本都較少著墨在程式的解釋跟函數應用之類的東西
所以像是課本中p.8頁的

Graphics::TBitmap*Source=new Graphics::TBitmap();在做甚麼?
Picture->Bitmap->Assign(Source); 的作用?

都不大了解
後來
我問了幾個同學有沒有可以參考的書籍
老師推薦的書 我搜尋了圖書館的館藏好像沒有
而圖書館中相關的書好像也有點難...
不過也只能先拿來看看
相信研讀過後對於它的指令會有許多的幫助

================================================================
上次的儲存陣列一直做不出來
我問了已經會的同學
我大概知道我哪裡做錯了
原來我include的函式庫太少了....
難怪compile一直錯....
不過 ....
改完之後還是錯的...
恩...要考試了
考完再弄吧

關於codebook

所謂的codebook就是編碼簿
雖然沒看到確切對這個名詞的解釋
不過從網路上的投影片和論文中
大概知道是怎麼樣的一個東西
從圖像壓縮VQ的例子來看
先將圖像分成一個一個的小方格
每個小方格都包含了許多像素
然後再將每個方格的像素作成具有代表性的向量
進而得到的就是一個編碼簿
一個編碼簿再對裡面的向量
比對codeword(編碼字)中最接近的取它的索引值
之後儲存到陣列中
於是就組成了一張索引表
而上文文中的codebook
大概說的就是一個容許儲存向量值的位置之類的東西吧

關於color distance

稍微看了一下相關的網頁
我在想color distance該不會說的是color difference吧...
因為好像沒看到coler distance的東西
不然就是我搞錯了

在色彩學裡,二色樣在色彩空間之接近的程度稱之色差

當人眼無法分辨出二色之間的色彩差異時,此種色差稱為"恰可察覺"(just-noticeable)色差。
若二色之色差大於恰可察覺色差,但仍可為他人接受時,稱為"可接受"(acceptable)色差。

以上~

找到了找到了


↑關於講義上擷取視訊畫面的部分 (這邊不讓我貼@"@,所以...)

這段程式碼一直沒有辦法執行
然後我上網看了一些網頁

http://delphi.ktop.com.tw/board.php?cid=168&fid=921&tid=62758

http://www.programmer-club.com/pc2020v5/forum/showsametitleN.asp?board_pc2020=cb&id=10049

然後我在整段程式碼的上面加上了四行程式碼
static BITMAPINFOHEADER BitmapInfoHead;
Byte *ptr;
int k,j,i;
int ***source;
就可以成功的執行程式了

可是在講義上的幾個方法
如果都不寫for迴圈以下的程式碼,
還是可以成功的擷取畫面

(只寫這段還是可以)
capGrabFrameNoStop(hwndCapture);
capEditCopy(hwndCapture);
if(Clipboard()->HasFormat(CF_DIB))
{
Image->Picture->Bitmap->Assign(Clipboard());
}


這樣的話,多寫下面大一大串,不就等於多寫的了嗎??
我並沒有發現兩著的不同,所以不明白到底有甚麼差別!!!!


week8 電腦視覺監控心得

在”目標導向前景物件影像抽取技術”這篇技術報告中,我看到了一個令我印象非常深刻的東西,就是關於背景的定義,何謂背景?如文章所說的我們的直覺就是一段時間固定不動的物體」,那麼相對於前景就是移動或短暫出現的物體"但在現實環境中,很多物體應該是屬於背景的一部分,但是卻是在移動的,例如:隨風搖曳的樹枝;而一個會動的物體(如人和車),如果在視訊畫面中一段時間都未移動,應該將該物體視為背景的一部分",所以依據以上想法就產生了相對於背景的前景新定義,那就是「移動或短暫出現且有明顯分析意義的物體」,如此一來,我們對於影像中什麼樣的東西是我們必須追蹤、focus on的人、物都很明白了,這樣我們才能對有監視做有效率的監控。

另外,看了首頁「人員自動追蹤技術」中的"晶片與ptz攝影機的整合",也就是錄製逢甲大學停車場的那一段,ptz攝影機會對影像中移動的人、物進行追蹤,這時我思考到一個問題,用這個攝影機錄製一個人經過的情況時是還好,攝影機能很準確的追蹤目標物直到目標物離去,但我發現當影片中一群人走過時,它會focus最後面的目標物,這麼一來前面的目標物也許在做什麼事情,就無法掌控了,再來,如果在錄製一個目標物的期間,有另一個移動物進入畫面,又該怎麼辦呢?或許是它可以利用其他不同種功能的攝影機搭配應用or遇到這種多個目標物的情況時,它可以轉換全畫面模式之類的,當然這也只是我在猜想而已。

還有在看完首頁"影像視訊融合技術於監控系統之應用"的影片之後,這真的是太震懾了,首先,片頭畫面從Googl earth藍色地球的鏡頭開始一直聚焦…一直聚焦...一直聚焦到台灣交通大學大概十公尺的上空上,你不但可以轉動、拉近,更可以清清楚楚看到人們的在畫面中移動,這未免也真是太太太扯了,這也不難想像為什麼Google earth會牽扯到關於隱私權的問題。

還有首頁的”系統整合影片展示”也是相當厲害,利用多重相機、ptz攝影機、PDA、還有一個伺服器就可以對大樓作智慧型的監控,影片中分成室外環境監控室內手勢分析,室外不但可以對可疑車牌進行追蹤,還可以判斷不屬於本大樓之人員比對資料庫進行人臉辨識異常行為分析,人物移動到下一個畫面的平順轉場技術,還有室內的手勢分析,我想都是相當實用而且完備的,更何況智慧型監控還可以用PDA來控制,相信對於環境安全有很大的助益。

最後我看了"人臉識別最新發展現況"的技術報導,其實有很多都看不大懂,向降維減少資料量跟一些沒看過的理論技術,不過大致上了解了人臉分析可分為整體特徵方法以及局部特徵方法兩種,整體特徵方法就是將一張臉當作單一個特徵來做辨識,而局部特徵方法就是找出臉部特徵器官,鼻子、眼睛之類的,對這些器官做局部的分析然後到最後在把它統合起來得到結果,局部特徵方法會比整體特徵方法具有更高的準確度,可是卻也會有實作上的困難。另外,文章中也提到人臉辨識公認的兩個難題,一是不同光源的問題二是不同角度的問題,光源問題可以2D轉成3D的方式,而角度問題可以用動態影像辨識方法來解決,也就是利用動態影像來建立容許不同視角下的人臉辨識系統也可以利用兩兩前後影像的關係來處理有部分遮蔽的情況,這比傳統的靜態影像辨識還有擁有更多優勢,但文中最後也提到這兩個公認的難題,還是有很多狀況需要去克服,這就有待技術的發展來改善了。

做完這次的作業後,其實收穫真的蠻多的,如同統計老師所說的學習的深度和學習的廣度是很重要的,雖然我並不是想走多媒體這個學程的,而我也只是淺看了一些實際上的應用,理論上的東西都不懂,但也許以後會碰到相關的產品,或是類似東西旁徵博引的應用,我相信多看看額外的東西,我也會有比較多的能力或者是更多背景知識的來面對及處理這方面的情況。

week8

電腦視覺監控產學研聯盟中發現一篇技術報導-人臉模型的個體差異與表情差異, 內容是假設表情可以量化的話,那就可以透過人臉模型,在A的臉上合成出與B同樣燦爛的笑容。現在新的數位相機裡,有一種對微笑聚焦的功能,也是有運用到搜尋微笑的形狀在照片中位置是多少這個原理吧!
其內容還說到表情的產生,是由皮膚下的肌肉收縮牽動皮層而產生變化。網站上有提到兩種量化找尋,[1] Lu Xiaoguang 是以特徵點,其意義有如肌肉與皮膚和骨骼相連之處,紀錄這六個點因為表情所產生的改變,在不同的人臉上加上這些變化,而在人臉模型上有如臉皮一樣的紋理(texture)則以Thin Plate Spline (TPS) 的方式做扭曲。如此可在不同人的樣板上,合成出相似的表情變化。







其[2]是醫學研究告訴我們,人臉共有88條肌肉,我們很難找出所有相連的點來合成他的變化。因此在 [2] 中,Chang 以雙線性(Bilinear)的來組合人臉與表情的變化。



後來一位研究人員 Costen 在 2000 年的研究報告中提出更簡單的方法。他們將人臉的訓練資料再分成四個子集合(個體、表情、角度、光線),每個以PCA來分析其子空間。假設,這些子空間,彼此是非正交(orthogonal)的。那麼,要將人臉分成不同特性的成份時,要能夠讓下式
最小化。 是第 j 子空間中,相對於第 i 個特徵向量的特徵值。 則是輸入資料相對於這個特徵向量得的權重。而在他的實驗結果中發現,個體與表情的子空間彼此的重疊性極少,這個發現即有助於我們能簡單的將他們區分出來。

BCB Programming 遭遇問題與解決過程之描述:

因為我上學期有上過BCB
雖然程式都是與同學們互相討論湊合而成的
然而在程式上有時候會執行錯誤
除了在範例上的程式碼打錯
不然就是標頭檔沒打
或者就是在誇號或一些指令打錯
而第一周所上的視訊程式碼都照範例打進去
打完之後也才發現有些該定義的都沒打上
而且標頭檔也沒有打上去
所以仔細研究講義發現小小的地方都要注意
之後開始嘗試儲存影像
卡在BitmapInfoHead的類別沒被定義
希望有高人指點~~

電腦視覺監控之心得

看完了他們所給的2個影片
讓我覺得科技太進步了
以前的監視器有的還不會動
而且很模糊
但是現在的監視器不只清晰
而且監視器彼此還可以連線
可以進行全面無死角的監控
利用人臉的追蹤
可以判斷此人是否為大樓內登記
可進入的人
還可以判斷此人是否有偷竊,爬行,搶劫
或作一些非法的事這些都可以利用
監視器的智慧監控系統把犯人抓出來
若有人做非法的事他們會對此人
做異常行為分析, 人臉偵測,手勢辨識
追蹤與辨識,能有效且輕易的找出犯人
能達到犯罪預警和事件偵測的目標
若有不明物時監視器會利用巡邏車去
撿查此物品是否為危險物品
此巡邏車還可以藉著手勢辨識系統
利用無線操控的方法
來操控他移動到目標位置
現在無線的監視系統越來越科技化
而且效果也越來越好
改善了居家的安全
也能藉著他們提升生活的品質

電腦視覺監心得

電腦視覺監控產學研聯盟


這個聯盟正好就是我們互動媒體正在做的,視覺監控的部份,看了簡介似乎是著重於保全系統的應用,像是車輛進出的監視,攝影機可以拍攝某車之車牌並自動偵測某車是否為合法登記的車輛,不是合法的變交給PTZ攝影機去追蹤此車出來的人,這裡會用到平順轉場追蹤這項技術,主要是做影像融合的轉場變換,可以達到影像更為平順的目的,若是此人離開轉場的範圍,負責該區的PTZ攝影機將會繼續追蹤此人。
再來就是更厲害的部份了,若是此人留下了可疑物品,將會由全向式攝影機監控次可疑物品,然後把空間座標傳給自動車,由自動車做自動尋航去找尋遺留物,找到後夾取遺留物並送回做後續處理,視覺監控系統大致上可以做到上述的任務,若是此系統開發成功並加以利用,想必可以掀起監控市場的熱潮並對國內的廠商做很大的幫助。
雖然我們現在做的只是小小的視訊程式,可能與保全系統也扯不上邊,但是保全方面也只是視覺監視系統中冰山的一角,像是學校上次辦的視訊控制程式,可以利用視訊感應來玩遊戲,就像是現在市場上當紅的遊戲機wii一樣,這又是另一項應用,而現在這種技術的利用越來越多,想必以後會成為一種趨勢。

電腦視覺監控

去這個網站(電腦視覺監控產學研聯盟)看了後,原本是打算先看技術的,隨意點的其中一個全理論(無圖.又難懂),就先回到首頁開始看影片……..
影片部分:
系統整合影片
先由攝影機判斷進入車輛的車牌號碼,如果沒有,則當車內人進入房子後,用PTZ攝影機開始追蹤>>藉由判斷影像及攝影機追蹤,也有直接藉由與資料庫內的人臉來判斷是否為入侵者,假如此人遺留物品,記錄座標,並派機器人自動去撿取,而這部分如果沒有前面的視覺監控是作不到,並且可以減省人力與危險性
而在數位大樓使用技術,這個智慧監控系統可以做異常行為分析.人臉偵測.追蹤與辨識.巡邏車自動巡邏,這棟算是整合這方面的技術

而在看了技術方面後,發覺這方面的技術(視覺監控)似乎常用到PTZ攝影機?
關於PTZ攝影機~
"PTZ" 攝影機;透過控制雲台,即可對其光圈行放遠、拉近,甚或攝影機機身的高低左右擺動,而焦距亦可選擇手動對焦與自動對焦兩種。
這是拍賣此類型攝影機的XD~有圖
(技術>>監控環境中多台Pan-Tilt-Zoom攝影機的校正與定位
點我看詳細內容>0<
如何使PTZ發揮最大功能,他的優點是判斷方式不同,所以較少的校正點就可以找到目標,以及使用者較容易理解的空間概念(空間概念我不懂就是了....

個人較有興趣的.
全方位安全監控自動車之開發
有些部分,攝影機因為障礙無法照到,解決方法就是把攝影機裝在會移動的機器上,並讓它自動移動監視這些死角,於是有了全方位安全監控自動車之開發,底部是用圓型移動盤…!!還搭配虛擬實境進行偵測危險(避免撞牆.解決不明物品
我會想到星際大戰那之= =....

而攝像機照出來的人臉要如何判斷呢?
彩色人臉資料庫介紹

AR Database、CMU PIE Face Database、FERET Face Database、Ljubljani CVL Face Database、Oulu Physics-Based Face Database是目前較多學者在使用的, 拍攝人臉影像之種類、特色、方式也不盡相同

每種各有其特點,共通點當然就是照人,用角度.光線.笑容.等等照出不同的圖像當作參考,而這些提供人臉偵測與識別技術來使用,除了其中一個用的人數有點多(1208人)之外,其他我覺得人數範本似乎少了點,這類東西不是要越多參考樣本越好嗎?
膚色
人臉識別最新發展現況

由技術方面可以看出,如何能用最少的攝影機達成最大的效果,以及如何去判斷人是這方面的重點,而判斷人有各種不同方式,人臉特徵.膚色,這類型的技術(用攝影機分析.判斷)也可以用在許多地方,像之前上課老師提到的
第3屆由田機器視覺獎>>面板蝦疵檢測的應用,就可以節省許多人力時間.這方面技術的逐漸成熟,也希望帶來的都是好處.人類的安全.事情的便利性

BCB 遭遇問題

在寫第一個開啟視訊的程式時
恩......因為是一開始接觸BCB
所以不太會甚至還panel都不會
所以就ㄑ問同學和ㄑ看書
現在有一點點懂了
一開始第一個程式知道怎麼打但是
卻不知道他的意思
例如:
for(i=0;i<10;i++)
{
if(capDriverConnect(hwndCapture,i))
break;
if(i==10)
ShowMessage("Cant connect to any capture");
exit(EXIT_FAILURE);
}

起初我不知道他的意思
然後就問了同學才知道
原來是檢察有沒有視訊的連接
還有這個程式一開始都跑不出來
因為我少打了
#include

本週問題提問~~

對於WebCAM要讓影像呈現在螢幕上的畫面我已經可以呈現出來了~~那是屬於講義上1.2.1節的視訊擷取方面~~可是進一步道1.2.2節裡的儲存影像陣列部分我試了好幾個禮拜想嘗試去看看是否能把影像儲存在陣列中!!可是一值在執行編譯的時候產生錯誤訊息,一直沒有辦法有更進一步的發展~
像是講義上說可以利用Canvas->CopyRect的指令去複製預覽的影像再透過Bitmap->ScanLine的方法,將元件上的像素輸入到陣列中,可是還是無法成功~~解決方法在跟同學詢問一下!!

BCB

接觸BCB也有1~2個月了
雖然說有去圖書館借相關的書籍
也有問過同學,也跟同學討論過
可是....
還是有不太了解的地方

而且...大多數都是照著程式指令打
可是...還是不太知道其用意及意義在哪
這讓我困擾好久...
有些語法
可以從老師之前BCB的部落格中找到
也可以在書籍或者是網路上找到
但是
還是不太了解

電腦視覺監控之心得

因為監控系統的進步,讓人更加注意safety.security
以及car business,進而發展的智慧型監控系統
監控系統有一特色"由室內延伸到室外"
這樣特色讓我們可以更加可以去注重安全

而在電腦視覺監控產學研聯盟網站中的技術專區中
看到一篇有關臉部表情的偵測與辨識
從那篇報導我知道一些東西,
例如,人的表情可以用不同的方法做分類
可是因為人的表情是複雜的,又加上每個人臉部表情
的強度不同,所以電腦很難辨別人的表情
為了避免這樣的限制而降低辨識率
使用許多臉部的表情(manifold of expressions)作為
表情分析的依據,主要是觀察有可能的臉部表情為基礎

然後透過分析後的路徑及機率
示範合成動態表情
只要給電腦起始的表情及結束的表情
就可以得到從起始表情轉變到結束表情的影片

其實,從這篇報導可以學到許多事情
可是因為報導上的數學分析看不懂
所以有少掉許多東西

電腦視覺監控產學研聯盟 網站研究

這禮拜老師要求我們去看看電腦視覺監控產學研聯盟的網站去看看並發表心得
我在這個網站看了幾部影片的介紹像是:
1.智慧型入侵者監控系統
這部影片主要目的是介紹為針對大樓大戶外與室內進行攝影機與網路的聯合監控,每個攝影機的監控範圍不同,而且更讓我驚訝的是攝影機之間還可以彼此互相傳訊聯繫,像是監控入侵者的範圍已超出此攝影機的監控範圍時會立即利用RS232的方式馬上傳送訊息給下一部攝影機繼續進行監控,若入侵者有可疑物品時還會立即的派遣自動車去處理遺留物品,當然其過程也都是會錄影存證,還有許多功能像是進行車牌辨識和人臉偵測和一些行為不是內建的人員或馬上去進行他的行為錄影,以監控可疑人士。
2.數位大樓監控系統
這部影片是第一部影片的實際去DEMO給大家看,像是在硬體設備就包含了多重相機.PTZ攝影機和PDA平台等設備搭配軟體設備的人臉追蹤系統.外物入侵偵測系統.行為分析系統.人臉辨識系統和手勢辨識系統可以達到智慧型監控,不會對死角之處有漏網之魚,所以對社會上的安全系統維護已經有了極大的助益。
3.智慧晶片與PTZ攝影機整合
此部影片也是做實際去將拍攝的結果呈現給大家看,透過攝影機的技術可以把人臉拍攝的很清楚以及去監試人在做什麼事,畫面清晰流暢,不大會發生有畫面lag的情形。
我的結論是希望透過透過學校所學習的東西希望將來也可以做到像這樣這麼好的技術!!

電腦視覺監控產業研究心得報告

看到電腦視覺監控這幾個字,
便讓我想起到學長姐們做的那個洛克人的遊戲,
那個遊戲也是運用webcan來做擷取玩家的動作,
並將玩家的動作對照早已設定的固定動作,
就可以知道玩家想要的是前進、後退、跳躍,亦或是攻擊等。
但在看過真人示範過後,得到了一個很重要的心得,
既然原理是以玩家跟背景的色彩做比對,
那玩家跟背景的顏色最好要是對比色,
這樣所擷取到的才會是最完整的吧?!
現在對webcan的運用不再只是單純的用於聊天,
更多的運用方式不斷的被研究開發出來,
這次老師給的網站上就提供了很多webcan可以運用的方式,
我找了一個未來可能會最普遍運用的來看。


電腦視覺技術應用於超商監控系統
「超商」是一個24小時營業,而且什麼都有什麼都不奇怪的地方,
大至食物,小至生活必需品,應有盡有,甚至想要收發快遞、傳真影印也都有,
這樣一個匯聚錢財,保全系統又薄弱的場所,再加上半夜一定最容易引來歹徒,
以前,去超商或銀行並沒有規定一定要將安全帽及口罩拿下,
也因為這樣的原因,歹徒更倉狂了,
所以現在只要去買東西,基本上大家都會露出自己的臉孔以避免造成誤會,
這時候,如果有一種系統是可以偵測進來的人若將面貌擋住,則發出警告聲,
便可以為櫃台人員多爭取防備的時間,
這個曾經只會出現在電影情節的事情成真了,
真的有人提出了這個idea,並開始做研究,
它的原因是在某些限制性區域,必須由某些特定人員才能進出的地方,
例如櫃臺區域、飲料放置區域,
其明顯之特徵為進出人員必須穿著規定之制服,
此技術能自動對超商櫃臺限制區域內移動人員的偵測與追蹤,
而且利用"必須穿著制服"之特性,擷取制服的色彩特徵,
對進入者的身分合法性進行判別,
若該人員為非法的進入者,則系統會自動的發出警告、通知與記錄,
提醒安全人員注意,以用來爭取時間、節省人力。

隨著數位化影音技術的進步,及大量資料儲存價格的降低,
加上光學攝影器材成本下降,使video訊號數位化處理更為普及,
未來人工智慧技術會更加成熟,智慧型視訊監控系統也會普遍使用,
若有了這些條件,營造優質的購物環境便不再是夢想,
超商業者也打亮宣傳口號,「全家就是你家」、「有7-11真好」等琅琅上口的口號,
在提供便利性以外,更需要提供安全性,
如此,我們便會有一個更舒適、安全、便利的購物環境。

心得

較有印象的是 目標導向前景物件影像抽取技術,我覺得其概念非常適合智慧型環境架構所需求的保全技術所需求,會特地偵測出-移動或短暫出現且有明顯分析意義的物體-這種目標導向的前景物件抽取大致包含有「畫面式前景/背景影像分離」「區域掃描」「物件偵測」「區域式前景/背景影像分離」和「背景模型更新」等重要的處理模組。嚐試將畫面做出前景與背景的區別算是將較為明顯的畫面加速處理的技巧,區域掃描與物件偵測較像是連串性質的技術,區域性掃描大抵上將畫面處理成小圖每張小圖在去做偵測,看是不是之前已有之物件,或是大幅移動物體。當某一區域影像擁有夠量的前影像訊號以及此區域影像又被判別存在著某種特殊物件時,區域式前景/背景影像分離模組才會被執行來獲得此區域的前景/背景影像。
以此類的技術將影像記憶系統升級為防範系統,但實作方面需求金錢,以廉價的錢來說可能效果不彰。
將影像記憶當作防護,用技術讓電腦自己腮選出最有可能需要警示的物件加以回傳,目前所看到的技術似乎還無法做出更明確的判斷能力。
但能確定的是未來以影像處理當作防護的需求,必定會加高,但是私人覺得此類的技術是不錯,
但有時會太偏向硬體設計忽略軟體,導致技術不普遍,要能拿到最高普及率我覺得才是此類技術的發展方向,應該偏重於高判斷力的技術會是最好的出路。
不管如何,此計劃會加速業界與學術界的資料交流,加深互動關係,真的不錯。

BCB Programming 遭遇問題與解決過程之描述

我多數的問題是我只能看著課本輸入指令,目前正在研究BCB的指令,
實作時多數錯誤在於
指令打錯,這只能叫自己把指令背熟。
有時指令確定都對,但不知道為啥RUN起來一直錯,但重開後就解決了。
後來也試著自己組合指令,指令一長就開始錯誤連篇,看來需要對指令更熟,
我猜是指令銜接問題

電腦視覺監控產學研聯盟

以Particle Filter和NBP偵測人體動作參數
  近年來,在電腦視覺方面,人體參數的偵測一直是一門很熱門的學問,
目前大部分的系統都必需在人體上增加額外的探測器或者是感測器,
因而增 加了使用上的不方便和動輒百萬元以上的使用經費。
我們試著去建立一套完 全建立在視覺方面的系統,只要做一些影像方面的處理,
就可以很輕易的擷 取畫面中人物的動作參數。
如此一來,也符合了方便性和節省成本這兩項要 素。
  

  這個偵測人體動作參數是使用位置和角度這兩樣參數來表示出走路的姿態,
經過擷取的參數 與資料,雖然這是使用參數來表示,但是,
所謂說的參數我們應該還是不太理解,還有待去更深入理解。
透過這些資訊,也就可以很準的預估人物的動向,甚至宿舍在哪裡 。


人員記數系統之實作
  在數位影像的研究領域之中,紀錄位於重要區域之人數及其活動是相當 重要的。
應用在特殊區域的人員控管(生態保護館或特殊實驗室),
若使用不 同的Pattern則可應用於交通系統監控車流量,及事故發生。

  

  視覺監控是現在及以後將普遍流行的系統 ,若再加上有完善的計畫和方案,
監控市場 也將成為重點產業。這次的作業讓我見識了很廣,
平常根本不會想到有那麼 多的用途,平常甚至覺得可能沒有什麼用途,
很多都是沒有想到的,沒想到 配合現代的科技運用到的地方還真多阿。
了解現在監控市場的發展情控和動 態,甚至是未來的演變都有了新的概念。

心得2

這次的作業是要去看看老師說的電腦視覺監控產學研聯盟的網站裡面幾乎都是影像方面老師貼在上面的就是簡介的成立宗旨嘛我在技術專區找了"手持移動光源之偵測與追蹤"來看這個主題是在說如何在黑暗處找到有亮光地方的位置
他是利用背景相減法來找出有光源的地方
首先要先建立背景的模型,然後再用背景相減法來偵測光源的位置
而這項技術主要是在黑暗中使用
在黑暗中每個像素點的顏色變異數比較小,如果使用背景相減法的話
會因為像素太敏感,就算有一點點顏色的變化,也會被認為是背景像素
如果把門檻訂的太高的話遠處的移動光源也常常會被認為是雜訊
所以他利用雙重動態門檻值將畫面像素點大致上分成三類
前景點,背景點,模糊點
前景變異區太小的話那些模糊點就會被歸為前景像素點
如果變異區太大的話就歸為背景像素點
這項技術還用了兩個東西實驗
一個是打火機一個是手電筒
但是不同的光有不同的特性,打火機的變異區比較規則,手電筒的話就比較不規則了
打火機實驗室利用火燄大小和距離遠近分成四種情形
近距離大火,近距離小火,遠距離大火,遠距離小火
然後利用光點源數量和光暈點數量的比例來找出拿打火機人的位置
手電筒的光常常會反射,所以很難找的到光的位置,手電筒光源和位置也分成四類
近距離直射,近距離偏射,遠距離直射,遠距離偏射
一樣利用光點源數量和光暈點位置來找出手電筒人的位置
這項技術可以利用在晚上用監視攝影機找出犯人的位置
晚上的時候常常會有小偷因為太暗了拿出手電筒或是打火機找路
這時候監視攝影機就可以用光點的位置來找出犯人的位置也可以找出犯人離監視攝影機的遠近
不會因為太暗而不知道犯人實際的位置

BCB Programming 遭遇問題與解決過程之描述

大家合力完成這個程式
原本不會寫的人也練習到了
原本會寫的人也複習到了...更加熟練

程式裡出現一個非常不必要的錯誤
..我把誇號 用錯了
這個錯誤找了好久
才找到= =

完成這個程式遭遇到的最大困難
還是程式問題
有些地方都不大清楚
透過同學上去解釋.有些的了解
其餘的很多都是自己要去下功夫的

這程式畢竟還是有課本.同學可以參考
所以 很容易完成
想想..萬一沒課本勒...
我們更應要訓練到可以有自己解決
自己突破的能力

BCB Programming 遭遇問題與解決過程之描述

這個問題問的好.....
話說程式我照課本上的去打......
但是....
就是會出錯阿....= =
有時候是因為標頭檔的問題...
有時候是因為打錯一個字的問題....
最大的問題就是.....
假如沒給我範例....
我有時根本沒想法.....
我想....
在打程式這方面....
我還是要再多家努力才行

至於解決辦法....
我想對於我來講...
除了多練習之外.....
沒其他辦法了吧.....
畢竟這是因為不熟才會出現的錯誤......

心得

看了其成立宗旨,有段話我很有印象就是:如何賦予視訊安全監控系統更多的智慧型功能,以期能防患於未然
我在想,假如未來機器真的能夠偵測到將有危險的事情發生了,而能夠阻止其事件發生,那這種機器能不能大眾化我想也是一個重點,還是說只有幾個比較大規模的公司有錢能買的起這種機器,那這樣或許就沒有達到其真正的意義了吧,當然這只是我的想法而已啦,或許在其他地方這種技術還是有很大的發揮的空間,但是在我的想法中,這種系統就是要讓大眾方便的。

看到展示影片,我對行為異常偵測系統很有印象,因為我在想,機器是要如何去分辨人的行為真的是異常了呢,或許只是在嘻笑打鬧而已,但卻被機器認為是異常行為,那不是很悶嗎,哈哈,這只是我亂想的而已啦,在逛完了他們的網站之後,我突然又有種想法,一樣的,假如來機器能夠偵測到將有危險的事情發生了,而能夠阻止其事件發生,那是要如何去阻止呢?說明白點好了,機器偵測到嬰兒在大樓的窗戶旁邊,即將要掉下去了,那機器能做什麼呢?緊急通知守衛室的人?還是說室內安全巡邏自動車伸出機器手必去接住那嬰兒?我想這都是人們需要去花很多時間研究的吧,說到室內安全巡邏自動車,我對那個很有興趣的說,因為感覺很像在玩遙控車…..哈,開玩笑的啦,真正感興趣的是在於它能夠去紀錄地圖,而且能夠用視訊轉成方程式去分析房門是否有開啟,這是我比較訝異的地方,因為竟然能夠用方程式去分析房門是否開啟,這是我做再多夢都想不到的;然後在我看完很多東西,說句老實話,我覺得裡面比較有可能大眾化,以及最實用的,應該就是監控系統裡的人臉辨識系統吧,在徵測到陌生人時PTZ攝影機就會監控著那個人,使那個人就算想犯罪,也無所遁形。

在這數位科技越來越發達的時代裡,並不是只想著如何讓生活越來越方便,也要想著,既然科技都那麼發達了,那安全問題是否能隨著科技的發達而減少呢,在看完這網站之後(基本上沒全部看完啦…太多了吼…)我想人們開始注重到了安全問題了,或許只是剛起步,所以成就以及能顧慮到的事情比較少,但我相信只要肯繼續的研究下去,在未來事件發生的機率一定會大大的下降的。

BCB Programming 遭遇問題與解決過程之描述_95360211

我之前也有跟我同學遇過同樣的問題就是#include在#include和之間要空格執行才會過。還有 capPreview(hwndCapture,true);這一行不太懂?有向同學請教,主要目的是要讓畫面秀出來,視訊擷取部分已經可以秀出了。其實大部分的步驟和解釋講義裡頭都有講解,要再多去理解每個函數的功用,都記不太熟。

BCB視訊擷取

在打程式第一週的時候呀

先是照著講議打好了

卻發現一堆bug 好多東西沒有定義

後來問了一下 已經弄出來的 才知道原來有個標頭檔vfw.h

要給它丟進去 果然 就可以由BCB連線到視訊嚕



但是後來一直嚐試要把擷取照片寫出來 又一脫拉褲bug

總是卡在BitmapInfoHead的類別沒被定義這個問題

也改過滿多地方 嘗試滿久的 還是不知道要打些什麼



最後終於發現了 某同學用的文章 借用了他的智慧

他在部落格說的引用Clipbrd.hpp 副程式

用Clipboard函數來完成了影像擷取的部分

後面有一段for迴圈的部分沒打就可以成功了

後來終於找到了 原來之前一直沒注意到 要的答案其實都在其他函數裡面 就是要

static BITMAPINFOHEADER 這個東西

加上去到前面共用函數就可以了

然後再利用老師的講義 把調整影像大小的程式打出來 就完成現在的作品嚕

雖然還有些有待改進

EX: 每執行一次只能調一次大小 , 改小之後的panel有殘影



雖然幾經幾番波折 終於寫出來了

不過滿想知道 影像擷取後面那段for是不是多餘的 還是說其實另有作用...
目前猜測是之後儲存影像要做比對的時候會用到吧..

又是心得

現在進度只到視訊擷取,每個程式碼我都照著講義打,RUN出來還是有錯誤,結果是標頭檔沒加上,原來這個標頭檔(vfw.h)是讓程式與視訊裝置連結。剩下其他的錯誤就是大小寫了,因為是照著講義打,沒有什麼太大問題。

電腦視覺監控產業研究心得報告

去看了老師提供的這個網站後
找了一篇物件偵測的來看
標題:淺談於視訊中進行物件偵測與物件切割技術
裡面內容大概是說追蹤一個東西時,先把他本身的像素資訊所紀錄
然後在追蹤時可以只尋找東西本身的像素,忽略背景,以減少背景的干擾與變異

===========================================================

段落擷取:近年來,有許多研究將這兩個領域做整合,以提供視訊中物件偵測與物件切割。在此一領域內大多使用example-based的方法,亦即由訓練影像中找出物件的特徵區域,並用Codebook來描述該物件的特徵關係

===========================================================


所謂CodeBook,指的是一群CodeVector或CodeVector的集合,而我們最終的目標,便是以這些挑選出來的CodeVector來代表該空間中全部的資料向量。(此資料是我去google找的)

ps:我不知道CodeVector的代表意思 google無法翻譯 yahoo說沒這單字....


要如何分辨物件,是利用區塊間的相關性(Normalized Grayscale Correlation)與群聚(clustering)
的方式來分群,來分割出該物件的輪廓,再來比對投票,利用投票最高的圖案來分辨該物件,雖然現在還有許多不成熟的地方,例如改善偵測的正確率及偵測的速度等等

以下為分割出的例圖

車輛影像及其特徵點











牛的偵測及其前景切割結果





BCB Programming 遭遇問題與解決過程之描述

前些日子,
我的學習進度,
是到1.2.2的儲存影像陣列.

當時因為某樣東西沒宣告,
所以, 一直跑出以下的錯誤訊息:
Undefined symbol 'BitmapInfoHead'

1.2.2並沒有多加說明'BitmapInfoHead'是屬於哪種型態??
一時之間...
我也不可能突然會寫.

無奈之餘...
我也只好將實驗教學手冊,
再向後翻翻看,
找找看有沒有什麼可用的程式.

雖然不確定是不是用在這種情況.
但是在1.2.3有行程式碼是這麼寫的:
static BITMAPINFOHEADER BitmapInfoHead;

原本只想要隨便試試.
說也奇怪...,
就這麼巧,
錯誤訊息就這麼消失了.
我想...
該不會'BitmapInfoHead'就是要宣告成' BITMAPINFOHEADER '吧!

雖然還有不少地方,
我還看不太懂.
不過我會慢慢去試,去體會的.

心得

數位時代的來臨,使的數位影像監控設備慢慢取代傳統類比式錄放影機,監視系統所攝取的影像或視訊訊號已成為警察辦案的重要根據。「安全」、「監控」已變成現今重要的產業,吸引了無數廠商積極投入市場。
視覺監控尖端技術多年的開發,整合出不同與日常生活相關的智慧型人機介面應用系統,大致可分以下幾種:
(1) 人臉偵測系統:這系統是先對人的臉部做一次多階層過濾,截取出來的影像和人臉進行對比,高驗證出來的比對值將會被輸出。
(2) 物件追蹤系統:這系統是先得知一個影像,利用一些法則和演算法來追蹤此影像的位置。
(3) 人臉辨識系統:由視訊產生多張影像特徵,再結合多張影像辨識的結果來決定最後的輸出。
(4) ATM人臉遮罩偵測系統:根據人臉偵測得到五官位置,在人臉的一小部分進行偵測,如果選取的部分沒有被偵測出來,則處於遮罩狀態。
(5) 有氧熱舞機:本系統是利用遊戲介面與玩家作互動,透過攝影機擷取玩家肢體動作。
(6) 智慧型簡報系統:此技術可以增進會議簡報的流暢度。

這些影像監控設備的開發,為的都是因為社會上的竊盜案件,但影像擷取出來都並非很好的成效,有些地方還是需要加強改善,如需要改善大致可分為三個部分來討論,影像來源、影像處理、影像應用。
(一)影像來源部分:當然是要具備影像清晰的攝影機,傳統的攝影機除了色彩單調之外,還有解析度不夠與無法因應特定環境的問題。可用紅外線攝影機、日夜兩用攝影機、光學攝影機。
(二)影像部分處理:可歸咎3方面技術,「類比轉數位」技術,「壓縮」技術,「貼圖」能力。
(1)「類比轉數位」技術,主要是由「畫素深度」來決定。

(2)「壓縮」技術,除了檔案壓縮比與品質需考量之外,檔案造成處理器(如CPU)的負擔程度也要考量在內。

(3)「貼圖」技術,當影像輸入到監控系統時,會在將圖片貼到系統上時針對顏色、亮度、明暗、對比與影像投射等面項來做調整。
(三)影像應用部分:再好的監視產品最後還是由人來操作使用,以下功能是比較常用到的。
(1)夜視:如果可以用演算法在黑夜中辨識物體,這會是一大進步。
(2)搜尋:傳統功能必須要一卷一卷慢慢搜尋,如能大範圍搜尋就能節省精力。
(3)遠端監視:如果能進行同步收訊,像是管區警員人手一台PDA隨時監控轄區內各個攝影機的動態,就可以大幅增加警員巡邏的範圍與效果。

BCB Programming 遭遇問題與解決過程之描述

BCB碼 最有問題的地方大概就是除錯吧
程式碼可以去找來用複製的
不過小地方比較需要注意 大括號 一些符號比較需要注意
課本上的程式碼只是參考用 如果照打應該很多ERROR吧@@
畢竟程式碼一堆 總會東漏一點西少一點

解決過程不外乎問同學 看哪裡出錯 或者是重新複製
這是我最常碰過的問題
其他的話 只要程式碼對了 都還沒啥大問題

對我而言這問題還是最困擾我的

2008年4月9日 星期三

是要寫閱讀心得了

●電腦視覺監控產業研究心得報告 ●

【自 911 事件之後,
視訊安全監控已成為全球極受矚目之技術研發領域。】
這個...如果說是視訊安全監控拍到飛機要撞上來了,
大樓也不能閃掉啊!!!
可是卻成立「電腦視覺監控產學研聯盟」,
很酷很酷,賓拉登會嚇到!!!


逛了他們的官方網站,東西真的很多,所以我看了很久,
應該是說文章很長一篇,視訊真的是越來越發達了,
以前人家遭小偷或是在學校東西掉了,都只會想,剛剛有誰來過這裡,
現在就算不知道有誰經過那邊,也可以藉由機器,
明確的指出誰是有嫌疑的人,但是常常看新聞的時候,
他們所說的監視器畫面,都超級模糊的,
而且也都單一角度拍攝,當畫面的人物離開這個視訊裝置的範圍後,
就看不到他了,常常是辦案的一些絆腳石,
明明拍到了,卻是那麼的不清楚,
不過現在的技術正在改善,已經由傳統單一攝影機,
改變為多攝影機間進行目標物追蹤,
這樣擴大了監視的範圍了,不過相同的成本也是提高了。


我還看到了這篇↓
臉部表情偵測與辨識 (on manifolds)



這篇很有趣,它可以偵測人的臉部表情,
例如眉毛上揚啊等等的,這個我覺得真的很難耶,
或許偵測眉毛是比較簡單的項目,但是其他的表情真的是很難,
人的表情有千百種,我們之前在討論專研的時候,
也說要用視訊擷取臉部的特寫照,然後說想把它轉成可愛的人物照,
是還沒有開始著手嘗試著做,不過,覺得頗難的啦!!!!
拍照光線的問題啊,還有膚色的問題啊!!
擷取是很簡單,可是要把它轉成可愛的人物照,
我們真的是有點異想天開說!!! 哈哈哈XD

還有一篇是跟我們講義相關的↓
淺談影像監控之背景建立技術
這個跟上次學姊的專研那個也有相關,就是建立背景,
這個要考慮的層次更多了,像上次在試玩的時候,
就發現有蠻多的問題的,
當背景不單存的時候,是不是建立背景的時候,
要更加細膩些呢,每秒鐘擷取更多的畫面取平均值做背景,
(其實我不確定這樣做是不是效果會比較好,只是自己在想!!!)


其實我沒有全部看完,不過這網站可以看好久好久!!!
之後再慢慢看吧!!!!XD

所以我的心得到這邊就結束啦!!!!

電腦視覺監控產業研究心得報告

電腦視覺監控產學聯盟的官方網站,( http://cvasso.no-ip.org/index.aspx )
還蠻多內容的.
所以我就挑其中一則來看.
課堂上,有上到截取視訊畫面.
我挑了一篇關於攝影機的論文,
截取一小部份出來看.

-----------(以下為部份截取內容)------------------
Stauffer與Tieu [14]將目標物追蹤問題可廣泛定義成找對應關係的問題,並將其分成三類:(1)不同時間畫面的目標物對應 (即單攝影機的目標物追蹤)、(2)有重疊監控區域的多攝影機間目標物對應、(3)無重疊監控區域的多攝影機間目標物對應。以圖一為例,第一類問題即當有人A進入Cam 1的畫面時,直到A離開Cam 1的監控畫面之前,系統需能持續追蹤該目標物A。第二類問題發生在Cam 5與Cam 6,此二台攝影機有部分重疊區域,當有人出現在該重疊區域時,系統需判別兩台攝影機所分別追蹤的目標物是否為同一個人。第三類問題以Cam 3與Cam 5為例,假設有一個人A從Cam 5的監控畫面離開,過一小段時間之後,有個人B從Cam 3的監控畫面出現,系統需判別A與B是否為同一個人。

圖一、監控環境平面圖與攝影機取像畫面
資料來源:
http://140.113.87.114/cvrc/edm/vol_19/tech2.htm
-----------(以上為部份截取內容)------------------


我覺得要攝影機”追蹤”,
在實作上好像也有一些困難.
如果只有單一目標物進入攝影機的監控畫面,
要分辨一個人A從Cam 5的監控畫面離開,
過一小段時間之後,
有個人B從Cam 3的監控畫面出現,
系統需判別A與B是否為同一個人,
應該會比較容易.
不過現階段,如果要我寫出”追蹤”,
暫時還寫不出來吧!
關於”追蹤”,我還沒有什麼想法.
感覺上,
如果要偵測的數量變多的話.
在辨別上,又會更困難了吧!

論文裡,還有提到.
多攝影機間的目標物追蹤研究,
還有需多問題待解決,
如:開關燈所造成的光線環境突然改變、
目標物離開一段長時間又進入監控畫面等…,

我在想…
對攝影機而言,
開關燈的光線差異是整個畫面都有變動吧!
而有異物進入畫面中,
我覺得不太可能填滿整個畫面吧!
或許需要扣除整個畫面都有變動的情況吧!(我猜的~)

電腦視覺應用於監控產業心得_95360211



就像電腦視覺監控產學研聯盟的成立宗旨一開始所說的自 911 事件之後,視訊安全監控已成為全球極受矚目之技術研發領域。 我們現在也可由新聞得知監視器幫助警方辦案,例如有車禍發生而肇事者逃逸,都可透過監視器找出肇事逃逸者、也可找出犯罪者,不過都僅止於案發後的調查,現在呢是要做出事前也可以預防犯罪的發生。

而我在電腦視覺監控產學研聯盟裡有看到智慧監控系統有介紹異常行為的分析、人臉偵測、追蹤與辨識、巡邏車自動巡邏。室外環境監控系統、室內手勢辨識,智慧型視覺化環境監控系統。而系統的特色是分散式系統、client/server架構、網際網路溝通,由此可見不單單只是多媒體層面還和網路層息息相關。設計這些系統主要也有針對大樓戶外與室內進行攝影機網路的聯合監控,幫助警衛犯罪預警,這也是幫助警察,達成警民合作。而智慧監控系統的特色是由室內延伸的室外。

其中我覺得很酷的是,若有可疑物品全向式攝影機會根據空間座標,就可以自動派自動車前去處理遺留的物品,這樣也可確保安全以免發生危險。還有我也看到了PTZ攝影機是為自行開發並內建嵌入式軟硬體系統的攝影機,就可有無死角的空間影像了。而且結合了PDA讓大家可以隨時隨地的掌控,增加了許多方便性。

這些智慧型系統真的為我們的週遭的安全大大的提升,和透過視訊安全監控希望以後我們的治安能越來越好,為更多可能犯罪的事減到最低的傷害。

week7:

在老師的指令之下,逛了名叫電腦視覺監控產學研聯盟的網站,

發現到在現今社會裡有關於視訊影像處理的研究蠻多得

跑去電腦視覺監控產學研聯盟的技術專區看了所有的研究報告及用處,

發現裡面對於未來的實用性非常非常的高!!

而其中有個研究名叫全方位安全監控自動車之開發

自動車可以幫助巡邏車在巡邏地點時遇到遮蔽物,

能夠閃過這些遮蔽物而將巡邏地點看得一清二楚,

而自動車能將紅外線和超音波感測器用於偵測障礙物,

此外有偵測氣體的感測器,還有攝影機系統用來辨識環境影像,

頂部架設環場攝影機用來呈現360度的場景,

這個研究裡面的數字,

我也完全看不懂= =

Cross-Ratio為基礎之自動車夜間視覺定位

它的應用包含了如自動導航、安全巡邏、保全物品偵測、居家看護與家用機器人等等。

尤其是在保全監控方面,以智慧型自動車替代保全警衛,

不僅節省人力也降低成本,而且自動車可一直重複同樣的工作,

降低因人員疲累所造成的人為疏失,

同時,

經由自動車上攝影機的影像,

更能提供機動且全方位的動態監控,

解決固定式攝影保全的視覺死角問題。

這個研究如果成功,對於未來的事故也能一一減少,

但也沒有想到,需要考慮到那麼多因素,

連距離、角度、以及無線網路的連線都要考慮進去,

只能說這個領域離我好遠阿!!

而裡面的以光影流技術穩定數位影像序列之位移及轉動現象

不知講義裡面的1.4一不一樣??

因為也有討論到光線….

心得1

上學期沒修到
所以看旁邊有些上學期有修的朋友就覺得有點緊張
因為他們會我不會
一開始都還不知道怎麼下手
都只是在旁邊看朋友寫程式
還有玩那個視訊
也還沒動手操作看看
電腦也還沒灌BCB
我看要找機會灌一下了

電腦視覺監控產學研聯盟報告,心得

我先進去看了”技術專區”的動態物體偵測、追蹤與紀錄系統,主要針對保全系統來研發這套系統,不過在於軍用方面我想也是一大技術,這讓我想到一部電影,有一種外星生物叫掠奪者,他會偵測會動且有體溫的物體,進行獵殺,我對這套系統感覺還蠻有興趣的
此技術特性有三大類別:

1.適應性動態背景建立

背景重建技術,改善了傳統動態物體偵測技術的缺陷,大幅提昇影像辨識準確度。我看了一下影片,裡面車流量很大,我想此技術是要偵測特定物體的第一部,會讓其他不偵測的透明化

2.動態物體偵測技術:
快速動態物體分離技術,夠提供更完整之動態物體,且更能有效降低雜訊所造成的干擾。而動態物體的完整性,對於後方的動態物體辨識系統而言,這是一項會造成相當程度影響且不可或缺的重要因素。
我認為這會讓特定物體更容易去觀察

3.物件辨識技術:
智慧型物件分類技術,提供監控系統更強大的判斷功能,可預設針對不同類別的動態物體(如機車、人員、車輛)做出不同的反應。而有效的分類,能讓監控系統對於道路十字路口的汽機車流量更有效地統計及管理。我覺得這真的是太好用的技術,因為還可以統整,分類,更加好管理
這些技術可以印用在社區公共空間,電梯口,停車場,交通監視系統….等等


這網站有許多還未成熟的科技,做為一個資工系的學生,我想我們有義務去了解,對於未來科技的發展有更進一步的了解

心得

1-2.1
有個地方嘗試與驅動程式連線的看不太懂,老師後來改得比較看得懂
if(capDriverConnect(hwndCapture,0))
這樣改不但較簡短而且比較容易了解...

1-2.2
發覺自己根本沒放>>additional>>image
宣告的部份,有宣告的話大慨可以減少一半以上的錯誤
static BITMAPINFOHEADER BitmapInfoHead; int k,j,i;~此類的
如同第一個單純的視訊擷取,這部份就自己來>.<
1-2.2的前面2個目前還不太行


第3個





這是目前的部份
要把程式裡面的部分提到上面
LPVIDEOHDR CaptureData;>>
capSetCallbackOnFrame(hwndCapture, NULL); return 0; }
中間省略
其他部分放進去,記的宣告就可以了
至於要怎麼看有沒有儲存到..目前努力中= =+

都是心得?

電腦視覺監控產業研究心得報告
前幾天有看一部電影,叫做"時空線索",他裡面運用到了有關臉側偵測,就是用了一半的臉去拼湊,然後找出符合的人;還有視覺監控的東西,當然裡面是還滿誇張的,因為他是用監視器的內容來監視有沒有可疑嫌犯,但是整個也太清楚了,可以無距離的很貼近人臉也很清楚!當然未來也有可能可以這麼厲害@@
人臉識別最新發展現況
基本上人臉辨識可以分為兩種主要方法,一是整體特徵方法,一是局部特徵方法。
整體特徵就是用整張臉去做判別;而局部特徵是指用臉上比較特別的器官(眼睛ˋ鼻子ˋ嘴巴等)。人臉辨識目前公認存在的難題有兩個,一是不同光源的問題,一是不同角度的問題。
看上面的研究,就算是角度不同,臉部的比例不會因為這樣就改變。但是光線的不同,就會因為偵測不到而有所改變。像是太黑阿,五官比較立體的,就會因為光線ˋ陰影而照成誤判(但如果像是女生化妝化的很OVER的時候,他也會遇到同樣的問題嗎?),這也是這篇提到的問題,要克服光源的問題,我們現在要寫的BCB也會遇到!
室內安全巡邏自動車系統簡介
自動車擁有和人一樣可以判斷距離的能力,我們使用2D mapping的方法讓自動車可以透過影像所看到的場景就能推算出影像中某一點和自己的相對座標。這樣在外面也可知道家裡的狀況,特過這樣可以巡邏的自動車,就不怕會有死角沒被照到,但是,如果他太靠近一個地方,不就沒辦法拍到上面的景象,這樣也算是死角嗎?因為好像不能整個轉到上方監視。雖然說他可以辨別門有沒有關的景象,但是他拍到的近距離,也只能侷限於很低的位子,跟全方位安全監控自動車之開發的車比起來,全方位的視角比較多,死角也會比較小,但是就比較大台,活動就沒辦法那麼靈活了,其實要克服的問題還有很多,像文章後面有提到還要更精進的研究,入侵者的偵測與火災、煙霧危險情況的判斷。
BCB Programming 遭遇問題與解決過程之描述
寫程式,不可能完全照著講義上打,因為我打過之後就發現其實要多寫一些什麼之類的,不然compile的時候一定會一堆問題出現,像標頭檔,或是變數之類東西,講義不會多加去寫,畢竟有些是自己就要會的!
程式碼的部份...還要問問別人吧,畢竟我不是很厲害的人...請教別人,自己回去練習,這就是最好的方法@@

電腦視覺監控產業研究心得報告

大部分對於居家環境與公共空間的視訊安全監控,主要還是採用被動式的錄影方式,此聯盟成立目的就是希望能藉由視訊安全監控系統達到防範未然的效果,並能達到以下計畫:
分項計畫一 :以視覺為基礎之區域進出管制與安全巡邏系統 。
分項計畫二 :以視覺為基礎之空間監控與入侵者偵測 。
分項計畫三 :以視覺為基礎之行為分析於看護服務之應用 。
以目前的技術來看,我覺得要做到監控和管制的功能並不是件難事,只要鎖定同一個東西就好了,但是如果要電腦自行分析一件物體或動作就有點困難了,因為有很多東西或動作都很相似。在電子報裡我主要看了兩篇,其中一篇是關於多攝影機間進行目標物追蹤,裡面主要分三個問題:1.當有人進入攝影機畫面時,系統需能持續追蹤該目標物。2.二台攝影機有部分重疊區域,當有人出現在該重疊區域時,系統需判別兩台攝影機所分別追蹤的目標物是否為同一個人。3.在無重疊監控區域時,當目標物離開其中一個監控畫面,過一段時間後進入另一個監控畫面時,系統需判別是否為同一個人。 另一篇是有關將一般型CCD攝影機與手動遙控之PTZ攝影機結合在一起,藉此能夠將距離較遠之目標進行控制攝影機拍攝之角度及放大倍率,達到拍攝目標物之清楚影像。看完這兩篇,我感覺這些技術比較適合應用在監獄裡或是警方跟監別人,如果用在一般地方,感覺有點侵犯到別人的隱私...

聽說寫完程式要來這邊玩一下

●BCB Programming 遭遇問題與解決過程之描述●


這個問題其實我上次就碰到了,那時候我以為是我電腦的問題,
我在按鈕的地方打了個X,是因為我只要開啟調整解析度的視窗,
是可以調,然後也可以按【套用】,但是。。。
重點是我不能按【確定】【取消】
然後就只能ctrl+alt+delete把它關閉,
上次我寫到這邊就關掉了!!!!!!
不過這次在寫一次,結果還是一樣!!!
我記得我在學校寫的時候並沒有碰到這個問題!!
我就把程式傳給GG同學,叫他幫我試一下,
結果真的是我家的問題耶!!!
是因為視訊裝置的不同還是電腦的問題呢?
我到現在還沒有研究出來@"@


這次擷取畫面的按鈕也寫好了,然後我多加了一個東西,
就是把擷取的畫面儲存下來,
按照講義【1.2.2儲存影像陣列】上面的程式碼,
可是我改了很久,還是沒有找出到底是哪裡出了錯,
最後我參考了同學的程式碼,去試試看,它用的不是講義上的,
而是下列的短短的程式碼
capGrabFrameNoStop( hwndCapture );
capEditCopy( hwndCapture );
if( Clipboard()->HasFormat(CF_DIB) )
Image1->Picture->Bitmap->Assign( Clipboard() );

為了將照到的影像做處理,capGrabFrameNoStop
可以擷取靜態影像放入系統緩衝區,
並且不停止顯示視訊裝置的擷取內容, 這樣才會有影像不間斷的效果

這是我在奇摩搜尋的時候發現的↓
http://www.csie.mcu.edu.tw/~yklee/Blog/NPRV1.doc
這網址還真熟悉!!!!!!!!

所以我現在程式是寫到:
1.可以調整解析度
2.可以擷取目前的影像 (陣列)

下個目標:
完成講義上的【建立背景】還有【偵測異物】

電腦視覺

逛了網站 發現似乎滿常有影像處理方面的演講 在各地舉行...

而在他們的技術中 覺得最有趣的是"全方位安全監控自動車之開發"
不津想到 一個大公司裡 有一台機器人悄悄的跑來跑去 頭伸來身去的 感覺就很有意思
他可以偵測聲音 可疑動作 甚至都可以分辨味道了 感覺真的頗新鮮的
不過不知道若是發現異狀 它能不能發出警報 不然只是在拍 都只是拍經過而已 不能當場解決...
如果是有東西燒起來呢? 如果瓦斯外洩呢? 不知道能不能做出些對應的反應說...



裡面的原理介紹得知 發現東西失竊或者有什麼異狀

是由原先機器拍下來的許多照片 一直在拍 比對畫面中的樣子

發現到同角度 卻有東西變了 就發現了異狀

不過話說... 裡面的計算公式 看到就頭暈 有看沒有懂 哈哈...



這篇文章可以知道 做識別的方式就是 將一個人的臉 由不同的角度拍下好幾張

甚至可能轉不到5度角 就拍了幾十幾百張照片的狀態下 加以比對 相似度到達某個點

的時候就算辨識成功了



這篇文章得知可以用數學公式 比如座標 來做出表情的模擬

不過 這張圖我很多臉不知道那是什麼表情...

經由這次機會剛好了解到了許多影像的事情
,之後的課 或是影像處理上 甚至是專研上的一些部分 ,可能有很大的機會可以用到吧....總之..這次看文章的收穫真的滿大的...

WEEK7

2.電腦視覺監控產學研聯盟
我先看了電腦視覺監控產學研聯盟 的成立宗旨,我很好奇911事件跟他成立有什麼關西,讓我好奇的是攝影機有什麼辦法可以阻止飛機撞大樓?介紹中還有提到,此技術為了配合不同的應用領域,而提出了三項計畫,分別針對 1.區域進出管制與安全巡邏系統 2.空間監控與入侵者偵測 3.行為分析於看護服務之應用,雖然說跟我修這門課的目的不太一樣,原本以為會直接以遊戲為主題切入視訊裝置和視訊軟體的應用,但在上過幾次課後,卻發現不是如此。但是還是有些收獲,在上過幾次課後,我發現,原來遊戲視訊的原理,跟攝影監控的裝置,原來是一樣的。

對於視訊聯盟所提出的三項計畫,我個人覺得還蠻實用的。 計劃一,針對區域管制和巡邏系統,我想可以應用在社區人口的出入,或著是將警察巡邏的工作,交給監視器,原本需要大量的人力,使用監視器的話,只要由少數人來看管攝影畫面,看看有無發生異狀,在前往該地即可,可以省下大量的人力資源。 計畫二,空間的管制,和入侵者偵測,我覺得目的和計劃一差不多,不知為何不將兩計畫合併? 計畫三,我覺得行為分析這種應用不太實用,如果我綁鞋帶或著是深個懶腰,警報就會響起,那樣的話我覺得非常的不必要。看護的功能,還蠻不錯的,最近新聞常看到保母凌虐小孩,如果父母可以隨時使用PDA查看家裡的情況,就能夠更放心。 總的來說,個人覺得這三項計畫都差不多,不知是以怎嚜樣的觀點來區分這三個計畫,為何不能將同樣的攝影裝置,應用在多方面?

「系統整合影片展示」影片一的部份,個人對於遺留物的偵測與夾取覺得很神奇,還蠻新奇的,如果有疑似炸彈的遺留物的話,透過機器去夾取,也會非常得安全。影片二的部份,手勢辨識系統映像很深刻,影片中的人拿著紅外線雷射筆照射畫面中的地方,機器就會走過去,不知道是如何辦到的。這種功能很不錯,如果有監視器拍攝不到的地方,可以透過此方法,讓機器去察看。可以避免有拍攝不到的地方。

「人員自動追蹤技術」-現場實測展示,讓我印象最深刻的地方,攝影機可以藉由手動的方式
改變偵測的對象,大大的提升了攝影機的機動性。可以避免在案發當時,歹徒突然衝出,而攝影機卻鎖定在路人身上,可以藉由手動的方式,將目標轉移。

影像視訊融合技術於監控系統,已前在網路上,可以找到透過衛星拍攝自家的屋頂,但沒辦法精細到連人都看到,看完這影片後還蠻驚訝的,沒想到線再技術竟然可以做到連人的動作都拍的一清二楚,對於打擊恐怖組織或在打仗的時候非常有威脅性。

視訊攝影技術,隨著時代的發展,而越來越成熟,從以往的固定式攝影機,到現在連衛星都可以跟它結合在一起。小則用於居家的防盜或看護系統,大則用於國防事業,視訊攝影技術的發展,具有高度的擴充性,而其中所隱含的是無限的商機!

電腦視覺監控產業研究心得報告

一開始我先看的就是這個聯盟的成立宗旨,它寫到目前視訊技術最主要發展的方向就是在視訊監控這一方面。目前的計畫想要將大部分只會錄影的被動式錄影機,改成智慧型攝影機,可以有更多的功能,主動去防止事件的發生,而不是只有等事件發生後拿影片來調查而已。為了讓這個計畫的研發方向可以配合國內廠商的需求,以及將研發成果轉移給有需求的廠商,所以就成立了這個聯盟,以加強產業界與學術界的互動與交流。

我還有在這個網站看到很多碩士他們的論文題目,大概看過去都是跟生活上有關係的,不是只有一些理論而已。我覺得那些題目的感覺都很酷,跟那些美國電影的有點像。像是"以電腦視覺自動車作室內安全巡邏"、"影像式火焰與煙霧偵測"、"人臉擷取與應用"、"虹膜辨識系統"等等。沒想到一個攝影機除了路大門口之外,還可以用到這麼多方面上。像是自動巡邏、防止火災、還有辨別人的身分等等。

還有在它的網站下面,我發現有很多科技公司的LOGO,我想視訊科技這一個方向在未來應該也有可能是蠻受歡迎的呢!

不過我看了一下那些名單,好像都只是台灣自己在研究,為什麼沒有國際之間的技術交流等等?我們好像只是在研究別人已經發展出來的技術而已。要是能多和其他國家技術交流的話,一定能有更快的進展的。

WEEK7

1. BCB Programming 遭遇問題與解決過程之描述

心得:

因為上學期有修過數位媒體導論,一些物件的用法都會,

又加上課本有詳細的程式碼,我想除了那些沒些過上學期

課的同學,其他的人只要照著打都可以做出來,會遇到困

難的話,因該也只是一些程式碼沒看懂,但是課文又有解

說,除非真的要非常深入徹底的去了解每一行指令的話,

其實也不難看懂。不過因為我比較被動的關西,只有上課

提到的東西,我才會去做,程式方面目前只做到以BCB程

式顯示視訊畫面的地方,儲存影像陣列還沒有去做。

問題:

如果說真的要硬說有遇到什麼問題的話,再打程式碼

的時候,我以為capPreviewRate(hwndCapture,66)和capPreview(hwndCapture,True)

只要選一個打,因為課文太久前看了,忘了他的意思,後

來看了一下才發現原來兩行都要打上去,不過我意外的發

現,如果只打了capPreviewRate(hwndCapture,66)而沒有

打capPreview(hwndCapture,True)的話,我每次按一下執

行都會變成拍照的功能,但是不行連拍,要把視窗關掉再

按一次執行,他就會擷取你按執行那瞬間,攝影機所擷取

到的畫面,還算有點收穫。至於標頭檔的部份,因為是上

過課後回去才做的,看完同學的文章後就記起來了,所以

回去後,由沒忘了要打標頭檔。

程式碼問題:

Q.HWND為何種型態?(EX. int為整數型態)

A.(handle of window),它代表著視窗唯一的識別碼

LPSTR也是一種型態嗎,是的話為何種型態?

A.WIN API標準字串格式(LPSTR)

視窗辨識碼用途為何?

無解。

為何Overlay的顯示效率較好,卻有不支援它的視訊裝置?

A.印象中第一次上課好像說過因為因為Preview模式是微軟

所開發的,為了打擊對手所以不會支援Overlay模式。有點

類似Windows Media和Real Player的關西吧。

2008年4月8日 星期二

week7-心得

BCB之前老師講解到有個不懂的地方:為何片段的程式碼中,i 要跑10次的迴圈,而不跑1.2.3次就好,因為就算跑1次和跑10次都也只會讀取到第一個camera 。

下段語法的功用:抓取電腦是否有連接到camera,並只讀取第一個連接到的camera 。

縮減語法
將範例中的0~10的迴圈

for(i=0;i<10;i++) if(capDriverConnect(hwndCapture,i)) break; if(i==10) { // Unable to connect to the capture ShowMessage("Can't connect to any capture!"); exit(EXIT_FAILURE) ; }

修改成一行語法

if(capDriverConnect(hwndCapture,0))

結論:實際插入兩台camera作實驗,發現不管是A或B,A先插入再插B,或是先插B再插A,,只要哪個camera先插入,就先擷取那個camera的畫面,因此 i 跑10次的迴圈基本是和跑一行是一樣的,所以將 i 寫成迴圈無實質意義。

解決方法&想法:後來有問老師,而老師也說,基本上如果是老師自己寫這種程式的話,也只會寫一行;也許寫成迴圈的這種方式,也許就是我們這種初學者,剛開始學,要慢慢累積經驗,才會發現更簡單的寫法,或許換作是我也會那樣寫吧,講義的作者依據電腦可能讀取的插槽數量,判斷電腦最多能讀取到的camera數量,但程式卻也只讀取第一個插入電腦插槽的camera,或許這是作者未注意到的部分。