影像式海量資料分析是目前數位時代中最熱門的議題、每一種行業都有各自不同的影像資料須進行分析、從這些巨量的影像資料中找到總總的影響因素。現階段巨量影像式資料分析所面臨的總總問題、如資料的態樣與搜尋的效能等、不僅僅是產業界的需求、連學界中各個學者也都趨之若鶩的進行研究的方向。本研究於影像式安全監控巨量資料領域上,研究一如何快速的搜尋具有關聯性之影像物件、並且利用現今已成熟發展之字詞全文檢索(Full-Text search)搜尋引擎來找尋相關影像資料。故本研究提出一 利用顏色特徵區塊轉化為一串列文字來代表一連續影像物件之特徵方法(CoSTA)。並且在這龐大之影像資料庫中、提供一使用者搜尋介面、快速自動化的找尋巨量監控影像資訊。
建置環境示意圖
近十年來,人臉辨識系統的開發一直是一個困難的挑戰。於二維的人臉辨識技術中,光影變化與人臉姿勢的不確定性通常會降低辨識準確率,隨著深度攝影機的發明,利用具有座標數值的三維資訊可以降低人臉辨識的誤判率。此篇論文利用該三維特徵資訊來實作人臉辨識,並將整個系統架構分為三個階段來論述。首先,我們利用三維點雲的開放函式庫來取得人臉深度資訊,並將取得的人臉深度資訊去做法向量計算與具代表性的表面曲度計算,以便換算成易於分析的特徵值。接著我們將換算完的特徵值輸入到我們的深度信心類神經網路來做訓練,求出具有辨識率的模型。最後我們利用訓練好的模型參數與深度信心類神經網路的運算,來辨別新進入畫面的人是否為我們所求的目標。透過實驗結果,我們系統的辨識準確率達到95%。
Drivers require a safe and convenient driving environment when they are driving. Con- temporary vehicle safety systems have rapidly improved and gained public attention. The proposed system receives real-time images from a rear-mounted sheye camera and assists drivers in avoiding many dangerous conditions. Research indicates that driving accidents of- ten occur when drivers are switching lanes. Therefore, to improve driving safety, this study developed a system for predicting vehicle trajectory. When accidents are likely and risks are present, the system alerts the driver. An AdaBoost algorithm was employed for vehicle detection, and a Kalman lter was selected as the main component of the proposed system; it is an eective means for predicting the trajectories of approaching vehicles in the blind spots to prevent collisions from behind during lane switching.
Demo影片
即時的人數計數可以提供資訊進行各種不同的分析,例如安全監控、人員流量控制、遊客流量統計與公共安全等應用。然而目前人數計數大部分依賴人工計算,雖有紅外線與超音波等技術的加入,但對於人潮或遮蔽情形下,仍無法正確的進行人數計數。有鑑於此,本發明是希望能夠藉由一個智慧型的人數計數系統,透過精確的分層掃描方式,來計算實際環境中的人口流量,且不受光線變化影響,除了可以解決人力錯誤計數的問題,更可以替廠商減少不必要的人力資源成本。
People counting is an important subject for various applications and analyses. This paper proposes a novel method for counting the number of targets by using the layer scanning of depth information provided by the Kinect sensor. The steps of this method include constructing a depth image background model, deriving foreground depth map, filtering the noise, classifying the targets, and screening the area of targets with layer scanning to calculate the number of targets by determining the highest position of the respective targets, tracking and analyzing the objects, and counting the number of the objects. Moreover, the dynamic number of targets is calculated using a tracking algorithm. The proposed system is beneficial in automatic, effective, and precise calculation of the number of targets in a specific area. Furthermore, the technique of the present method is not affected by the changes of the ambient light which can effectively reduce the interference of the background.
Demo影片
本研究是以可在不限制任何環境的即時系統,並且能快速且準確的辨識出車牌為前提,提出即時車牌自動辨識系統。之前也有許多相關類似的系統被提出,如在固定或單純背景的情況、一定亮度下的環境、部份車牌的辨識等,大部份的系統都是採用辨識圖片的方式,而我們現今所提的系統是可辨識在一定角度和大小範圍內所有種類的車牌,其背景和光源是沒有任何限制的,並且在以即時的方式來做辨識。我們所採用的方式主要分成三大步驟:即時影像截取、車牌定位與車牌辨識。在即時影像的部份是採用現有且通用的截取方式,以每秒28張圖片來做資料的匯入,但考慮到資料處理的速度和影像的重覆性,故以每兩張才進行一次處理,所以處理的速度約為每秒14張影像。在車牌定位的部份,先將彩色影像轉成灰階,再利用型態學的侵蝕與擴張的方式和一些判斷條件,如此可以不考慮光源和顏色的影響來找出影像中所有類型車牌的位置。在辨識的部份,採用類神經網路結合模糊理論來提高其辨識率。本研究的重點部份在於藉由提高車牌定位的成功率,來增加車牌的辨識率,經實驗的結果得到滿意的辨識率,証明此系統的可行性。
建置環境示意圖
實測畫面
居家安全和公共監控在日常生活中是必須且不可缺少的。通過監控影像的分析,人 們可以針對特定的空間做控管,也可限制特定空間的進出情形。本研究提出使用 虛擬閘門技術的智慧型影像監控系統來做移動物體檢測,在影像監控時,虛擬閘門 可以取代人類的工作。在實際應用時是透過四通道的NVR來傳送連續影像,並且四 通道的影像可以同時運算。虛擬閘門的方法是基於動量估計,會去檢測移動物體的 方向,並檢查他們是否通過虛擬閘門。因此虛擬閘門不需要背景建模並且能夠在極 其複雜的情況下適用。在實際應用時,光線的變化是需要考慮的,例如紅外攝影機 會自動切換到夜間模式,或是在夜間,保全人員用利用手電筒巡邏。因此,根據上 述的問題,本文提出一個新的方法,在照明條件大幅變化下,依舊可以正常的做移 動物體檢測。
Demo影片
Traffic safety has become a priority in recent years, and therefore, the field of intelligent transportation surveillance systems has become a major field of research. Among vehicle surveillance systems, the 360◦ around view monitor (AVM) system is regarded as the devel- opment direction recently. In this paper, an approach to constructing a 360◦ bird’s-eye-view around view monitor system is proposed; the approach involves rectifying four fisheye cam- eras and stitching together the four calibrated images obtained from the cameras into one surrounding view image on a low-cost and high portability Android embedded system. To improve the computation performance, the aforementioned procedures are combined into a single step construction mapping using table lookup mechanism and multithreading tech- nique. Through hardware implementation and experiments evaluation, the proposed AVM system performs satisfactorily with surrounding view video output frame rate 12 fps and the average matching error is as low as 2.89 pixel.
Demo影片
Demo影片
本研究提出兩個條碼偵測的方法來找出條碼可能所在的位置,第一個方法是修改遊程塗抹演算碼將條碼的區域塗抹成一個區塊,第二個方法是分析影像的邊緣資訊來選取可能是條碼的區塊。在偵測完條碼可能所在的區塊後,我們提出一個快速的定位機制來完成有效率的影像式條碼定位系統。在完成兩個條碼自動定位系統後,我們分別對兩個系統進行測試,總共測試2768張影像,每張影像的解析度是640 × 480。從實驗數據顯示,第一個系統的定位正確率可以達91.62%,而第二個系統可以達92.77%,並且其平均運算時間是分別為4.50毫秒和26.68毫秒。
實測畫面
本研究重點在於建構一種以電腦視覺為基礎的老人跌倒偵測演算法,利用 IP Camera 將拍攝到的 畫面資訊做多重的演算法處理,包括三向相減法(Three-Phase Difference)、光流法(Optical Flow)、 以及高斯混合模型(Gaussian Mixture Model)。此外,該演算法經過優化後,在單一電腦上能夠支援多 隻IP Camera。除了演算法本身之外,經由UI 設計包裝,輔以中央監控系統CMS(Central Monitoring System),能夠針對每個老年人的環境與健康情形做控管的動作,當發生任何異常狀況時,隨即通知 醫護人員,並根據使用者需求,發出不同種類的警報訊息。本研究提出的多個演算法,成功的整合 中央監控系統以及使用者介面,是一套獨立且完整的系統。
本研究使用了一套基於資料分群概念的系統SVM訓練來做人臉辨識系統。辨識人臉首先必須先偵測到人臉影像,利用一種迭代演算法AdaBoost來偵測眼睛,得到眼睛中心坐標後,將兩眼坐標帶入設計好的橢圓遮罩去切割出人臉部位,由於原圖的五官對比不夠明顯,為了增加人臉五官的對比強度,使用了Retinex這個演算法,過去此演算法常用於數位相機自動白平衡中,它除了具有色彩恆常性,亦包含了強化影像的效果,對於光線對影像所造成的影響,具有良好的處理效果,接著就是使用擷取可辨識的臉部特徵,我們使用對紋理特徵有良好效果的LBP 特徵,只在灰階上的運算, 速度較快可應用於即時系統上,最後使用SVM 分類器去訓練LBP所擷取的特徵來做辨識。