【中國數字視聽網訊】在安防行業,大數據的相關技術正在不斷滲入,同時也涌現了一些大數據相關的應用及產品,這預示著安防行業的大數據時代將逐漸拉開帷幕?傮w來看,當前安防行業的大數據還處于起步階段,面臨著包括技術、業務、體制、標準化等方面的諸多問題,在未來的發展中,需要逐步解決這些問題,才能使大數據的優勢體現得越來越明顯,才能使大數據發揮更大的價值,使安防行業的競爭力得到質的提升。
關鍵詞:大數據智能分析
一、什么是大數據?
關于大數據的定義,當前不同的行業有不同的聲音。有人說,大數據是量特別大的數據,以前是TB級別,現在是PB級別;也有人說,大數據是以Hadoop為代表的新技術,它能夠處理海量的數據。這幾種說法都顯得有些片面,一個強調數據,一個強調技術。麥肯錫對大數據定義了“4V”特征,同時對大數據作出定義:“大數據是指數據集的大小超過了現有典型的數據庫軟件和工具的處理能力,與此同時,及時捕捉、存儲、聚合、管理這些大數據以及對數據的深度分析的新技術和新能力,正在快速增長,就像預測計算芯片增長速度的摩爾定律一樣。”麥肯錫的定義涵蓋了數據和技術,然而,隨著大數據的發展,這樣的定義也無法完全詮釋大數據的內涵。我們說,大數據不僅有數據,有技術,更重要的是它能夠提供更好的服務。大數據能夠對海量的數據進行深度關聯分析,進而對事物的發展趨勢作出預測,這也是大數據的核心所在,大數據能夠將數學算法運用到海量的數據上來預測事情發生的可能性。
《大數據時代》一書指出:大數據的精髓在于我們分析數據時的三個轉變,這些轉變將有助于我們對大數據的深入理解。
1、在大數據時代,我們可以分析數據的全集,而非數據的采樣。數據的量變可以產生質變,同時可以彌補算法帶來的不足。且看以下案例,在Word程序的語法檢查中,有一種簡單的算法,當數據量只有500萬時,該算法表現很差,但當數據量達到10億級別時,該算法的表現最優異;相反,有一種復雜的算法,在500萬數據量時表現最好,但在10億級別數據量時效果不如簡單的算法。
2、大數據下的數據如此之多,以至于我們不再熱衷于追求精確度。在信息缺乏的時代,我們往往追求數據的精確度;在大數據時代,數據量如此之大,數據種類如此繁多,我們無法保證每個數據都是精確的,然而只要保證大部分的數據是精確的,就不會影響分析結果的可靠性。
3、在大數據時代,我們更加關心相關關系,而非因果關系。沃爾瑪的分析系統發現,啤酒與尿布的銷售量存在一定的相關關系。根據分析結果,沃爾瑪將尿布和啤酒這兩種風馬牛不相及的商品擺在一起,結果神奇地發現尿布和啤酒的銷量都增加了。原來,美國的婦女通常在家照顧孩子,所以她們經常會囑咐丈夫在下班回家的路上為孩子買尿布,而丈夫在買尿布的同時又會順手購買自己愛喝的啤酒。在這個案例中,我們找到了它的原因,但更多時候,我們找不到原因,而實際上我們也無需去關心它的原因,因為從相關關系的分析結果中,我們就能從中獲益。
二、大數據發展現狀
大數據是時下最熱的一門技術,2012年,科技部的《中國云科技發展“十二五”專項規劃》和工信部的《物聯網“十二五”發展規劃》都將大數據技術作為一項重點予以支持。
在IT領域,大數據的發展已相當成熟。如Google公司利用超過30億條用戶的指令成功預測流感的傳播,利用上萬億的語料庫為用戶提供相對精確的翻譯;亞馬遜根據以往的信息預測用戶感興趣的書籍;淘寶根據用戶的購物行為精確地推送廣告;等等。
然而,在安防領域,大數據還處于萌芽和探索階段。
首先,安防行業正在逐漸進入大數據時代。隨著城市進程的不斷發展,信息化建設的不斷深入,數據正在以幾何級的速度快速增長,傳統的系統或工具已無法有效處理如此海量的數據。比如,交通卡口數據,以前是千萬條級別,現在的情況是:一個區縣一年的卡口數據能夠達到十億級別,一個地級市一年的卡口數據甚至能夠達到百億級別,一個省的數據就更大了,面對如此龐大的數據,傳統的系統顯得束手無策,即使一條簡單的查詢命令,響應時間也會變得非常慢,更不要說分析、統計等功能了。同時,越來越多的用戶對大數據提出了更高的要求,比如公安用戶,他們掌握了大量的數據,類型繁多,數據量大,他們要求能夠通過海量數據的分析,達到預測預警的作用,進而能夠將公安業務從事后分析向事前預測轉變。
其次,一些安防企業正在接觸大數據,并有了初步的探索和應用。早在2012年,?低暰蜕孀愦髷祿贖adoop進行開發優化并推行大數據解決方案,滿足海量數據高效處理的要求。當前,?低暬诖髷祿夹g的產品有:視頻云存儲,能夠滿足100PB數據的存儲;視頻圖像信息數據庫,能夠針對海量的案事件數據進行快速檢索;交通卡口大數據平臺,能夠針對海量的卡口數據進行快速檢索、智能研判、統計分析,部分研判功能可用于刑事案件的偵察及預警。此外,像博康、宇視等安防企業,也在迎頭趕上大數據的發展步伐。
三、安防大數據核心技術分析
IT領域的大數據發展已相當成熟,其中的許多技術可以借鑒運用到安防領域中。但是,安防行業存在與IT行業不一樣的地方,主要是數據的類型。在IT行業中,大數據的分析對象往往是日志、用戶行為信息、網頁索引等數據,是計算機可以識別的結構化數據;而安防行業中,大數據需要分析的對象主要是視頻、圖片、音頻等非結構化數據,計算機無法直接對這些數據進行分析,而是需要先提取出其中的結構化信息,再進行分析。
大數據的基礎技術可以從IT領域借鑒到安防領域,具體包括如下這些技術:一、分布式文件系統,負責海量數據存儲,將數據分散存儲在多臺獨立的設備上,系統采用可擴展的體系結構,利用多臺存儲服務器分擔存儲負荷,利用元數據服務器定位存儲信息,它不但提高了系統的可靠性、可用性和存取效率,還易于擴展;二、分布式數據庫,面向列的實時分布式數據庫,適合構建高并發低延時的在線數據服務系統,用于存儲粗粒度的結構化數據;三、分布式計算,負責將一個需要非常巨大的計算能力才能解決的問題分成許多小的部分,然后分配給許多計算機進行處理,最后把這些計算結果綜合起來得到最終的結果;四、全文檢索引擎,負責對海量數據進行穩定、可靠、快速實時檢索;五、內存計算,通過分布式的內存計算,能夠對海量數據更加快速地分析處理;六、流計算,負責對流媒體數據進行分析處理。基于以上這些技術,能夠對已結構化的數據進行快速處理,解決對海量數據處理效率上的問題。
然而,正如上面所說,安防行業中最多的數據不是結構化數據,而是非結構化數據,如何從這些非結構化數據中提取出結構化信息,是首先需要解決的關鍵點。在視頻圖像中可以提取的結構化信息包括如下內容:一、人、車、物的特征信息,人的特征信息包括性別、年齡段、身高、體型、膚色、是否佩戴眼鏡、發型、服飾特征、攜帶物等,車的特征信息包括車牌號碼、車牌顏色、車牌類型、車輛類型、車身顏色、車標、車上人員信息等,物體的特征信息包括物品顏色、形狀、大小、紋理特征等;二、行為信息,如穿越警戒面、進入/離開區域、區域入侵、人員徘徊、人員聚集等。當提取出這些數據后,就可以進一步進行深入分析,如對車輛的軌跡分析,對人的異常行為分析。所以,智能分析技術在安防大數據中顯得格外重要,是實現安防大數據的基礎。
整合了大量的數據之后,就需要挖掘數據的深度價值。數據的真實價值就像海洋中的冰山,第一眼只能看到冰山一角,而絕大部分則是隱藏于表面之下。預測是大數據的核心價值所在,深度關聯分析算法便是實現大數據價值的必要手段。數據分析算法就像是鉆頭,需要從大數據這座神奇的鉆石礦中挖掘出真正的鉆石。

價格面議
[查看詳情]
