深度學習實驗室

娇妻系列交换1419407088125876.jpg深度學習的概念源於人工神經網絡的研究。含多隱層的多層感知器就是壹種深度學習結構。深度學習通過組合低層特征形成更加抽象的高層表示屬性類別或特征,以發現數據的分布式特征表示。

娇妻系列交换深度學習的概念由Hinton等人於2006年提出。基於深信度網(DBN)提出非監督貪心逐層訓練算法,為解決深層結構相關的優化難題帶來希望,隨後提出多層自動編碼器深層結構。此外Lecun等人提出的卷積神經網絡是第壹個真正多層結構學習算法,它利用空間相對關系減少參數數目以提高訓練性能。

深度學習是機器學習研究中的壹個新的領域,其動機在於建立、模擬人腦進行分析學習的神經網絡,它模仿人腦的機制來解釋數據,例如圖像,聲音和文本。
同機器學習方法壹樣,深度機器學習方法也有監督學習與無監督學習之分.不同的學習框架下建立的學習模型很是不同.例如,卷積神經網絡(Convolutional neural networks,簡稱CNNs)就是壹種深度的監督學習下的機器學習模型,而深度置信網(Deep Belief Nets,簡稱DBNs)就是壹種無監督學習下的機器學習模型。

娇妻系列交换

把學習結構看作壹個網絡,則深度學習的核心思路如下:

①無監督學習用於每壹層網絡;

②每次用無監督學習只訓練壹層,將其訓練結果作為其高壹層的輸入;

③用監督學習去調整所有層

【各領域應用概述】

自2006年以來,深度學習在學術界持續升溫,美國,加拿大,歐洲相繼成為此領域的科研重鎮。2010年美國國防部先進研究項目局首次資助深度學習,參與方包括斯坦福大學、紐約大學和NEC美國研究院等機構。

2011年,微軟語音識別采用深度學習技術降低語音識別錯誤率20-30%,是該領域十多年來最大的突破性進展。

2012是深度學習研究和應用爆發的壹年,深度學習被應用於著名生物制藥公司黙克的分子藥性預測問題,從各類分子中學習發現那些可能成為藥物的分子獲得世界最好效果;谷歌的Google Brain項目用16000個處理器的服務器集群構建了壹套超過10億個節點的具備自主學習能力的神經網絡,能自動從輸入的大量數據中歸納出概念體系,圖片搜索、無人駕駛汽車和Google Glass都將會從中受益。6月,Google公司的深度學習系統在識別物體的精確度上比上壹代系統提高了壹倍,並且大幅度削減了Android系統語音識別系統的錯誤率。百度引入深度學習以後,語音識別效果的提升超過了以往業界在過去15年裏所取得的成績。12月,微軟亞洲研究院展示了中英即時口譯系統,錯誤率僅為7%,而且發音十分順暢。

2013年,歐洲委員會發起模仿人腦的超級計算機項目,計劃歷時10年投入16億美元,由全球80個機構的超過200 名研究人員共同參與,希望在理解人類大腦工作方式上取得重大進展,並推動更多能力強大的新型計算機的研發,就資助力度,項目範圍,和雄心而言,該項目堪比於大型強子對撞機項目。

庫茲韋爾當前的目標就是幫助計算機理解自然語言並以自然語源與用戶對話,雖然庫茲韋爾的目標還要很多年才能實現。他希望將深度學習算法用到解決自然語言的問題上,讓計算機能夠發現語言的問題,解決語言的問題。

技術研究

【技術介紹】

采用深度學習的技術實現人群分割、人群密度估計、人群計數和人群流量的估計。我們的技術適用於包括成百上千行人在內的高密度場景。與傳統的基於物體運動的檢測方法不同,我們的方法同樣適應於單幀圖像,可以檢測靜止人群,也可以有效去除其它類型的運動物體帶來的虛警。準確率達到90%。通過判斷大場景中不同物體在場景中的停留時間,對人群進行檢測和分割、人群密估計、流速估計、介入檢測人群擾動檢測,並能夠對人群的停留、聚集、轉移、變化進行監控和判斷。

【技術應用】

景區:用於各景區管理者及時掌握各景點遊客當前擁擠狀態,為合理制定遊客觀光路線,制定交通疏導預案,遊客數量控制提供重要決策依據。

公共安全:主動發現大型活動現場、重要廣場、政府機關、車站等區域的人群,分析出人群聚集、人群密度、數量,對人群的異常變化實時預警。

商場:對商場內的人流進行分析,統計商場內不同區域的客流量,輔助分析客戶消費行為,為商家提供更有用的客戶消費數據。

【技術介紹】

活動目標檢測算法能適應各種復雜場景,去除各種幹擾,如動態背景、光照變化、陰影及遮擋等環境影響因素,能在較為復雜的環境下快速準確地檢測到多個運動目標,並且實時獲取目標的運動軌跡。

【技術應用】

槍球聯動跟蹤系統:由壹只固定高清槍式攝像機、壹臺超高速高清智能球和壹臺嵌入式視頻服務器組成。系統利用固定槍式攝像機覆蓋的視場,並在該視場內任意劃定警戒區域,再巧妙搭配超高速高清智能球快速追蹤功能。當有運動物體進入警戒區域時,系統自動鎖定壹個或多個目標,同時指揮超高速球機跟蹤拉近拍攝每壹個被鎖定目標,同時向後臺發送目標的實時視頻流。系統實現了遠距離自動發現、自動跟蹤、自動拉近。

【技術介紹】

為基於大數據的視頻檢索提供技術支撐。

行人檢測技術:自動檢測出畫面中出現的行人,並自動識別出行人的著裝顏色。

人臉檢測技術:自動檢測出畫面中出現的所有人臉。

車輛檢測技術:自動檢測出畫面中出現的所有車輛,自動識別出車身顏色,並自動識別出車牌號碼。

【技術應用】

智能交通系統:違章停車檢測、逆行檢測,高速路口流量統計,車流密度分析,車禍現場定位,車牌、車型、車標識別等

安防領域:實現對監控畫面中出現的目標自動識別、自動取證,並構建高效的智能視頻檢索系統

工業檢測領域:可以應用到工業自動化領域,將攝像頭改變成壹個個可視化的傳感器,使之自動判斷約定的異常行為,並與工業化設備相聯動,實現更多的智能化應用。

【技術介紹】

對不同攝像頭中出現的行人進行匹配,自動找出相同的行人。

【技術應用】

安防:跨攝像頭的行人識別、跟蹤和預警。