【虎嗅夏季F&M節】百度張潼:深度學習接近人腦,是巨頭競相追逐的未來

創投分享會注:創投分享會FM節上,百度研究院副院長張潼發表了有關于深度學習的主題演講。現在為什么大家都很重視深度學習?最主要的原因是數據量比較大,計算規模變大了;此外,復雜模型有其獨特的優勢。在張潼及百度的愿景里,深度學習的意義是研發出最接近人腦復雜程度的模型,而這也是Google正在追逐的未來,這可能是互聯網公司目前正在進行的最前沿研究。以下是他演講的主要內容,創投分享會進行了編輯。
這是我第一次來深圳,也是第一次來創投分享會參加類似的活動,我是搞技術的,我做的更多的還是面向于偏技術的,我很高興跟大家分享。如果大家跟數據有關系,特別是互聯網企業都會對數據打交道,深度學習近年來是非常火的概念。
很多人對深度學習感興趣,包括VC等等,他們看到的是什么呢?很多互聯網公司會對技術非常感興趣。像谷歌做了很多事,2011年成立了谷歌大腦的計劃,這個比較著名的人是Andrew Ng,另外一個是Jeff Dean,他們當時的目的是想建一個世界最大的深度學習網絡。
我跟大家分享一下這個技術能做什么,為什么大家的興趣那么大?互聯網,大家說大數據,為什么我們這么重視數據,百度要用數據來做智能化,特別是人工智能實驗室,一個是數據,一個是智能,這兩個是關鍵詞。互聯網目前是幾種模式,如果看BAT的話,一個是聯接人和信息,像百度,阿里是聯接人和商品,還有騰訊和facebook都是聯接人和人。主要是這三個模式,另外還有線上線下。
這些實際上都是數據驅動,跟傳統的不太一樣,互聯網企業講快速迭代,一個是數據驅動,這樣要進行很多分析。特別是進行到一定的程度,比較高度的時候,你需要提取數據,其中一個是數據制導,比如百度的搜索技術、語音技術等等。深度學習更大的概念是機器學習,如果我們看一個圖的話首先是有大數據,然后是分析,包括建模,用高效的算法解決這些模型,然后集合到你的系統里面,最后就成為一個智能化的系統。深度學習在整個流程里面最主要的是復雜模型,像人腦的模型,這個模型的效果非常好。深度學習是互聯網數據分析必不可少的。
我們說一下語音,這是深度學習用得比較廣的領域,你說一句話,通過計算機給你翻譯出來。機器學習有輸入輸出,輸入是聲學信號,輸出就是變成文字,比如說你好或者其他的。問題規模是非常大,基于大數據,百度或者類似大的互聯網企業都是上萬小時的語料,數據規模是百億級,類別上萬類。你進來的是一些文字,最后你希望用它訓練出來一個模型,而這些模型最后可以在線上用。模型在這里是深度學習的模型,這是目前效果最好的一個方式。計算技術上需要大規模的計算技術,有一些技術的瓶頸需要處理。
從模型上來講有兩種,深度學習相對應的概念是淺度學習,淺度也是一個機器學習模型,它的意思就是人工要抽取特征,通過人工的方式變成計算機可以識別的,然后學習跟學習線性組合。后來發現數據量變得更大的時候,你可以用更復雜的模型,這些模型包括深度的模型,它的好處就是可以從原始出發自動學習組合,這樣的能力是人工不足的地方就用機器代替,然后要并行大數據,另外要很大的計算能力,這樣就能得到更好的效果,就能實現類似智能化。
智能化是今后十年大家最關注的技術前沿,這從技術瓶頸上也是非常高的。舉一個圖像識別的例子,它怎么從產生到生成,然后學習一些比較高級的。比如開始進來的都是一些圖像的像素,后面一層就會有一些邊出來,再下一層就是學習特征,再上面就組建成人臉。這種信息是自動學出來的,不是人制造的。傳統的學習方法是人來做的。語音也類似,也是從低到高慢慢建立起來的。 另外它非常像人大腦的結構,深度學習本身是模擬大腦的,它的結構跟大腦走得非常近。從某種意義上來講深度學習跟人腦是非常近的。圖像識別傳統的方法是在2010年用淺層模型,達到了74%,到2012年有了非常大的提升,達到了85%。
現在為什么大家都很重視深度學習呢?最主要的原因是數據量比較大,計算規模變大了;此外,復雜模型獨特的優勢就會顯現出來了。想象一下將來數據會越來越大,特別是互聯網里面,各位如果創業的話對數據也非常關心,將來也是非常大的數據,建立復雜模型也是非常重要的。
數據規模,首先是成倍的增長,包括廣告、語音、圖像等等。另外一個是計算能力,其中有一個代表,GPU的出現,你計算是用CPU,最近深度學習用得比較多的是GPU,GPU使得計算能力大大提高,GPU一兩個星期能處理的數據,CPU可能要一年。還有復雜的圖像模型。最后要有一些算法支持它,它有異步式的算法來支持它的計算。
我們的目標是使計算機更加智能,這是在座各位想做的事,要智能,能夠理解人,能夠知道意圖。我們現在的手段跟以前的區別是我們有大數據。那我們就要分析它,復雜模型就很重要。計算能力也上去了,最后要做一個系統才能達到你的目的。深度學習是非常接近人腦,第二是向人工智能走得非常近,也許它不是最終的目標,但是有很好的效果提升。
這是我第一次來深圳,也是第一次來創投分享會參加類似的活動,我是搞技術的,我做的更多的還是面向于偏技術的,我很高興跟大家分享。如果大家跟數據有關系,特別是互聯網企業都會對數據打交道,深度學習近年來是非常火的概念。
很多人對深度學習感興趣,包括VC等等,他們看到的是什么呢?很多互聯網公司會對技術非常感興趣。像谷歌做了很多事,2011年成立了谷歌大腦的計劃,這個比較著名的人是Andrew Ng,另外一個是Jeff Dean,他們當時的目的是想建一個世界最大的深度學習網絡。
我跟大家分享一下這個技術能做什么,為什么大家的興趣那么大?互聯網,大家說大數據,為什么我們這么重視數據,百度要用數據來做智能化,特別是人工智能實驗室,一個是數據,一個是智能,這兩個是關鍵詞。互聯網目前是幾種模式,如果看BAT的話,一個是聯接人和信息,像百度,阿里是聯接人和商品,還有騰訊和facebook都是聯接人和人。主要是這三個模式,另外還有線上線下。
這些實際上都是數據驅動,跟傳統的不太一樣,互聯網企業講快速迭代,一個是數據驅動,這樣要進行很多分析。特別是進行到一定的程度,比較高度的時候,你需要提取數據,其中一個是數據制導,比如百度的搜索技術、語音技術等等。深度學習更大的概念是機器學習,如果我們看一個圖的話首先是有大數據,然后是分析,包括建模,用高效的算法解決這些模型,然后集合到你的系統里面,最后就成為一個智能化的系統。深度學習在整個流程里面最主要的是復雜模型,像人腦的模型,這個模型的效果非常好。深度學習是互聯網數據分析必不可少的。
我們說一下語音,這是深度學習用得比較廣的領域,你說一句話,通過計算機給你翻譯出來。機器學習有輸入輸出,輸入是聲學信號,輸出就是變成文字,比如說你好或者其他的。問題規模是非常大,基于大數據,百度或者類似大的互聯網企業都是上萬小時的語料,數據規模是百億級,類別上萬類。你進來的是一些文字,最后你希望用它訓練出來一個模型,而這些模型最后可以在線上用。模型在這里是深度學習的模型,這是目前效果最好的一個方式。計算技術上需要大規模的計算技術,有一些技術的瓶頸需要處理。
從模型上來講有兩種,深度學習相對應的概念是淺度學習,淺度也是一個機器學習模型,它的意思就是人工要抽取特征,通過人工的方式變成計算機可以識別的,然后學習跟學習線性組合。后來發現數據量變得更大的時候,你可以用更復雜的模型,這些模型包括深度的模型,它的好處就是可以從原始出發自動學習組合,這樣的能力是人工不足的地方就用機器代替,然后要并行大數據,另外要很大的計算能力,這樣就能得到更好的效果,就能實現類似智能化。
智能化是今后十年大家最關注的技術前沿,這從技術瓶頸上也是非常高的。舉一個圖像識別的例子,它怎么從產生到生成,然后學習一些比較高級的。比如開始進來的都是一些圖像的像素,后面一層就會有一些邊出來,再下一層就是學習特征,再上面就組建成人臉。這種信息是自動學出來的,不是人制造的。傳統的學習方法是人來做的。語音也類似,也是從低到高慢慢建立起來的。 另外它非常像人大腦的結構,深度學習本身是模擬大腦的,它的結構跟大腦走得非常近。從某種意義上來講深度學習跟人腦是非常近的。圖像識別傳統的方法是在2010年用淺層模型,達到了74%,到2012年有了非常大的提升,達到了85%。
現在為什么大家都很重視深度學習呢?最主要的原因是數據量比較大,計算規模變大了;此外,復雜模型獨特的優勢就會顯現出來了。想象一下將來數據會越來越大,特別是互聯網里面,各位如果創業的話對數據也非常關心,將來也是非常大的數據,建立復雜模型也是非常重要的。
數據規模,首先是成倍的增長,包括廣告、語音、圖像等等。另外一個是計算能力,其中有一個代表,GPU的出現,你計算是用CPU,最近深度學習用得比較多的是GPU,GPU使得計算能力大大提高,GPU一兩個星期能處理的數據,CPU可能要一年。還有復雜的圖像模型。最后要有一些算法支持它,它有異步式的算法來支持它的計算。
我們的目標是使計算機更加智能,這是在座各位想做的事,要智能,能夠理解人,能夠知道意圖。我們現在的手段跟以前的區別是我們有大數據。那我們就要分析它,復雜模型就很重要。計算能力也上去了,最后要做一個系統才能達到你的目的。深度學習是非常接近人腦,第二是向人工智能走得非常近,也許它不是最終的目標,但是有很好的效果提升。
知名風險投資公司
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

創業聯合網是創業者和投資人的交流平臺。平臺擁有5000+名投資人入駐。幫助創業企業對接投資人和投資機構,同時也是創業企業的媒體宣傳和交流合作平臺。
熱門標簽(qian)
精華文章