導航:首頁 > 股票交流 > 賈揚清

賈揚清

發布時間:2021-05-12 20:51:01

Ⅰ 如何評價GTC China 2016

1.陣容很豪華,Ng,賈揚清這兩位偶像級大咖都來了,微軟亞研,IBM,BAT,360,還有格靈深瞳,商湯科技,科大訊飛等等國內一線互聯網或者IT研究機構都有重要人物出席
2.內容很空洞,幾乎是各個公司應用GPU的項目交流會。作為科普性的宣傳來說還是很不錯的,不涉及技術細節,幾乎沒有干貨。Ng幾年前講過的東西還在講。一些公司顯得誠意不夠,拿一些入門級的技術出來交流。
3.特色不鮮明,看似百花齊放,其實都差不多,沒有令人眼前一亮的應用或者理念。
4.群眾很熱情,雖然不至於人山人海,但也是人滿為患,尤其在各位大神出沒的地方,大神們都是謙遜儒雅的學者范兒,一看就令人心生好感。可見做技術的最忌手舞足蹈,舌燦蓮花。

Ⅱ 深度學習能夠學會編程嗎

IT的就業前景還是不錯的
選擇學校方面 一定要選擇 有資質的
教學 師資力量 環境不錯的
看學校 歷年來的畢業生如何

Ⅲ 有沒有配置好深度學習開發環境的Linux鏡像推薦

caffe是一個清晰,可讀性高,快速的深度學習框架。作者是賈揚清,加州大學伯克利的ph.D,現就職於FaceBook。caffe的官網是http://caffe.berkeleyvision.org/.現在網上有比較詳細的教程,關於caffe在windows下的配置。 mxnet主要是繼承自Minerva...

Ⅳ 微軟官方caffe和老版本caffe的區別

caffe官網:berkeleyvision.org/" target="_blank">http://caffe.berkeleyvision.org/

1.最原始的最開始版本:伯克利BVLC版

https://github.com/BVLC/caffe

主要在Linux上運行,有matlab和Python介面

傻瓜都能學會的配置教程:Caffe+Ubuntu14.04+CUDA6.5新手安裝配置指南:

http://www.haodaima.net/art/2823705

http://www.cnblogs.com/platero/p/3993877.html

學習教程:http://suanfazu.com/t/caffe/281

2.賈揚清大大自己的版本:https://github.com/Yangqing/caffe

3.caffe-for-windows基本版:https://github.com/niuheng/caffe

windows+caffe+vs2013+cuda6.5配置記錄:http://www.bubuko.com/infodetail-902302.html

caffe for windows 訓練cifar10:http://www.th7.cn/system/win/201411/77318.shtml

Windows下編譯Caffe並編譯Matlab介面:http://www.th7.cn/system/win/201504/102914.shtml

4.caffe window改進版運行在VS2013:https://github.com/initialneil/caffe-vs2013

配置:https://initialneil.wordpress.com/

5.我目前用的版本(happynear大神的):https://github.com/happynear/caffe-windows

配置:http://blog.csdn.net/happynear/article/details/45372231

Ⅳ 百度Paddle會和Python一樣,成為最流行的深度學習引擎嗎

摘要:PaddlePaddle的負責人徐偉認為,沒有一家公司能夠完全主導這個領域,要單一公司的深度學習框架完全主導該領域,就等同於用同一種程序語言開發所有的軟體,未來深度學習的生態系統會因使用場景有最佳的框架使用。

PaddlePaddle會和Python一樣流行嗎?

深度學習引擎最近經歷了開源熱。2013年Caffe開源,很快成為了深度學習在圖像處理中的主要框架,但那時候的開源框架還不多。隨著越來越多的開發者開始關注人工智慧,AI 巨頭們紛紛選擇了開源的道路:2015年9月Facebook開源了用於在Torch上更快速地訓練神經網路的模塊,11月Google開源 TensorFlow,2016年1月微軟開源CNTK。最近,網路也宣布開源深度學習引擎 PaddlePaddle。

在這場深度學習的框架之爭中,究竟哪家能夠勝出?PaddlePaddle的負責人徐偉認為,沒有一家公司能夠完全主導這個領域,要單一公司的深度學習框架完全主導該領域,就等同於用同一種程序語言開發所有的軟體,未來深度學習的生態系統會因使用場景有最佳的框架使用。

話雖如此,對於程序員來說,如果選擇了更為流行的編程語言,就會有更多可使用的庫,也能更輕松的做出好的產品。而緊跟程序語言的發展歷史,我們發現最終最為流行的,總是最容易上手的。

Python是非常好的例子,在編程語言排行榜上,2014年Python只有第六名。但隨著大量年輕程序員的湧入,他們更願意選擇簡單、易學、文檔好的Python作為優先的學習對象,很快C、C++程序員很多也開始使用Python編程了。

而今天發生在深度學習框架上的競爭,似乎也在重演編程語言的歷史。

去年TensorFlow發布的時候,對於它的質疑聲不絕於耳。首先是對單機版TensorFlow的質疑,認為它在和Caffe、Torch和 Theano相比並沒有優勢。而在Google開源了分布式版本後,人們說它比Caffe慢,比Torch臃腫,而且不能進行太大調整。但如今在HackerNews上關於最受歡迎深度學習工具的投票,TensorFlow獲得第一,得票率是第二名的接近2.6倍。

程序員Vonnik解釋了這個現象:使用TensorFlow的大部分都是來自Udacity課程的學生,他們大部分都沒什麼經驗。但正是這些學生和初學者,而非那些經驗豐富的資深人士,把Python變成了全球最流行的語言,也把TensorFlow推到了排名第一的位置。

從Python和TensorFlow的歷史來看,我們有理由認為,最為簡單、易用的深度學習框架,將會在未來的競爭勝出。

網路 PaddlePaddle

在和幾款最常用的深度學習框架TensorFlow、Torch、Caffe比較之前,我們先重點介紹新出現的PaddlePaddle。

Paddle其實已經有多年歷史了。早在 2013 年,網路就察覺到傳統的基於單GPU的訓練平台,已經無法滿足深度神經網路在搜索、廣告、文本、語音、圖像等領域的訓練需求,於是在徐偉的帶領下開始搭建Paddle——一個多機並行的CPU/GPU混布的異構計算平台。Paddle從最早的開發到如今的開源,就一直以大規模數據處理和工業化的要求不斷改進。我們可以看到PaddlePaddle有很多優異的特性。

Github上介紹,PaddlePaddle有以下特點:

· 靈活

PaddlePaddle支持大量的神經網路架構和優化演算法,支持任意復雜RNNs結構,高效處理batch,無需數據填充。簡單書寫配置文件即可實現復雜模型,比如擁有注意力(Attention)機制、外圍記憶層(External Memory)或者用於神經機器翻譯模型的深度時序快進網路。

· 高效

為了利用異構計算資源的能力,PaddlePaddle中的每一級都會進行優化,其中包括計算、內存、架構和通信。以下是幾個例子:

1.使用SSE/AVX內聯函數、BLAS資料庫(例如MKL、ATLAS、cuBLAS)和定製化的CPU/GPU Kernal來優化數學運算。

2.高度優化RNNs網路,在沒有Padding的情況下,也能處理不同長度的序列。

3.優化的本地和分布式訓練,同時支持高緯稀疏模型。

· 可擴展

有了PaddlePaddle,使用多個CPU和GPU以及機器來加速訓練可以變得很輕松。 PaddlePaddle能通過優化通信,獲得高吞吐量和性能。

· 與產品的連接

PaddlePaddle的部署也很簡單。在網路,PaddlePaddle已經被用於產品和服務中,擁有大量用戶。應用場景包括預估外賣的出餐時間、預判網盤故障時間點、精準推薦用戶所需信息、海量圖像識別分類、字元識別(OCR)、病毒和垃圾信息檢測、機器翻譯和自動駕駛等等。

在PaddlePaddle簡單、可擴展的邏輯下,徐偉評價說:「這將使工程師們能夠快速、輕松地將深度學習技術應用到他們的產品當中,我們想讓更多的人使用人工智慧,人工智慧對於我們的未來生活是非常重要的。」

深度學習框架對比

PaddlePaddle最主要的類比對象,來自UC伯克利的賈揚清開發的Caffe和Google的 TensorFlow。

這是一張來自Spark Summit 2016的圖,PaddlePaddle在開源前就在頂級的行業會議中進行了展示。

總的來說

1)Caffe具有出色的CNN實現功能的開發語言,在計算機視覺領域,Caffe仍然是最流行的工具包。Caffe的開發語言支持C++和Cuda,速度很快,但是由於一些歷史性的遺留架構問題,它的靈活性不夠強。而且對遞歸網路和語言建模的支持很差。Caffe支持所有主流開發系統,上手難度屬於中等水平。

2)TensorFlow是一個理想的RNN API實現,它使用了向量運算的符號圖方法,使得開發的速度可以很快。TensorFlow支持的比較好的系統只有各種Linux系統和OSX,不過其對語言的支持比較全面,包含了Python、C++和Cuda等,開發者文檔寫得沒有Caffe那麼全面,所以上手比較難,在性能方面,也不如Caffe及PaddlePaddle。

3)Torch沒有跟隨Python的潮流,反而選擇了C語言實現,用Lua語言進行封裝。Torch對卷積網路的支持非常好,運行在C++、C#和Jave等工業語言的速度較快,也不需要額外的編譯。但是它的上手難度也很高,對初學者缺乏規范的例子,而且需要先邁過Lua的門檻,這對初學者是很大的障礙。

4)而此次網路的PaddlePaddle性能優先並兼顧靈活,通過使用GPU異構計算來提升每台機器的數據處理能力,獲得了業內「相當簡潔、設計干凈、穩定,速度較快,顯存佔用較小」等好評。

而在關鍵的進入門檻上,相比Google TensorFlow和Facebook Torch,PaddlePaddle的上手難度低得多,且擁有非常優秀的業界特徵,包括NLP和推薦等應用場景、對RNN很好的支持、高質量代碼、以及分布式訓練等,已經足以滿足大多數AI場景的需求。且PaddlePaddle更加務實,可解決實際問題。

據徐偉介紹,PaddlePaddle將在本月底發布最新版本,全面支持Mac操作系統、以及Cuda8.0和GCC5.4,同時進一步優化了安裝過程,可以幫助更多開放者更好地「上手」。

所以我們可以初步下一個結論,在中國的開發環境下,Google TensorFlow和Facebook Torch的上手難度都比較高,TensorFlow最好的訓練環境Google Cloud也難以在中國獲得支持。而Caffe雖然已經有了多年的積累,但是畢竟目前只是在視覺領域有比較好的發展,而且相比網路能提供的產業鏈支持,在資源投入上可能會有比較大的局限。相比之下,坐擁中國的本土市場,上手難度低得多的PaddlePaddle,將會有更好的技術和生態的環境。也許不久的將來,PaddlePaddle就會和Python在編程語言中所做的事情一樣,成為最流行的深度學習引擎。

Ⅵ micorobit怎麼做風扇

這台風扇是怎麼做的?第一,是可以說是有,有馬達和包餡。發現有竹筍也有風葉子,主神風葉子,他組成合起來才是,風扇有電流電阻組成的開關也可以說是這樣組成的吧

Ⅶ 程序員為什麼要學深度學習

費良宏:程序員為什麼要學深度學習?

深度學習本身是一個非常龐大的知識體系。本文更多想從程序員的視角出發,讓大家觀察一下深度學習對程序員意味著什麼,以及我們如何利用這樣一個高速發展的學科,來幫助程序員提升軟體開發的能力。
本文根據費良宏在2016QCon全球軟體開發大會(上海)上的演講整理而成。
前言
1973年,美國上映了一部熱門的科幻電影《WestWorld》,三年之後又有一個續集叫做《FutureWorld》。這部電影在80年代初被引進到中國叫《未來世界》。那部電影對我來講簡直可以說得上是震撼。影片中出現了很多機器人,表情豐富的面部下面都是集成電路板。這讓那時候的我覺得未來世界都是那麼遙遠、那麼神秘。
時間到了2016年,很多朋友可能都在追看HBO斥巨資拍攝的同一題材的系列劇《WestWorld》。如果前兩部電影還是局限在機器人、人工智慧這樣的話題,2016年的新劇則在劇情和人工智慧的思考方面有了很大的突破。不再渲染機器人是否會威脅到人類,而是在探討「Dreamsaremainlymemories」這一類更具哲理的問題。
「記憶究竟如何影響了智能」這個話題非常值得我們去思考,也給我們一個很好的啟示——今天,人工智慧領域究竟有了怎樣的發展和進步。
今天我們探討的話題不僅僅是簡單的人工智慧。如果大家對深度學習感興趣,我相信各位一定會在搜索引擎上搜索過類似相關的關鍵字。我在Google上以deeplearning作為關鍵字得到了2,630萬個搜索的結果。這個數字比一周之前足足多出了300多萬的結果。這個數字足以看得出來深度學習相關的內容發展的速度,人們對深度學習的關注也越來越高。

從另外的一個角度,我想讓大家看看深度學習在市場上究竟有多麼熱門。從2011年到現在一共有140多家專注人工智慧、深度學習相關的創業公司被收購。僅僅在2016年這種並購就發生了40多起。
其中最瘋狂的是就是Google,已經收購了 11 家人工智慧創業公司,其中最有名的就是擊敗了李世石九段的 DeepMind。排名之後的就要數 Apple、Intel以及Twitter。以Intel 公司為例,僅在今年就已經收購了 3 家創業公司,Itseez、Nervana 和 Movidius。這一系列大手筆的並購為了布局人工智慧以及深度學習的領域。
當我們去搜索深度學習話題的時候,經常會看到這樣的一些晦澀難懂的術語:Gradient descent(梯度下降演算法)、Backpropagation(反向傳播演算法)、Convolutional Neural Network(卷積神經網路)、受限玻耳茲曼機(Restricted Boltzmann Machine)等。
如打開任何一篇技術文章,你看到的通篇都是各種數學公式。大家看到如下左邊的圖,其實並不是一篇高水準的學術論文,而僅僅是維基網路關於玻耳茲曼機的介紹。維基網路是科普層面的內容,內容復雜程度就超過了大多數數學知識的能力。

在這樣的背景之下,我今天的的話題可以歸納成三點:第一,我們為什麼要學習深度學習;第二,深度學習最核心的關鍵概念就是神經網路,那麼究竟什麼是神經網路;第三,作為程序員,當我們想要成為深度學習開發者的時候,我們需要具備怎樣的工具箱,以及從哪裡著手進行開發。
為什麼要學習深度學習
首先,我們談談為什麼要學習深度學習。在這個市場當中,最不缺乏的就是各種概念以及各種時髦新技術的詞彙。深度學習有什麼不一樣的地方?我非常喜歡AndrewNg(吳恩達)曾經用過的一個比喻。
他把深度學習比喻成一個火箭。這個火箭有一個最重要的部分,就是它的引擎,目前來看在這個領域裡面,引擎的核心就是神經網路。大家都知道,火箭除了引擎之外還需要有燃料,那麼大數據其實就構成了整個火箭另外的重要組成部分——燃料。以往我們談到大數據的時候,更多是強調存儲和管理數據的能力,但是這些方法和工具更多是對於以往歷史數據的統計、匯總。
而對於今後未知的東西,這些傳統的方法並不能夠幫助我們可以從大數據中得出預測的結論。如果考慮到神經網路和大數據結合,我們才可能看清楚大數據真正的價值和意義。AndrewNg就曾經說過「我們相信(神經網路代表的深度學習)是讓我們獲得最接近於人工智慧的捷徑」。這就是我們要學習深度學習的一個最重要的原因。

其次,隨著我們進行數據處理以及運算能力的不斷提升,深度學習所代表的人工智慧技術和傳統意義上人工智慧技術比較起來,在性能上有了突飛猛進的發展。這主要得益於在過去幾十間計算機和相關產業不斷發展帶來的成果。在人工智慧的領域,性能是我們選擇深度學習另一個重要的原因。

這是一段Nvidia在今年公布的關於深度學習在無人駕駛領域應用的視頻。我們可以看到,將深度學習應用在自動駕駛方面,僅僅經歷了3千英里的訓練,就可以達到什麼樣的程度。在今年年初進行的實驗上,這個系統還不具備真正智能能力,經常會出現各種各樣的讓人提心吊膽的狀況,甚至在某些情況下還需要人工干預。
但經過了3千英里的訓練之後,我們看到在山路、公路、泥地等各種復雜的路況下面,無人駕駛已經有了一個非常驚人的表現。請大家注意,這個深度學習的模型只經過了短短幾個月、3千英里的訓練。
如果我們不斷完善這種模型的話,這種處理能力將會變得何等的強大。這個場景裡面最重要的技術無疑就是深度學習。我們可以得出一個結論:深度學習可以為我們提供強大的能力,如果程序員擁有了這個技術的話,無異於會讓每個程序員如虎添翼。
神經網路快速入門
如果我們對於學習深度學習沒有任何疑慮的話,接下來就一定會關心我需要掌握什麼樣的知識才能讓我進入到這個領域。這裡面最重要的關鍵技術就是「神經網路」。說起「神經網路」,容易混淆是這樣兩個完全不同的概念。
一個是生物學神經網路,第二個才是我們今天要談起的人工智慧神經網路。可能在座的各位有朋友在從事人工智慧方面的工作。當你向他請教神經網路的時候,他會拋出許多陌生的概念和術語讓你聽起來雲里霧里,而你只能望而卻步了。
對於人工智慧神經網路這個概念,大多數的程序員都會覺得距離自己有很大的距離。因為很難有人願意花時間跟你分享神經網路的本質究竟是什麼。而你從書本上讀的到的理論和概念,也很讓你找到一個清晰、簡單的結論。
今天就我們來看一看,從程序員角度出發神經網路究竟是什麼。我第一次知道神經網路這個概念是通過一部電影——1991年上映的《終結者2》。男主角施瓦辛格有一句台詞:
「MyCPUisaneural-netprocessor;alearningcomputer.」(我的處理器是一個神經處理單元,它是一台可以學習的計算機)。從歷史來看人類對自身智力的探索,遠遠早於對於神經網路的研究。
1852年,義大利學者因為一個偶然的失誤,將人類的頭顱掉到硝酸鹽溶液中,從而獲得第一次通過肉眼關注神經網路的機會。這個意外加速了對人類智力奧秘的探索,開啟了人工智慧、神經元這樣概念的發展。
生物神經網路這個概念的發展,和今天我們談的神經網路有什麼關系嗎?我們今天談到的神經網路,除了在部分名詞上借鑒了生物學神經網路之外,跟生物學神經網路已經沒有任何關系,它已經完全是數學和計算機領域的概念,這也是人工智慧發展成熟的標志。這點大家要區分開,不要把生物神經網路跟我們今天談到的人工智慧有任何的混淆。

90年代中期,由Vapnik等人提出了支持向量機演算法(Support Vector Machines,支持向量機)。很快這個演算法就在很多方面體現出了對比神經網路的巨大優勢,例如:無需調參、高效率、全局最優解等。基於這些理由,SVM演算法迅速打敗了神經網路演算法成為那個時期的主流。而神經網路的研究則再次陷入了冰河期。
在被人摒棄的十年裡面,有幾個學者仍然在堅持研究。其中很重要的一個人就是加拿大多倫多大學的Geoffery Hinton教授。2006年,他的在著名的《Science》雜志上發表了論文,首次提出了「深度信念網路」的概念。
與傳統的訓練方式不同,「深度信念網路」有一個「預訓練」(pre-training)的過程,這可以方便的讓神經網路中的權值找到一個接近最優解的值,之後再使用「微調」(fine-tuning)技術來對整個網路進行優化訓練。這兩個技術的運用大幅度減少了訓練多層神經網路的時間。在他的論文裡面,他給多層神經網路相關的學習方法賦予了一個新名詞— 「深度學習」。
很快,深度學習在語音識別領域嶄露頭角。接著在2012年,深度學習技術又在圖像識別領域大展拳腳。Hinton與他的學生在ImageNet競賽中,用多層的卷積神經網路成功地對包含一千個類別的一百萬張圖片進行了訓練,取得了分類錯誤率15%的好成績,這個成績比第二名高了將近11個百分點。
這個結果充分證明了多層神經網路識別效果的優越性。從那時起,深度學習就開啟了新的一段黃金時期。我們看到今天深度學習和神經網路的火熱發展,就是從那個時候開始引爆的。

利用神經網路構建分類器,這個神經網路的結構是怎樣的?

其實這個結構非常簡單,我們看到這個圖就是簡單神經網路的示意圖。神經網路本質上就是一種「有向圖」。圖上的每個節點借用了生物學的術語就有了一個新的名詞 – 「神經元」。連接神經元的具有指向性的連線(有向弧)則被看作是「神經」。這這個圖上神經元並不是最重要的,最重要的是連接神經元的神經。每個神經部分有指向性,每一個神經元會指向下一層的節點。
節點是分層的,每個節點指向上一層節點。同層節點沒有連接,並且不能越過上一層節點。每個弧上有一個值,我們通常稱之為」權重「。通過權重就可以有一個公式計算出它們所指的節點的值。這個權重值是多少?我們是通過訓練得出結果。它們的初始賦值往往通過隨機數開始,然後訓練得到的最逼近真實值的結果作為模型,並可以被反復使用。這個結果就是我們說的訓練過的分類器。
節點分成輸入節點和輸出節點,中間稱為隱層。簡單來說,我們有數據輸入項,中間不同的多個層次的神經網路層次,就是我們說的隱層。之所以在這樣稱呼,因為對我們來講這些層次是不可見的。輸出結果也被稱作輸出節點,輸出節點是有限的數量,輸入節點也是有限數量,隱層是我們可以設計的模型部分,這就是最簡單的神經網路概念。
如果簡單做一個簡單的類比,我想用四層神經網路做一個解釋。左邊是輸入節點,我們看到有若干輸入項,這可能代表不同蘋果的RGB值、味道或者其它輸入進來的數據項。中間隱層就是我們設計出來的神經網路,這個網路現在有不同的層次,層次之間權重是我們不斷訓練獲得一個結果。
最後輸出的結果,保存在輸出節點裡面,每一次像一個流向一樣,神經是有一個指向的,通過不同層進行不同的計算。在隱層當中,每一個節點輸入的結果計算之後作為下一層的輸入項,最終結果會保存在輸出節點上,輸出值最接近我們的分類,得到某一個值,就被分成某一類。這就是使用神經網路的簡單概述。

除了從左到右的形式表達的結構圖,還有一種常見的表達形式是從下到上來表示一個神經網路。這時候,輸入層在圖的最下方,輸出層則在圖的最上方。從左到右的表達形式以AndrewNg和LeCun的文獻使用較多。而在Caffe框架里則使用的則是從下到上的表達。
簡單來說,神經網路並不神秘,它就是有像圖,利用圖的處理能力幫助我們對特徵的提取和學習的過程。2006年Hinton的那篇著名的論文中,將深度學習總結成三個最重要的要素:計算、數據、模型。有了這三點,就可以實現一個深度學習的系統。
程序員需要的工具箱
對於程序員來說,掌握理論知識是為了更好的編程實踐。那就讓我們看看,對於程序員來說,著手深度學習的實踐需要准備什麼樣的工具。
硬體
從硬體來講,我們可能需要的計算能力,首先想到的就是CPU。除了通常的CPU架構以外,還出現了附加有乘法器的CPU,用以提升計算能力。此外在不同領域會有DSP的應用場景,比如手寫體識別、語音識別、等使用的專用的信號處理器。還有一類就是GPU,這是一個目前深度學習應用比較熱門的領域。最後一類就是FPGA(可編程邏輯門陣列)。
這四種方法各有其優缺點,每種產品會有很大的差異。相比較而言CPU雖然運算能力弱一些,但是擅長管理和調度,比如讀取數據,管理文件,人機交互等,工具也豐富。DSP相比而言管理能力較弱,但是強化了特定的運算能力。
這兩者都是靠高主頻來解決運算量的問題,適合有大量遞歸操作以及不便拆分的演算法。GPU的管理能力更弱一些,但是運算能力更強。但由於計算單元數量多,更適合整塊數據進行流處理的演算法。
FPGA在管理與運算處理方面都很強,但是開發周期長,復雜演算法開發難度較大。就實時性來說,FPGA是最高的。單從目前的發展來看,對於普通程序員來說,現實中普遍採用的計算資源就還是是CPU以及GPU的模式,其中GPU是最熱門的領域。

這是我前天為這次分享而准備的一個AWS 上p2的實例。僅僅通過幾條命令就完成了實例的更新、驅動的安裝和環境的設置,總共的資源創建、設置時間大概在10分鍾以內。而之前,我安裝調試前面提到的那台計算機,足足花了我兩天時間。

另外,從成本上還可以做一個對比。p2.8xLarge 實例每小時的費用是7.2美元。而我自己那台計算機總共的花費了是¥16,904元。這個成本足夠讓我使用350多個小時的p2.8xLarge。在一年裡使用AWS深度學習站就可以抵消掉我所有的付出。隨著技術的不斷的升級換代,我可以不斷的升級我的實例,從而可以用有限的成本獲得更大、更多的處理資源。這其實也是雲計算的價值所在。
雲計算和深度學習究竟有什麼關系?今年的8月8號,在IDG網站上發表了一篇文章談到了這個話題。文章中做了這樣一個預言:如果深度學習的並行能力不斷提高,雲計算所提供的處理能力也不斷發展,兩者結合可能會產生新一代的深度學習,將帶來更大影響和沖擊。這是需要大家考慮和重視的一個方向!
軟體
深度學習除了硬體的基礎環境之外。程序員會更關心與開發相關的軟體資源。這里我羅列了一些曾經使用過的軟體框架和工具。

Scikit-learn是最為流行的一個Python機器學習庫。它具有如下吸引人的特點:簡單、高效且異常豐富的數據挖掘/數據分析演算法實現; 基於NumPy、SciPy以及matplotlib,從數據探索性分析,數據可視化到演算法實現,整個過程一體化實現;開源,有非常豐富的學習文檔。
Caffe專注在卷及神經網路以及圖像處理。不過Caffe已經很久沒有更新過了。這個框架的一個主要的開發者賈揚清也在今年跳槽去了Google。也許曾經的霸主地位要讓位給他人了。
Theano 是一個非常靈活的Python 機器學習的庫。在研究領域非常流行,使用上非常方便易於定義復雜的模型。Tensorflow 的API 非常類似於Theano。我在今年北京的QCon 大會上也分享過關於Theano 的話題。
Jupyter notebook 是一個很強大的基於ipython的python代碼編輯器,部署在網頁上,可以非常方便的進行互動式的處理,很適合進行演算法研究合數據處理。
Torch 是一個非常出色的機器學習的庫。它是由一個比較小眾的lua語言實現的。但是因為LuaJIT 的使用,程序的效率非常出色。Facebook在人工智慧領域主打Torch,甚至現在推出了自己的升級版框架Torchnet。
深度學習的框架非常之多,是不是有一種亂花漸欲迷人眼的感覺?我今天向各位程序員重點介紹的是將是TensorFlow。這是2015年穀歌推出的開源的面向機器學習的開發框架,這也是Google第二代的深度學習的框架。很多公司都使用了TensorFlow開發了很多有意思的應用,效果很好。
用TensorFlow可以做什麼?答案是它可以應用於回歸模型、神經網路以深度學習這幾個領域。在深度學習方面它集成了分布式表示、卷積神經網路(CNN)、遞歸神經網路(RNN) 以及長短期記憶人工神經網路(Long-Short Term Memory, LSTM)。
關於Tensorflow 首先要理解的概念就是Tensor。在辭典中對於這個詞的定義是張量,是一個可用來表示在一些向量、標量和其他張量之間的線性關系的多線性函數。實際上這個表述很難理解,用我自己的語言解釋Tensor 就是「N維數組」而已。

使用 TensorFlow, 作為程序員必須明白 TensorFlow這樣幾個基礎概念:它使用圖 (Graph) 來表示計算任務;在被稱之為 會話 (Session) 的上下文 (context) 中執行圖;使用 Tensor 表示數據;通過 變數 (Variable) 維護狀態;使用 feed 和 fetch 可以為任意的操作(arbitrary operation) 賦值或者從其中獲取數據。
一句話總結就是,TensorFlow 就是有狀態圖的數據流圖計算環境,每個節點就是在做數據操作,然後提供依賴性和指向性,提供完整數據流。
TensorFlow安裝非常簡單,但官網提供下載的安裝包所支持的CUDA 的版本是7.5。考慮到CUDA 8 的讓人心動的新特以及不久就要正式發布的現狀。或許你想會考慮立即體驗CUDA 8,那麼就只能通過編譯Tensorflow源代碼而獲得。目前TensorFlow已經支持了Python2.7、3.3+。
此外,對於使用Python 語言的程序員還需要安裝所需要的一些庫,例如:numpy、protobuf等等。對於卷積處理而言,cuDNN是公認的性能最好的開發庫,請一定要安裝上。常規的Tensorsorflow的安裝很簡單,一條命令足矣:
$ pip3 install —upgrade https://storage.233.wiki/tensorflow/linux/cpu/tensorflow-0.11.0rc0-cp35-cp35m-linux_x86_64.whl
如果想評估一下或者簡單學習一下,還可以通過Docker進行安裝,安裝的命令如下:
$ docker run -it -p 8888:8888 gcr.io/tensorflow/tensorflow
TensorFlow有很多優點。首先,目前為止,深度學習的開發框架裡面TensorFlow的文檔做的最好,對程序員學習而言是非常好的一點。第二,TensorFlow有豐富的參考實例,作為參考學習起來非常容易。
第三,開發者社區活躍,在任何一個深度學習的社區里,都有大量關於TensorFlow的討論。第四,谷歌的支持力度非常大,從2015年到現在升級速度非常快,這是其他開源框架遠遠達不到的結果。
參考TensorFlow的白皮書,我們會看到未來TensorFlow還將會有巨大的發展潛力。讓我特別感興趣是這兩個方向。第一,支持跨多台機器的 parallelisation。盡管在0.8版本中推出了並行化的能力,但是目前還不完善。隨著未來不斷發展,依託雲計算的處理能力的提升這個特性將是非常讓人振奮的。
第二,支持更多的開發語言,對於開發者來說這是一個絕大的利好,通過使用自己擅長的語言使用TensorFlow應用。這些開發語言將會擴展到Java、Lua以及R 等。
在這里我想給大家展示一個應用Tensorflow 的例子。這個例子的代碼託管在這個網址上 https://github.com/anishathalye/neural-style。白俄羅斯的現代印象派藝術家Leonid Afremov善於用濃墨重彩來表現都市和風景題材,尤其是其雨景系列作品。他習慣用大色塊的鋪陳來營造光影效果,對反光物體和環境色的把握非常精準。
於是我就找到了一張上海東方明珠電視塔的一張攝影作品,我希望通過Tensorflow 去學習一下Leonid Afremov 的繪畫風格,並將這張東方明珠的照片處理成那種光影色彩豐富的作品風格。利用Tensorflow 以及上面提到的那個項目的代碼,在一個AWS 的p2類型的實例上進行了一個一千次的迭代,於是就得到了下圖這樣的處理結果。

這個處理的代碼只有350行里,模型使用了一個成名於2014年ImageNet比賽中的明星 VGG。這個模型非常好,特點就是「go depper」。
TensorFlow 做出這樣的作品,並不僅僅作為娛樂供大家一笑,還可以做更多有意思的事情。將剛才的處理能力推廣到視頻當中,就可以看到下圖這樣的效果,用梵高著名的作品」星月夜「的風格就加工成了這樣新的視頻風格。

可以想像一下,如果這種處理能力在更多領域得以應用,它會產生什麼樣的神奇結果?前景是美好的,讓我們有無限遐想。事實上我們目前所從事的很多領域的應用開發都可以通過使用神經網路和深度學習來加以改變。對於深度學習而言,掌握它並不是難事。每一個程序員都可以很容易的掌握這種技術,利用所具備的資源,讓我們很快成為深度學習的程序開發人員。
結束語
未來究竟是什麼樣,我們沒有辦法預言。有位作家Ray Kurzweil在2005年寫了《奇點臨近》一書。在這本書裡面他明確告訴我們,那個時代很快到來。作為那個時代曙光前的人群,我們是不是有能力加速這個過程,利用我們學習的能力實現這個夢想呢?

中國人工智慧的發展
人工智慧的時代無疑已經到來,這個時代需要的當然就是掌握了人工智慧並將其解決具體問題的工程師。坦率的說,市場上這一類的工程師還屬於鳳毛麟角。職場上的薪酬待遇可以看得出來這樣的工程師的搶手的程度。人工智慧這門學科發展到今天,就學術自身而言已經具備了大規模產業化的能力。
所以說,對於工程師而言當務之急就是盡快的掌握應用人工智慧的應用技術。當下在互聯網上關於人工智慧的學習資料可以說已經是「汗牛充棟」,那些具備了快速學習能力的工程師一定會在人工智慧的大潮當中脫穎而出。
中國發展人工智慧產業的環境已經具備。無論從創業環境、人員的素質乃至市場的機遇而言完全具備了產生產業變革的一切條件。與美國相比較,在人工智慧的許多領域中國團隊的表現也可以說是不逞多讓。就人工智慧的技術層面而言,中國的工程師與全球最好的技術團隊正處於同一個起跑線上。
時不我待,中國的工程師是有機會在這個領域大展身手的。不過值得注意的是,要切忌兩點:一是好高騖遠,盲目與國外攀比。畢竟積累有長短,術業有專攻,我們要立足於已有的積累,尋求逐步的突破。二是一擁而上,盲目追求市場的風口。人工智慧的工程化需要大量的基礎性的積累,並非一蹴而就簡單復制就可以成功。
中國的科研技術人員在人工智慧領域的成就有目共睹。在王詠剛的一篇文章裡面,他統計了從2013年到2015年SCI收錄的「深度學習」論文,中國在2014年和2015年超已經超過了美國居於領跑者的位置。
另外一讓我感到驚訝的事情,Google的JeffDean在2016年發表過一篇名為《TensorFlow:Asystemforlarge-scalemachinelearning》的論文。文章的22個作者裡面,明顯是中國名字的作者占已經到了1/5。如果要列舉中國人/華人在人工智慧領域里的大牛,吳恩達、孫劍、楊強、黃廣斌、馬毅、張大鵬……很容易就可以說出一大串。
對於中國來說目前的當務之急是人工智慧技術的產業化,唯有如此我們才可以講科研/智力領域的優勢轉化為整體的、全面的優勢。在這一點上,中國是全球最大的消費市場以及製造業強國,我們完全有機會藉助市場的優勢成為這個領域的領先者。
矽谷創新企業
矽谷雖然去過許多回,但一直無緣在那裡長期工作。在人工智慧領域的市場我們聽到的更多是圍繞Google、Apple、Intel、Amazon這樣的一些大型科技公司的一舉一動。但是在美國市場上還有一大批小型的創業企業在人工智慧這個領域有驚艷的表現。僅以矽谷區域的公司為例:
Captricity,提供了手寫數據的信息提取;
VIVLab,針對語音識別開發了虛擬助手服務;
TERADEEP,利用FPGA提供了高效的卷積神經網路的方案;
還有提供無人駕駛解決方案的NetraDyne。
這個名單還可以很長,還有許許多多正在利用人工智慧技術試圖去創造歷史的團隊正在打造他們的夢想。這些團隊以及他們正在專注的領域是值得我們去學習和體會的。

Ⅷ 如何高效的學習 TensorFlow 代碼

對於想要學習TensorFlow(以下簡稱TF)的人,根據目的不同,可以簡單分為以下2類:
1. 研究學者,僅僅需要TF這個平台實現深度學習演算法,無需了解太多底層原理
2. 好學的行業內人員(比如我⊙﹏⊙),不僅需要了解演算法模型,同時還要熟悉TF平台的原理。在運算元、通信、模型優化等方面進行平台的二次開發的人

Ⅸ 如何系統地學習Python 中 matplotlib,numpy,scipy,pandas

Numpy:來存儲和處理大型矩陣,比Python自身的嵌套列表(nested list structure)結構要高效的多,本身是由C語言開發。這個是很基礎的擴展,其餘的擴展都是以此為基礎。數據結構為ndarray,一般有三種方式來創建。Python對象的轉換通過類似工廠函數numpy內置函數生成:np.arange,np.linspace.....從硬碟讀取,loadtxt
Pandas:
基於NumPy 的一種工具,該工具是為了解決數據分析任務而創建的。Pandas 納入了大量庫和一些標準的數據模型,提供了高效地操作大型數據集所需的工具。最具有統計意味的工具包,某些方面優於R軟體。數據結構有一維的Series,二維的DataFrame(類似於Excel或者SQL中的表,如果深入學習,會發現Pandas和SQL相似的地方很多,例如merge函數),三維的Panel(Pan(el) + da(ta) + s,知道名字的由來了吧)。學習Pandas你要掌握的是:匯總和計算描述統計,處理缺失數據 ,層次化索引
清理、轉換、合並、重塑、GroupBy技術
日期和時間數據類型及工具(日期處理方便地飛起)
Matplotlib:Python中最著名的繪圖系統,很多其他的繪圖例如seaborn(針對pandas繪圖而來)也是由其封裝而成。創世人John Hunter於2012年離世。這個繪圖系統操作起來很復雜,和R的ggplot,lattice繪圖相比顯得望而卻步,這也是為什麼我個人不丟棄R的原因,雖然調用plt.style.use("ggplot")
繪制的圖形可以大致按照ggplot的顏色顯示,但是還是感覺很雞肋。但是matplotlib的復雜給其帶來了很強的定製性。其具有面向對象的方式及Pyplot的經典高層封裝。需要掌握的是:散點圖,折線圖,條形圖,直方圖,餅狀圖,箱形圖的繪制。繪圖的三大系統:pyplot,pylab(不推薦),面向對象坐標軸的調整,添加文字注釋,區域填充,及特殊圖形patches的使用金融的同學注意的是:可以直接調用Yahoo財經數據繪圖
Scipy:
方便、易於使用、專為科學和工程設計的Python工具包.它包括統計,優化,整合,線性代數模塊,傅里葉變換,信號和圖像處理,常微分方程求解器等等。基本可以代替Matlab,但是使用的話和數據處理的關系不大,數學系,或者工程系相對用的多一些。(略)
近期發現有個statsmodel可以補充scipy.stats,時間序列支持完美Scikit-learn:關注機器學習的同學可以關注一下,很火的開源機器學習工具,這個方面很多例如去年年末Google開源的TensorFlow,或者Theano,caffe(賈揚清),Keras等等,這是另外方面的問題.

閱讀全文

與賈揚清相關的資料

熱點內容
美國基金股票代碼 瀏覽:187
力拓的股票分析軟體 瀏覽:754
股票軟體有人評估 瀏覽:234
美國總統電視辯論 瀏覽:189
股票數據分析有意義嗎 瀏覽:824
網上股票交易窗口切換 瀏覽:369
三聖股份股票會停牌嗎 瀏覽:825
湖南恆昌醫葯集團股份有限公司股票上市 瀏覽:73
華恆留學 瀏覽:929
湘佳股份股票估值 瀏覽:219
股票賬號怎麼變更手機號 瀏覽:449
prattle 瀏覽:862
重倉智飛生物股票的基金新聞 瀏覽:110
微軟股票查詢 瀏覽:416
國葯集團中國生物北京分公司股票 瀏覽:955
貴州茅台股票明道配資 瀏覽:962
中國市場有多少只股票基金 瀏覽:801
手動輸入股票的軟體下載 瀏覽:355
股票賬戶五年不用 瀏覽:399
2019年兩會時間 瀏覽:249