人工智能的方向在哪兒?
作者: 2019年04月17日 來源:全球化工設備網 瀏覽量:
字號:T | T
*近幾年深度學習的流行,大家一般認為是從2012年AlexNet在圖像識別領域的成功作為一個里程碑。AlexNet提升了整個業界對機器學習的接受程度:以前很多機器學習算法都處在“差不多能做demo”的程度,但是AlexNet的效果
*近幾年深度學習的流行,大家一般認為是從2012年AlexNet在圖像識別領域的成功作為一個里程碑。AlexNet提升了整個業界對機器學習的接受程度:以前很多機器學習算法都處在“差不多能做demo”的程度,但是AlexNet的效果跨過了很多應用的門檻,造成了應用領域井噴式的興趣。
當然,任何事情都不是一蹴而就的,在2012年以前,很多成功的因素已經開始逐漸顯現:2009年的ImageNet數據庫奠定了大量標注數據的基礎;2010年開始,IDSIA的Dan Ciresan首次用GPGPU進行物體識別;2011年,北京的ICDAR大會上,神經網絡在中文離線識別上大放異彩。就算是AlexNet中用到的ReLU層,早在2001年神經科學的文獻中就有提及過。所以,一定程度上說,神經網絡的成功也是一個水到渠成的過程。2012年以后的事情,大家可以讀到很多,這里就不再贅述。
深度學習的成功與局限
在看待神經網絡成功的同時,我們也要進一步深挖其背后的理論背景和工程背景,為什么神經網絡和深度學習在幾十年前失敗,但是現在卻成功了?它成功的原因是什么?而它的局限又在什么地方?我們這里只能片面地說幾個重點:成功的原因,一點是大數據,一點是高性能計算。局限的原因,一點是結構化的理解,一點是小數據上的有效學習算法。
大量的數據,比如說移動互聯網的興起,以及AWS這樣低成本獲得標注數據的平臺,使機器學習算法得以打破數據的限制;由于GPGPU等高性能運算的興起,又使得我們能夠在可以控制的時間內(以天為單位甚至更短)進行exaflop級別的計算,從而使得訓練復雜網絡變得可能。要注意的是,高性能計算并不僅限于GPU,在CPU上的大量向量化計算,分布式計算中的MPI抽象,這些都和60年代就開始興起的HPC領域的研究成果密不可分。
但是,我們也要看到深度學習的局限性。今天,很多深度學習的算法還只是在感知這個層面上形成了突破,可以從語音、圖像,這些非結構化的數據中進行識別的工作。在面對更加結構化的問題的時候,簡單地套用深度學習算法可能并不能達到很好的效果。有的同學可能會問為什么AlphaGo和Starcraft這樣的算法可以成功,一方面,深度學習解決了感知的問題,另一方面,我們也要看到還有很多傳統的非深度學習算法,比如說Q-learning和其他增強學習的算法,一起支撐起了整個系統。而且,在數據量非常小的時候,深度學習的復雜網絡往往無法取得很好的效果,但是很多領域,特別是類似醫療這樣的領域,數據是非常難獲得的,這可能是接下去的一個很有意義的科研方向。
接下去,深度學習或者更廣泛地說,AI這個方向會怎么走?我個人的感覺,雖然大家前幾年一直關注AI框架,但是近年來框架的同質化說明了它不再是一個需要花大精力解決的問題,TensorFlow這樣的框架在工業界的廣泛應用,以及各種框架利用Python在建模領域的*表現,已經可以幫助我們解決很多以前需要自己編程實現的問題,因此,作為AI工程師,我們應該跳出框架的桎梏,往更廣泛的領域尋找價值。
向上的挑戰
往上走,我們會遇到產品和科研的很多新挑戰,比如說:
傳統的深度學習應用,比如說語音、圖像等等,應該如何輸出產品和價值?比如說,計算機視覺現在基本還是停留在安防這個層面上,如何深入到醫療、傳統工業,甚至社會關愛(如何幫助盲人看見這個世界)這些領域?這不僅需要技術的思考,還需要產品的思考。
除了語音和圖像之外,如何解決更多問題?在阿里和很多互聯網企業中有一個“沉默的大多數”的應用,就是推薦系統:它常常占據了超過80%甚至90%的機器學習算力,如何將深度學習和傳統推薦系統進一步整合,如何尋找新的模型,如何對搜索和推薦的效果建模,這些可能沒有像語音和圖像那么為人所知,卻是公司不可缺少的技能。
即使在科研方向,我們的挑戰也剛剛開始:Berkeley的教授Jitendra Malik曾經說:“我們以前是手工調算法,現在是手工調網絡架構,如果囿于這種模式,那人工智能無法進步”。如何走出手工調參的老路,用智能提升智能,是個非常有意思的問題。*開始的AutoML系統依然停留在用大量算力暴力搜索模型結構的層面上,但是現在各種更高效的AutoML技術開始產生,這是值得關注的。
向下的機會
往下走,我們會發現傳統的系統、體系結構等知識,計算機軟件工程的實踐,會給AI帶來很多新的機會,比如說:
傳統的AI框架都是手寫高性能代碼,但是模型如此多變,新的硬件平臺層出不窮,我們應該如何進一步提升軟件效率?我們已經看到有通過編譯器技術和傳統的人工智能搜索方法來反過來優化AI框架,比如Google的XLA和華盛頓大學的TVM,這些項目雖然處于早期,但是已經展現出它們的潛力。
平臺如何提升整合能力?在開源領域,大家的做法是一個人,一臺機器,幾個GPU,訓練比較學院派的模型。但是在大規模應用中,我們的數據量非常大,模型非常復雜,集群還會出現各種調度的挑戰(能不能一下子就要求256個GPU?計算資源是否可以彈性調度?),這些對于我們自己的機器學習平臺,以及云上向客戶提供的服務,都提出了非常多的挑戰。
如何進行軟硬件的協同設計?在深度學習的計算模式開始逐漸固化的時候(比如說CNN),新硬件和特殊硬件(比如ASIC)的優勢就開始體現出來了。如何實現軟硬件的協同設計,防止“硬件出來了,不知道怎么寫程序”或者“模型已經變了,硬件一出來就過時了”這樣的問題,會是將來幾年中很大的方向。
人工智能是一個日新月異的領域,我們有一個笑話是這樣說的:2012年的科研成果,現在說起來都已經是上古時代的故事了。快速的迭代帶來的大量機遇和挑戰是非常令人興奮的,無論是有經驗的研究者還是新學AI的工程師,在當今云化、智能化的年代,如果能快速學習并刷新算法和工程的各種挑戰,就可以通過算法創新*并且賦能社會各個領域。這方面,人工智能領域開源開放的各種代碼,科研文章和平臺給大家創造了比以前更容易的入門門檻,機遇都掌握在我們自己手中。
全球化工設備網(http://www.tupvw34.cn )友情提醒,轉載請務必注明來源:全球化工設備網!違者必究.
免責聲明:1、本文系本網編輯轉載或者作者自行發布,本網發布文章的目的在于傳遞更多信息給訪問者,并不代表本網贊同其觀點,同時本網亦不對文章內容的真實性負責。
2、如涉及作品內容、版權和其它問題,請在30日內與本網聯系,我們將在第一時間作出適當處理!有關作品版權事宜請聯系:+86-571-88970062