什麼是人工智慧?前景最被看好的人工智慧六大類型!

首圖來源:pixabay

到底什麼才是人工智慧,怎樣統一大家的意見,形成共識,為它定性?這在最近已經成為了科技圈裡的熱門話題。

一些人將 AI 看做是「認知計算」或者「機器智慧」;而另外一些人將「AI」和「機器學習」給完全等同了起來。之所以會出現這麼多的說法,主要是因為我們大家現在所說的「人工智慧」,並不是某一個單純的技術,它事實上已經成為了很多學科交叉後的領域:從機器人到機器學習,無所不包。

而人工智慧的目的,其實現在絕大多數人已經達成了共識:開發一種能夠執行任務,具備某種認知功能的機器,而這種執行任務的能力和認知功能,原本只屬於人類智慧的範疇當中的。為了達到這種狀態,機器必須具備自我學習的能力。

在過去的十年時間裡,AI 領域出現了何等驚人的進步,無論是無人自駕駛汽車的逐步成熟,還是語音識別技術的日趨完善。在這樣的大背景之下,人工智慧已經跳脫出了 20 年前固有的形像,第一次在公司和消費者面前生動立體了起來:它是真的可以影響到我們每天生活的啊!

確實,現在各大媒體報刊都在用頭條講述人工智慧領域出現的一舉一動,詳細闡述長期 AI 戰略,但就在這樣的火熱環境下,大眾仍然搞不清楚人工智慧究竟是什麼,同時,政府其實也在這方面表現的遲鈍一些,到底技術自動化對於整個社會有著怎樣的影響?

在這個前提下,本文向大家介紹人工智慧領域下的六個細分領域,它們中任何一個現如今都是科研領域的大熱門。所以,跳脫出人工智慧這個籠統的範疇,轉而研究這幾個細分具體化的領域,也許才是更加靠譜的討論方式。因為我們未來的數字產品和服務,都將被它們所左右。

在本文中,我會描述它們是什麼,為什麼重要,如今怎麼來應用它們。最後,還會給出一個清單(當然不會是完全詳盡的),上面列出來有關這些領域的科技公司。

1. 強化學習(Reinforcement learning)

人們在學習一項新技能的時候,往往會有一個試錯的過程,而 RL(強化學習)就是從這個模式中演化而來。在一個標準的 RL 設定中,軟體的任務是觀察在數字環境中當下所處的狀態,並根據已經定好了的最終要達到的效果,採取行動來不斷地接近這個目標。在這個不斷接近的過程中,軟件每執行一個動作,它都能從這個數字環境中得出一個判斷:這個動作到底是推動了我向目標前進,還是阻礙了。

就在這種不斷試探、確認、再試探的反復過程中,軟件逐步找到最優策略和路徑。

該領域之所以會引起大家的注意,是 Google DeepMind 在 Atari games 這個項目上應用了這項技術。而目前這項技術在現實中應用的最大價值竟然是給 Google 的數據中心降溫!

數據中心中裡眾多服務器、儲存設備、網路設備等等在 24 小時的運行著,同時散發著巨大的熱量,采用常規的冷空調系統降溫,不僅使整個數據中心的能耗增大,成本也會相應提高一大塊。而 Google 在利用了 RL 技術可以使得降溫成本下降 40%。

在一個可以被模擬的數字環境(比如影片游戲)中,應用 RL 工具的最大好處就是可以以很低的成本獲取到機器學習的數據。這跟「監督式深度學習」(supervised deep learning)有著明顯區別,後者獲取數據的成本很高,在現實世界中應用的難度也較高。

應用:軟體在迷宮中找路,或者是給無人自駕駛技術在城市街道上行駛提供技術支持,還比如在影片游戲中,讓 NPC 開始學習使用一些高度擬人化的行為。

處在這個領域裡的公司:Google DeepMind, Prowler.io, Osaro, MicroPSI, Maluuba/Microsoft, NVIDIA, Mobileye, OpenAI.

2. 生成式對抗網絡

跟那些用來分類、或者執行「回歸任務」的可識別人工智慧相比,歸納模型基於某個學習對像,可以自發生成一個高度類似的圖像。

就比如說,給軟體看過一張人臉照片之後,它就能立刻生成一張類似的,機器合成的照片。這個技術的基礎其實是:「生成式對抗網絡」(generative adversarial networks) 在人工智慧領域非常火爆,因為它給人們提供出來了一條直抵「非監控式機器學習」的路徑。

生成式對抗網路(Generative Adversarial Nets,GAN)在 2016 年所召開的 NIPS(神經信息處理系統大會)上大放異彩,成為神經網路最受關注的技術之一,其實 GAN 的思想其實十分樸素:有一對模型,一個生成模型(G)生成假樣本,最好是六耳獼猴,直叫眾人真假難辨;一個判別模型(D)識別假樣本,最好是火眼金睛,敢讓贗品無所遁形。

那麼 GAN 的訓練過程就變成了生成模型(G)和判別模型(D)之間的競爭過程——隨機從真實樣本和由生成模型(G)生成出的「假樣本」中取一個,讓判別模型(D)去判斷是否為真。把這個問題,轉化為了一個博弈的問題。利用納什均衡來得到最終的目標函數。

應用案例:在時間序列中模擬出未來(例如規劃未來的工作);通過 2D 圖片來恢復 3D 結構;在視頻中預測下一幀,在對話界面上開發出自然語言,將音樂和語音進行合成等等。

目前正在做這件事的公司:Twitter Cortex、Adobe、Apple、Prisma、Jukedeck、Creative.ai, Gluru*, Mapillary*, Unbabel.。


文章內容屬作者個人觀點,不代表本站立場

大數聚

透過數據,我們聚集各領域的專家,檢視時下重要議題及產業趨勢。當我們聚在一起,用數據說話,說出有意義、有價值的新觀點。歡迎加入我們,一起用數據看世界。

留下您的想法