當(dāng)前位置:首頁 > 資訊 > 行業(yè)資訊 >
在 20 世紀(jì) 50 年代,一個能夠進(jìn)行長除法的計(jì)算器,在現(xiàn)在看來很難說是 AI 中的一項(xiàng)先進(jìn)技術(shù)。這就是這一領(lǐng)域中的“奇怪悖論” ——新技術(shù)出現(xiàn)后并入主流,它們對我們來說就變得不可見了。
人工智能本身并不是一種趨勢,而是當(dāng)代最重要的技術(shù)發(fā)展。它不是一種技術(shù)趨勢,而是繼制表時代、編程時代之后的第三個計(jì)算時代,它連接著我們生活、商業(yè)、管理的方方面面。
2019 年,九家大型科技公司將主導(dǎo) AI 領(lǐng)域,包括六家美國公司,三家中國公司,它們將對人工智能的未來負(fù)有最大的責(zé)任,分別是美國的 G-MAFIA——谷歌、亞馬遜、微軟、蘋果、IBM 和 Facebook。在中國,它們是 BAT——百度、阿里巴巴和騰訊。
這九家公司主要負(fù)責(zé)絕大部分 AI 研究、資金、政府參與和消費(fèi)級應(yīng)用。大學(xué)的研究人員和實(shí)驗(yàn)室將依賴這些公司提供的數(shù)據(jù)、工具和資金。九大巨頭也負(fù)責(zé)合并和收購、資助 AI 初創(chuàng)公司,并支持下一代開發(fā)人員。
美國政府還沒有人工智能方面的大戰(zhàn)略,也沒有長期規(guī)劃,而是將 AI 的基礎(chǔ)研究有效地外包給商業(yè)部門和華爾街。與此同時,在中國,人工智能的發(fā)展軌道和政府拴在了一起。百度、騰訊和阿里巴巴以及所有涉及 AI 的公司,發(fā)展都要受到政府的限制。中國正在迅速奠定成為 AI 霸主的基礎(chǔ)。
不要過分樂觀或恐懼
當(dāng)談到 AI 時,我們總是過于樂觀或恐懼,AI 將導(dǎo)致失業(yè)、殺死人類的論調(diào)不絕于耳。但是,隨著時間的流逝,我們越來越忽視 AI 取得的重大突破和進(jìn)步,數(shù)據(jù)的獲取和探索的過程變得越來越模糊,自動化決策系統(tǒng)的決策機(jī)制越來越不透明。這就種下了不信任和誤解的種子。
在消費(fèi)級人臉產(chǎn)品和應(yīng)用中的 AI 趨勢
現(xiàn)在,專業(yè)研究人員使用的高技術(shù) AI 應(yīng)用程序已經(jīng)在轉(zhuǎn)向更輕巧、用戶友好的應(yīng)用程序。新的自動化機(jī)器學(xué)習(xí)平臺,如 DataRobot,使得非專家也可以構(gòu)建和部署預(yù)測模型。在不久的將來,我們很可能可以在日常生活和工作中使用各種 AI 應(yīng)用程序,就像我們今天使用 Microsoft Office 或 Google Docs 一樣。
數(shù)字助理(DAS),如 Siri、Alexa,以及它們的中國“同行”天貓,利用語義和自然語言處理和數(shù)據(jù)預(yù)測我們想要什么,或者下一步需要做什么。現(xiàn)在,已經(jīng)有成千上萬的應(yīng)用程序和小工具可以跟蹤和響應(yīng) DA。舉一個例子,亞馬遜的 Alexa 在 2018 年推出了 4000 個小工具,現(xiàn)在有超過 28000 個設(shè)備與亞馬遜的 DA 集成。隨著設(shè)備價格的下降(如價格低于 20 美元的入門級揚(yáng)聲器),系統(tǒng)與我們互動的能力越來越強(qiáng),可以預(yù)測,在 2019 年 DA 將無處不在。
它也被稱為“零 UI”,我們的現(xiàn)代接口其實(shí)越來越像氛圍音樂,能夠在少量指導(dǎo)的前提下為我們做更多的事,且能夠吸引我們的注意力。我們將不再依靠單個輸入屏幕,或者很多屏幕,而是更加無障礙地與計(jì)算機(jī)進(jìn)行交互。
在信息時代,普通成年人每天要做出超過 20000 個大大小小的決定,而新型數(shù)字助理將代替我們優(yōu)化決策分配任務(wù),甚至根據(jù)環(huán)境自動回復(fù)。這些決定很有可能不需要你的直接監(jiān)督或輸入。氛圍設(shè)計(jì)變得如此具有吸引力,是因?yàn)樵诓贿h(yuǎn)的未來它能夠減少我們所做的決定。我們可以將之視為一種意愿自動完成機(jī)制。我們將主動和被動地與可用設(shè)備、恒溫器、汽車或口袋中的 DA 進(jìn)行互動,他們會在后臺聽取和觀察,有時甚至?xí)釂枺袝r還會根據(jù)需要為我們提供文本、音頻或觸覺通知,所有這些將由算法決定。梅特卡夫定律(Metcalfe's law:一個網(wǎng)絡(luò)的價值等于該網(wǎng)絡(luò)內(nèi)的節(jié)點(diǎn)數(shù)的平方,而且該網(wǎng)絡(luò)的價值與聯(lián)網(wǎng)的用戶數(shù)的平方成正比)解釋了環(huán)境接口的定義。
隨著越來越多的人成為環(huán)境信息網(wǎng)絡(luò)的一部分,我們將來會看到更多的環(huán)境接口用例。
深度移動鏈接自智能手機(jī)出現(xiàn)起就已存在,它使我們可以更輕松地在所有手機(jī)應(yīng)用中查找和共享數(shù)據(jù)。有三種深層次的聯(lián)系:傳統(tǒng)的、延遲的和語境的。傳統(tǒng)的深層鏈接可以從一個應(yīng)用或網(wǎng)站重定位用戶:比如當(dāng)你點(diǎn)擊某人在 Twitter 上發(fā)布的華爾街日報鏈接,只要你安裝了 WSJ 應(yīng)用程序,它就可以在 WSJ 應(yīng)用程序中自動打開。如果安裝了應(yīng)用程序,延遲深層鏈接可以直接鏈接到內(nèi)容,也可以連接到應(yīng)用商店以下載應(yīng)用程序。上下文深層鏈接提供更多的信息,它們可以將你從網(wǎng)站帶到 App,從 App 帶到網(wǎng)站,或從 App 帶到 App,還可以提供個性化信息。
隨著機(jī)器學(xué)習(xí)的進(jìn)步,針對個人用戶習(xí)慣量身定制的應(yīng)用到應(yīng)用體驗(yàn)可能會變得更加普及。
隨著人工智能領(lǐng)域的蓬勃發(fā)展,部署代碼的人數(shù)也在不斷增加。隨著自動化系統(tǒng)變得越來越普遍,所有代碼都會傳輸?shù)剿惴ㄖ校渲幸恍┧惴〞^續(xù)生成新的算法,由此產(chǎn)生的過程和程序可能比最初的預(yù)期更復(fù)雜。這可能會導(dǎo)致不可預(yù)測性,使得理解決策過程變得更加困難。對于像 Facebook 這樣數(shù)十億算法同時工作的大公司而言,這已經(jīng)是一個挑戰(zhàn)。
它也被稱為數(shù)字雙胞胎,許多初創(chuàng)公司可以構(gòu)建可部署的 AI 版本,他們提供可定制、可訓(xùn)練的平臺,能夠?qū)W習(xí)關(guān)于你本人的一切,作為你在網(wǎng)絡(luò)上的代表。Molly 是 Y Combinator 支持的一家創(chuàng)業(yè)公司,也是幾個新的 AI 代理商之一。它的功能更像 AMA(有問必答),在這里,每個人都可以得到關(guān)于你的信息。遇到不懂的,Molly 會“請教”你本人,學(xué)習(xí)關(guān)于你的知識。
人工智能有嚴(yán)重的偏見問題并不是秘密。這個問題是多方面的,例如:用于訓(xùn)練的數(shù)據(jù)集通常來自維基百科等地,這本身就充滿了偏見。人們建造模型往往是同質(zhì)的,并經(jīng)常意識不到自己的偏見。隨著我們的計(jì)算機(jī)系統(tǒng)越來越習(xí)慣于做出決策,我們可能會發(fā)現(xiàn)自己被按算法做出毫無意義的分類,但這可能會產(chǎn)生巨大的影響。
每一天,我們都在主動(在 Facebook 上傳和標(biāo)記照片)或被動地(在線搜索醫(yī)療癥狀、開車上班)創(chuàng)建難以想象的大量數(shù)據(jù)。這些數(shù)據(jù)經(jīng)常在你未知的情況下被算法挖掘和使用,用于制作廣告,幫助潛在雇主預(yù)測我們的行為,確定我們的抵押貸款利率,甚至幫助執(zhí)法預(yù)測我們是否可能犯罪。包括馬里蘭大學(xué)、哥倫比亞大學(xué)、卡內(nèi)基梅隆大學(xué)、麻省理工學(xué)院、普林斯頓大學(xué)、加州大學(xué)伯克利分校、國際計(jì)算機(jī)科學(xué)研究所等多所大學(xué)的研究人員正在研究自動化決策的副作用。
毫無疑問,有人認(rèn)為人工智能正在成為一個“黑匣子”,即使在該領(lǐng)域工作的研究人員也不了解最新的系統(tǒng)是如何運(yùn)作的。但這并不完全正確,雖然計(jì)算機(jī)科學(xué)家、記者和計(jì)算機(jī)科學(xué)家越來越關(guān)注這一問題,認(rèn)為人工智能系統(tǒng)不應(yīng)該是個秘密。 展望未來,我們將討論 AI 是否應(yīng)該、如何能夠解釋其決策,以及如何提高透明度。關(guān)于問責(zé)制的辯論也會很多。但解決這個問題面臨著一個巨大的挑戰(zhàn),即透明度將要求公司公開其商業(yè)利潤的秘訣,而且要求系統(tǒng)同時解釋決策過程會降低輸出的速度和質(zhì)量。
我們很快即將到達(dá)一個時刻,即無論是有意還是無意,我們都無法判斷數(shù)據(jù)集是否已經(jīng)被篡改過。AI 系統(tǒng)依賴于我們的信任。如果我們不再相信結(jié)果,那么幾十年的研究和技術(shù)進(jìn)步將是徒勞的。政府、企業(yè)、非營利組織等領(lǐng)域的領(lǐng)導(dǎo)者必須對所使用的數(shù)據(jù)和算法充滿信心。
建立信任和問責(zé)制是公開工作的一種方法,這個過程將非常復(fù)雜,因?yàn)楣尽⒄畽C(jī)關(guān)、執(zhí)法機(jī)構(gòu)和其他組織希望數(shù)據(jù)保密。
計(jì)算機(jī)完全按照命令行事。只要命令機(jī)器在游戲中獲勝,機(jī)器將會不惜不惜一切代價完成這個任務(wù)。顯然包括作弊。
斯坦福大學(xué)和谷歌的研究人員發(fā)現(xiàn),將衛(wèi)星圖像轉(zhuǎn)換為可用地圖的 AI 可能會“扣留”某些數(shù)據(jù)。這個名為 CycleGAN 的神經(jīng)網(wǎng)絡(luò)可以學(xué)習(xí)如何映射圖像變換。例如,它可以從一張鄰居的舊航拍照片中區(qū)分街道、小巷、車道、建筑物和燈柱,并生成可供 GPS 使用的地圖。最初,他們使用了網(wǎng)絡(luò)尚未看到的航拍照片,由此產(chǎn)生的圖像看起來非常接近原始圖像。
但經(jīng)過深入檢查,研究人員發(fā)現(xiàn),原始圖像和生成的圖像中都有很多細(xì)節(jié),這些細(xì)節(jié)在 AI 制作的地圖中是看不到的。事實(shí)證明,系統(tǒng)學(xué)會了在以低幅度高頻信號的形式產(chǎn)生的圖像中隱藏有關(guān)圖像內(nèi)部原始圖像的信息。
2018 年發(fā)生了許多與人工智能有關(guān)的事故,但只有少數(shù)成為頭條新聞,比如一輛優(yōu)步無人車在亞利桑那州坦佩致一名行人死亡。但事實(shí)上還有無數(shù)次事件沒有導(dǎo)致死亡,因此不為公眾所知。 目前,除非觸犯法律,研究人員沒有義務(wù)報告涉及我們的數(shù)據(jù)或 AI 流程的事故或意外。雖然大公司必須告知消費(fèi)者他們的個人數(shù)據(jù),如信用卡號碼等是否被盜,但他們并不需要公布算法根據(jù)種族或性別產(chǎn)生歧視的情況。
在過去的幾年里,中國在人工智能領(lǐng)域取得了巨大的飛躍。中國提出到 2030 年成為“世界最重要的人工智能創(chuàng)新中心”,作為一個國家,中國已經(jīng)朝著這個目標(biāo)取得了重大進(jìn)展。九大巨頭中的百度、阿里巴巴和騰訊,加上其強(qiáng)大的學(xué)術(shù)環(huán)境,鞏固了中國作為全球人工智能霸主的地位。
阿里巴巴,中國版的亞馬遜將投資 150 億美元在未來三年內(nèi)進(jìn)行人工智能研究,在全球七個城市(包括加利福尼亞州圣馬特奧和華盛頓州貝爾維尤)建立研究中心。
百度(一家經(jīng)常與谷歌相比的中國搜索引擎公司)在硅谷建立了一個人工智能研究中心。
騰訊(超級流行的消息應(yīng)用程序微信的開發(fā)者)去年在西雅圖開設(shè)了一個人工智能實(shí)驗(yàn)室,開始搜羅美國的人才。此后,騰訊還增持特斯拉和 Snap 等公司的股份。
中國企業(yè)收益不僅僅包括典型的投資回報,也更加重視知識產(chǎn)權(quán)。總部位于中國的人工智能創(chuàng)業(yè)公司目前占全球投資總額的 48%。2018 年 4 月,商湯估值 45 億美元,使其成為當(dāng)時全球最有價值的人工智能創(chuàng)業(yè)公司。與此同時,與美國同行相比,中國研究人員擁有的 AI 相關(guān)專利數(shù)量是其五倍。
接近 14 億的龐大人口為研究人員和創(chuàng)業(yè)公司提供了未來最有價值的資源——人類數(shù)據(jù),而沒有世界其他大部分地區(qū)普遍存在的隱私和安全限制。如果數(shù)據(jù)是新的石油,那么中國就是新的石油輸出國組織。中國人正在挖掘的豐富數(shù)據(jù)可用于訓(xùn)練人工智能的方方面面,從教育、制造到零售和軍事應(yīng)用的各種模式。例如,中國創(chuàng)業(yè)公司曠視就是開創(chuàng)面紋生成技術(shù)的先驅(qū)。面紋生成是一種新型的生物識別身份驗(yàn)證,它使用我們面部的骨骼結(jié)構(gòu)、膚色,甚至毛細(xì)血管等特征來進(jìn)行識別。這項(xiàng)技術(shù)安全性足以用于金融交易 ,并被中國警方廣泛用于監(jiān)控。
如果中國開始影響其“一帶一路”國家將會如何?想想一下,如果這些國家強(qiáng)制采用國家社會信用評分系統(tǒng),未經(jīng)居民明確同意開始進(jìn)行監(jiān)控,并且有一個系統(tǒng)在默默打分會發(fā)生什么?
在過去的一年中,AI 生態(tài)系統(tǒng)的企業(yè)領(lǐng)導(dǎo)者一直在爭奪 AI 云共享份額,成為遠(yuǎn)程服務(wù)器上值得信賴的 AI 提供商。
由于機(jī)器學(xué)習(xí)系統(tǒng)可以訪問的數(shù)據(jù)越多,舊可以學(xué)會做出更好的決策,因此企業(yè)客戶可能會堅(jiān)持使用原始供應(yīng)商。因此,AI 云的競賽開始了。在西方,該領(lǐng)域由亞馬遜、谷歌和微軟領(lǐng)導(dǎo),其次是蘋果、IBM、Salesforce、SAP 和甲骨文等公司。在亞洲市場,AI 云由阿里巴巴和百度主導(dǎo)。這是一個價值 2500 億美元的行業(yè),而且發(fā)展迅速。
紐約大學(xué)斯特恩商學(xué)院教授 Arun Sundararajan 講得好:“這場競賽的獎品將是成為下一個科技時代的操作系統(tǒng)。“
AWS、阿里巴巴云、微軟 Azure、谷歌云和百度云都為開發(fā)人員推出了新的產(chǎn)品和套餐,希望能讓更多人工智能創(chuàng)業(yè)公司更容易、成本更低地將他們的想法推向市場。亞馬遜的 AWS Lambda 讓團(tuán)隊(duì)可以虛擬地運(yùn)行任何類型的應(yīng)用程序或后端服務(wù)代碼,而無需配置或管理服務(wù)器或?qū)嶋H管理。微軟 Azure 功能架構(gòu)支持無數(shù)的編程語言,可根據(jù)需要進(jìn)行擴(kuò)展,僅對主動計(jì)算時間收費(fèi)。然而,這并不適合一些工程師,他們擔(dān)心會失去控制。
法律往往落后于技術(shù)。然而,去年在亞利桑那州發(fā)生的優(yōu)步無人車致命事故現(xiàn)在讓風(fēng)險管理人員和法律部門考慮到因人工智能事故而導(dǎo)致意外損失的風(fēng)險。我們面臨的挑戰(zhàn)是當(dāng)前建立的法律制度是為了規(guī)范人類行為,而不是無人監(jiān)督機(jī)器的行為。目前,安聯(lián)正在研究新的責(zé)任保險模型。
芯片廠商英偉達(dá)正在教 AI 構(gòu)建來自短視頻剪輯的逼真 3D 環(huán)境。該方法建立在先前關(guān)于生成對抗網(wǎng)絡(luò)(GAN)的研究基礎(chǔ)上。英偉達(dá)的系統(tǒng)生成圖形取自自動駕駛領(lǐng)域使用的開源數(shù)據(jù)集,使用分割成各種類別(建筑物、天空、車輛等)的短片,英偉達(dá)訓(xùn)練 GAN 生成這些物體的新的不同版本。
自動生成的虛擬環(huán)境未來應(yīng)用潛力巨大:物流(倉庫、工廠、運(yùn)輸中心)、城市訓(xùn)練環(huán)境規(guī)劃模擬,以及測試游樂園和購物中心內(nèi)的客戶流動場景等。
在建筑物內(nèi)部署生物識別 ID 系統(tǒng)之前,公司可能需要三思而后行。機(jī)器學(xué)習(xí)新技術(shù)已經(jīng)導(dǎo)致合成指紋和其他能夠愚弄監(jiān)控系統(tǒng)的自動生成生物識別器出現(xiàn)。密歇根州立大學(xué)和紐約大學(xué)的研究人員構(gòu)建了一種可以生成假貨的算法,這提醒了我們 AI 騙局的可怕之處,想象一下,惡意系統(tǒng)產(chǎn)生數(shù)百萬個指紋,遠(yuǎn)程就可以開門或解鎖別人的電腦。
麻省理工學(xué)院計(jì)算機(jī)視覺科學(xué)家已經(jīng)發(fā)現(xiàn)了如何利用他們所謂的“意外攝像機(jī)”,使用計(jì)算機(jī)視覺來跟蹤數(shù)據(jù)。結(jié)果,我們可能很快就會有 X 射線一樣的視力,穿墻透視。對于從事敏感項(xiàng)目的公司而言,這可能不是一個好消息。
從事信息安全和風(fēng)險管理的人員應(yīng)注意到計(jì)算機(jī)視覺的這一進(jìn)步。
隨著我們進(jìn)入第三個計(jì)算時代,最大的公司都開始在競爭市場份額的同時爭奪思想共享的高地。
微軟、IBM、百度、阿里巴巴、亞馬遜和谷歌等公司正在為開發(fā)人員發(fā)布軟件包,且 AI 應(yīng)用程序有自己獨(dú)特的編程語言。優(yōu)步發(fā)布了自己用 Python 編寫的概率編程語言 Pyro。這一舉動標(biāo)志著人工智能生態(tài)系統(tǒng)未來可能碎片化,與我們的 OSX 與 Android 以及早期的 Mac 與 PC 陣營不同。企業(yè)將發(fā)現(xiàn)成本越來越高,且難以輕易在 AI 框架和語言之間切換。
我們的臺式機(jī)、筆記本電腦、平板電腦和手機(jī)中的標(biāo)準(zhǔn) CPU 確實(shí)變得越來越強(qiáng)大,但它們的設(shè)計(jì)并不是為了滿足機(jī)器學(xué)習(xí)的需求。當(dāng)前的 CPU 存在的問題,是它們沒有足夠的處理單元來完成下一代計(jì)算時代所需的所有連接和計(jì)算。我們在 SoC-“片上系統(tǒng)”中找到一套新的處理器。華為、蘋果、Alphabet、IBM、英偉達(dá)、英特爾和高通都在開發(fā)新的系統(tǒng)架構(gòu)和 SoC,有些經(jīng)過了預(yù)先訓(xùn)練。簡而言之,這意味著用于 AI 項(xiàng)目的芯片已準(zhǔn)備好,并且速度更快,數(shù)據(jù)更安全。 Elon Musk 表示特斯拉的新定制 AI 芯片將于 2019 年發(fā)布。谷歌的 TPU 專為 AI 深度學(xué)習(xí)而設(shè)計(jì),適配公司采用的 TensorFlow 系統(tǒng)。
雖然向企業(yè)營銷預(yù)先訓(xùn)練的芯片將加速 AI 芯片商業(yè)化,并進(jìn)一步促進(jìn)芯片研發(fā),但是開發(fā)人員可能需要在不久的將來在不同的框架之間掙扎,尤其是當(dāng)各種設(shè)備制造商都決定開始創(chuàng)建自有的協(xié)議。我們希望這些公司的產(chǎn)品最終能夠融合,競爭公司及其 SoC 和語言越少越好。
受人工智能云和無服務(wù)器計(jì)算的激勵,九大巨頭以及開發(fā)者社區(qū)都在新興的算法交易市場推出自己的算法。亞馬遜、IBM、微軟、谷歌、百度和阿里巴巴都提供預(yù)建和可定制的系統(tǒng)。AWS 擁有自己的市場,提供計(jì)算機(jī)視覺、語音識別和文本的模型和算法,其基礎(chǔ)客戶包括英特爾、CloudSight、Optpace 等。GenesisAI 為 AI 產(chǎn)品和服務(wù)提供市場。Algorithmia是一個通用的開放式算法市場,開發(fā)人員可以將他們的成果上傳到云端出售。Quantiacs 讓開發(fā)人員構(gòu)建算法交易系統(tǒng),并為算法和投資機(jī)構(gòu)牽線搭橋。Nuance 是一家醫(yī)學(xué)成像 AI 算法“商店”,其 AI MarketPlace 允許用戶在購買之前試用算法。PrecisionHawk 提供預(yù)測性農(nóng)業(yè)算法和模型的市場。Bonseyes 是一個歐洲的 AI 工具交易市場。2019 年,預(yù)計(jì)將出現(xiàn)更多通用的、云定制的市場。
目前只有九家大公司主導(dǎo)人工智能領(lǐng)域:谷歌、亞馬遜、微軟、IBM、Facebook 和蘋果在美國,以及在中國的大公司百度、阿里巴巴和騰訊(得到中國政府的大力支持)。在投資方面,高通、騰訊、英特爾投資、谷歌風(fēng)險投資、英偉達(dá)、Salesforce、三星風(fēng)險投資、阿里巴巴、蘋果、百度、花旗和 In-Q-Tel 正在為 AI 的成長提供大部分資金。在美國,人工智能公司的投資在 2018 年前兩個季度達(dá)到創(chuàng)紀(jì)錄的 42 億美元。中國的商湯完成了另一輪成功的融資,融資 6.2 億美元,估值 45 億美元。投資者包括阿里巴巴集團(tuán)、富達(dá)國際和銀湖合伙公司。與所有技術(shù)一樣,只有少數(shù)幾家公司在 AI 領(lǐng)域占據(jù)主導(dǎo)地位,它們一般會壟斷人才和知識產(chǎn)權(quán),并彼此合作。談到人工智能的未來,我們應(yīng)該思考一個問題,整合是否意味著更大的利益,壟斷是否會破壞競爭,就像電信領(lǐng)域一樣。
實(shí)時機(jī)器學(xué)習(xí)的新研究可以使用連續(xù)的交易數(shù)據(jù)流來實(shí)時調(diào)整模型。這標(biāo)志著數(shù)據(jù)流動和信息檢索的方式發(fā)生了巨大的變化。例如,即使是在多語言環(huán)境中,實(shí)時機(jī)器學(xué)習(xí)也可以自動翻譯語音。它可用于改進(jìn)分類和預(yù)測,進(jìn)行更好的個性化健康監(jiān)測和更準(zhǔn)確的風(fēng)險計(jì)算。消費(fèi)者可以期待收到零售商的更多定制化推薦。實(shí)時偏好不僅會使用歷史數(shù)據(jù)(客戶#1234 只喜歡紅色唇膏),而且會考慮上下文信息(顧客#1234 可能會在接下來的三周內(nèi)購買紅色唇膏)。
我們被現(xiàn)實(shí)世界中的非結(jié)構(gòu)化文本所包圍,它們存在于社交媒體、博客、公司網(wǎng)站、市政廳數(shù)字記錄等各個角落。NLU 允許研究人員通過提取概念、映射關(guān)系和分析情感量化并學(xué)習(xí)所有文本。NLU 將輔助從事科學(xué)和醫(yī)學(xué)、法律和政策、基礎(chǔ)設(shè)施、農(nóng)業(yè)、交通、教育等領(lǐng)域的研究人員,使他們能夠比以往任何時候都能獲得更深入的見解。
2019 年,自然語言理解將在包括口音和語言識別在內(nèi)的自然語言理解領(lǐng)域獲得進(jìn)步。
對于 AI 研究人員來說,機(jī)器閱讀理解一直是一個重要且具有挑戰(zhàn)性的目標(biāo)。MRC 使系統(tǒng)可以讀取、推斷意義,并在篩選大量數(shù)據(jù)集時立即得到答案。
一個消費(fèi)級應(yīng)用:當(dāng)進(jìn)行搜索查詢時,你會想要系統(tǒng)為你提供一個精確的答案而不僅是一個 URL 列表;一名航空機(jī)械師在飛機(jī)發(fā)生故障時為盡快解決引擎問題,計(jì)算機(jī)可以幫他閱讀所有技術(shù)文檔并提供修復(fù)建議,讓飛機(jī)盡快起飛。這是 MRC 的未來,它將不僅關(guān)注關(guān)鍵詞,經(jīng)過訓(xùn)練的 MRC 還可以遷移到?jīng)]有標(biāo)簽或標(biāo)準(zhǔn)分類的各個領(lǐng)域。
MRC 是實(shí)現(xiàn)通用人工智能的必要步驟, 但在短期內(nèi)它可能只能做到把技術(shù)手冊、歷史地圖、醫(yī)療記錄等內(nèi)容轉(zhuǎn)變?yōu)橐子谒阉鞯馁Y料庫信息。
算法可以使用自然語言生成將結(jié)構(gòu)化數(shù)據(jù)變成自然語言。NLG 對于零售、金融和媒體在內(nèi)的各個領(lǐng)域非常重要。2019 年,NLG 將成為大多數(shù)商業(yè)智能和分析平臺的標(biāo)配,可以執(zhí)行自動檢測、解析、可視化和敘述關(guān)鍵數(shù)據(jù)。Arria NLG、IBM Watson 文本 - 語音、亞馬遜 Polly、谷歌云文本 - 語音、Narrative Science 和 Automated Insights 都可以利用大數(shù)據(jù)集構(gòu)建自然語言,幫助非數(shù)據(jù)科學(xué)人員更好地了解其組織。
NLG 在專業(yè)領(lǐng)域擁有無數(shù)的用例,例如協(xié)助律師、政治家、醫(yī)生、顧問、金融分析師、營銷人員及其他人將我們的個人信息作為自然語言的數(shù)據(jù)點(diǎn)。
芯片制造商英偉達(dá)的研究人員在 2018 年部署了一種新的生成算法,使用生成對抗網(wǎng)絡(luò)創(chuàng)建逼真的人臉。在他們的系統(tǒng)中,算法還可以調(diào)整各種元素,如年齡和雀斑密度。
加州大學(xué)伯克利分校的一個團(tuán)隊(duì)開發(fā)了一個軟件,可以自動將視頻中一個人的動作遷移到另一個視頻中的另一個人身上。很長時間以來,我們都在訓(xùn)練計(jì)算機(jī)觀看視頻并預(yù)測物理世界中的相應(yīng)聲音,目的是了解現(xiàn)實(shí)世界中事物之間的交互方式。然而,這導(dǎo)致了越來越多的 AI 騙局,如虛假視頻和虛假圖像。未來,這個問題變得越來越嚴(yán)重,AI 以假亂真將引起更多的麻煩。
IBM 的 Project Debater 展示了如何在實(shí)時學(xué)習(xí)系統(tǒng)中使用上下文。Project Debater 可以就復(fù)雜的主題和人類辯論,通過消化大量文本,在給定主題上構(gòu)建結(jié)構(gòu)語言,傳達(dá)清晰的目的并反駁其對手。未來,Project Debater 將通過提供基于證據(jù)的論證,克服情緒、偏見或模糊的影響來幫助人們進(jìn)行推理。Debater 只是此類新興系統(tǒng)的一個例子,它能夠?qū)崟r學(xué)習(xí)并利用真實(shí)環(huán)境。
研究人員正在開發(fā)一種可以學(xué)習(xí)多項(xiàng)任務(wù)的單一算法。AlphaGo 背后的團(tuán)隊(duì)開發(fā)了一種創(chuàng)新的算法:AlphaZero,不僅可以在圍棋中實(shí)現(xiàn)超人的表現(xiàn),還可以在國際象棋和日本國際象棋等其他游戲中超過人類。除了游戲規(guī)則之外,這一算法沒有經(jīng)過任何知識訓(xùn)練,即開發(fā)出自己的策略來擊敗其他玩家。
如果計(jì)算機(jī)系統(tǒng)可以訪問足夠多的圖像,就可以修補(bǔ)并填充圖片中的空缺。我們可以利用這項(xiàng)技術(shù)生成更完美的圖像。
但是,這項(xiàng)技術(shù)下一階段將用于什么情景,產(chǎn)生什么影響?我們?nèi)绾蝿澐脂F(xiàn)實(shí)與增強(qiáng)之間的界限?圖像補(bǔ)全還是執(zhí)法和軍事情報人員的有力工具,計(jì)算機(jī)可以幫助他們識別取景框中的對象。鑒于機(jī)器學(xué)習(xí)算法和數(shù)據(jù)集的偏見,圖像補(bǔ)全未來可能引起關(guān)于隱私的爭論。
美國陸軍研究實(shí)驗(yàn)室的一項(xiàng)新研究顯示,該系統(tǒng)使用一個裝有腦機(jī)接口的界面,利用計(jì)算機(jī)視覺技術(shù)讓人們在視線范圍內(nèi)快速查看和分類圖像。總部位于洛杉磯的專業(yè)圖像字幕技術(shù)公司 CloudSight 正在研發(fā)一套混合眾包計(jì)算機(jī)視覺系統(tǒng)。
麻省理工學(xué)院 CSAIL 的研究人員訓(xùn)練計(jì)算機(jī)不僅能識別視頻中的內(nèi)容,還能預(yù)測人類接下來要做什么。目前,該計(jì)算機(jī)系統(tǒng)可以預(yù)測視頻中的兩個人是否可能擁抱、親吻、握手或擊掌。
這項(xiàng)研究將在某一天讓機(jī)器人能夠更輕松地探索現(xiàn)實(shí)環(huán)境,并從我們的肢體語言中獲取線索,和人類進(jìn)行互動。它還可以應(yīng)用于零售環(huán)境,以及機(jī)器操作、教室學(xué)習(xí)環(huán)境等。
深度學(xué)習(xí)系統(tǒng)經(jīng)過訓(xùn)練可以自主學(xué)習(xí)。從概念上講,深度學(xué)習(xí)不是新事物了,最近只是計(jì)算能力和可用的數(shù)據(jù)量有了變化,這意味著越來越多的人工流程將實(shí)現(xiàn)自動化,包括自動編寫軟件等。
深度學(xué)習(xí)受到計(jì)算機(jī)網(wǎng)絡(luò)處理能力的限制,就在幾年前,在 ImageNet 數(shù)據(jù)集上訓(xùn)練圖像識別模型需要一個月或更長時間,現(xiàn)在,憑借更先進(jìn)的設(shè)備,F(xiàn)acebook 可以在一小時內(nèi)完成同樣的工作。隨著計(jì)算機(jī)變得越來越快和硬件架構(gòu)的發(fā)展,我們的系統(tǒng)將以遠(yuǎn)超人類的速度執(zhí)行任務(wù)。
強(qiáng)化學(xué)習(xí)有一個問題:當(dāng)代理沒有足夠的監(jiān)督,或其目標(biāo)是在很長一段時間內(nèi)運(yùn)行場景,對于它們來說是一個很大的挑戰(zhàn)。2019 年及以后,研究人員將嘗試使用分層強(qiáng)化學(xué)習(xí)解決這些問題——發(fā)現(xiàn)高級別的行動并有條不紊地通過學(xué)習(xí),以人類無法想象的速度掌握新任務(wù)。這對于非技術(shù)人員來說也很重要:RL 將改善人工智能系統(tǒng)中的“智能”,幫助汽車學(xué)習(xí)在異常條件下行駛,幫助軍用無人機(jī)執(zhí)行以前從未在現(xiàn)實(shí)世界中嘗試的復(fù)雜操作。
目前,深度學(xué)習(xí)技術(shù)可以幫助人類完成具體的任務(wù),但完成任務(wù)需要嚴(yán)謹(jǐn)?shù)捻樞颍菏占瘮?shù)據(jù)、確定目標(biāo)、部署算法,這個過程需要人類操作且非常耗時,尤其是在需要監(jiān)督訓(xùn)練的早期階段。持續(xù)學(xué)習(xí)(CL)更多地是關(guān)于自主性和增量技能的建立和發(fā)展,研究人員將在 2019 計(jì)息推動其發(fā)展。
看起來毫不相關(guān)的任務(wù)之間實(shí)際上存在著千絲萬縷的關(guān)系,有助于達(dá)成最終目標(biāo)。研究人員會監(jiān)督系統(tǒng),對其進(jìn)行微調(diào),直到模型按照預(yù)期工作。但只關(guān)注單一任務(wù)往往會導(dǎo)致效率低下,因此,多任務(wù)學(xué)習(xí)這個新的研究領(lǐng)域?qū)椭到y(tǒng)探索各種相關(guān)任務(wù)之間的聯(lián)系,以更好地解決問題。
GAN 是指由兩個對抗性神經(jīng)網(wǎng)絡(luò)組成的無監(jiān)督深度學(xué)習(xí)系統(tǒng),可以視之為沒有人類參與的圖靈測試。經(jīng)過兩個對抗神經(jīng)網(wǎng)絡(luò)之間的“對抗”,AI 最終會自動生成現(xiàn)實(shí)世界不存在的逼真圖像。
GAN 的目標(biāo)不是耍詭計(jì),而是為了解決合成數(shù)據(jù)的問題。GAN 使 AI 系統(tǒng)能夠處理尚未清理的原始真實(shí)數(shù)據(jù),且無需人工程序員的直接監(jiān)督。
用于生成建模的自回歸分位數(shù)網(wǎng)絡(luò)(簡稱 AIQN)聽起來很復(fù)雜,但它是一個創(chuàng)新的想法,有助于改進(jìn)算法,使算法更穩(wěn)定。這意味著它可以加快 AI 進(jìn)步,為整個生態(tài)系統(tǒng)創(chuàng)造更多機(jī)遇和創(chuàng)新。
這種新型的神經(jīng)網(wǎng)絡(luò)可以利用分層關(guān)系處理信息,解決了一個關(guān)鍵問題:默認(rèn)的卷積神經(jīng)網(wǎng)絡(luò)無法檢測簡單和復(fù)雜對象之間的某些關(guān)鍵空間層次結(jié)構(gòu)。因此,這些新型網(wǎng)絡(luò)可以將錯誤率減少 50%。
概率編程語言為開發(fā)概率模型減輕了一些壓力大且乏味的工作。這些新型語言允許開發(fā)人員構(gòu)建、重用和共享他們的模型庫,同時可以容納不完整的信息。
傳統(tǒng)機(jī)器學(xué)習(xí)方法耗時,麻煩,尤其對于 AI 領(lǐng)域的數(shù)據(jù)科學(xué)家、專家和工程師。自動機(jī)器學(xué)習(xí)是一種新的方法:將原始數(shù)據(jù)和模型匹配在一起找到最相關(guān)信息。現(xiàn)在有許多 AutoML 產(chǎn)品和服務(wù)由谷歌、亞馬遜和微軟提供。
很快,個人用戶就可以上傳自己的數(shù)據(jù)來定制現(xiàn)有的模型。谷歌的 Cloud AutoML 是一套機(jī)器學(xué)習(xí)工具,可以讓沒有經(jīng)過嚴(yán)格訓(xùn)練的員工定制機(jī)器學(xué)習(xí)模型。
機(jī)器人連續(xù)第五年出現(xiàn)在報告中。當(dāng)今,機(jī)器人已經(jīng)成為一個主流詞匯,且不僅只面向消費(fèi)級群體,如英國勞埃德銀行的員工使用機(jī)器人訪問該公司的知識庫,谷歌于 2018 年推出智能助手 Duplex 系統(tǒng),可以代表用戶打電話和預(yù)定餐廳。
未來,機(jī)器人的另一大進(jìn)步將不是關(guān)于技術(shù)本身,而是規(guī)范。2018 年,機(jī)器人網(wǎng)絡(luò)發(fā)送虛假信息引起了人們對于機(jī)器人造成信任恐慌的擔(dān)憂,這導(dǎo)致了加利福尼亞決定立法,要求機(jī)器人在進(jìn)行交互時表明自己不是人類,這條法律于 2019 年 7 月 1 日生效,要求機(jī)器人“清晰、有意識地、用合理的設(shè)計(jì)告知人類與其交互的是一個機(jī)器人”。這次立法成功將成為其他州和國家關(guān)于機(jī)器人立法的新基準(zhǔn),尤其是當(dāng) Duplex 這樣的產(chǎn)品大規(guī)模流入市場時。
谷歌、亞馬遜、Facebook、Jigsaw、推特、Instagram、Chatfuel、Pandorabots、Twilio、亞馬遜、科大訊飛、Slack、微信、騰訊、百度、微博、阿里巴巴、IBM、微軟、Snapchat、Coral Project。
這一部分技術(shù)趨勢包括面紋識別、聲紋識別、姿勢識別、個性化特征識別、情感識別、骨識別、基因識別、通用基因數(shù)據(jù)庫、行為生物識別、WIFI 識別、環(huán)境跟蹤、計(jì)算圖形、語音合成、持續(xù)識別、識別技術(shù)偏見。
現(xiàn)在,先進(jìn)的計(jì)算機(jī)系統(tǒng)根據(jù)我們獨(dú)特的特征,如骨骼結(jié)構(gòu)、姿勢、情感狀態(tài)等,不僅能夠識別出我們是誰,還可以知道我們在想什么。
2019 年,面紋識別技術(shù)將受到法律方面的挑戰(zhàn)。2017 年,一名聯(lián)邦法官通過了針對 Shutterfly 提起的集體訴訟,這家公司涉嫌違反伊利諾伊州生物識別信息隱私法案,該法案要求公司在收集包括面孔在內(nèi)的生物識別數(shù)據(jù)之前需獲得書面許可。(伊利諾伊州的這條法律是美國唯一存在的此類法律。)Facebook 目前也正在處理伊利諾伊州居民提出的第 9 起訴訟,這些居民認(rèn)為 Facebook 在平臺照片標(biāo)簽功能中識別他們的臉部違反了該法律。
機(jī)器學(xué)習(xí)技術(shù)加上大數(shù)據(jù),可以讓研究人員僅通過聲音的微妙信息就識別出你是誰,福特和大眾合作開發(fā)的駕駛室精準(zhǔn)聲紋識別,可以檢測到駕駛員是否醉駕或處于疲憊狀態(tài)。
姿勢識別技術(shù)現(xiàn)在已經(jīng)可以通過翻譯動作識別我們的身份,并代表我們做出決定。自然用戶接口(NUIs)是未來很多技術(shù)的組成部分,2019 年,我們將看到更多 NUIs 幫助我們通過身體姿勢控制機(jī)器,且工作場所將出現(xiàn)記錄我們的身體動作,預(yù)測我們生產(chǎn)效率最高時段的設(shè)備。
越來越多的分析工具將出現(xiàn),收集關(guān)于你的數(shù)據(jù)、行為和偏好,為你進(jìn)行個性畫像,以預(yù)測你在所有場景下可能有的反應(yīng),目標(biāo)是預(yù)測你的特定需求和意愿,如未來的資金交易情況等。
去年,亞馬遜為一個新系統(tǒng)申請了專利,該系統(tǒng)根據(jù)用戶之前和當(dāng)前的互動檢測用戶的身體和情緒健康狀況。如果它發(fā)現(xiàn)你生病了,那么亞馬遜會推薦一小時送藥到家。汽車制造商起亞于 2019 年在 CES 上首次推出其實(shí)時情感自適應(yīng)駕駛系統(tǒng)(R.E.A.D.),這個識別系統(tǒng)可以通過傳感器監(jiān)控乘客的面部表情、心率和皮膚活動,調(diào)整車輛內(nèi)部環(huán)境以適應(yīng)乘客的情緒狀態(tài)。
2018 年,美國空軍申請了一項(xiàng)專利,該專利解釋了寬帶雷達(dá)如何通過骨骼結(jié)構(gòu)進(jìn)行識別。人類會發(fā)射天線向彼此發(fā)送信號,將該人的生物識別雷達(dá)特征與數(shù)據(jù)庫中的已知特征進(jìn)行比較。對于身體上有螺釘和金屬條的人來說,這是個壞消息,因?yàn)槿祟惾庋劭床坏降臇|西在掃描時會變成清晰的信標(biāo)。
消費(fèi)者基因檢測可以讓人們更輕松地了解自己的祖先,但同時讓人們在未授權(quán)的情況下變成檢測的目標(biāo)。現(xiàn)在,人類的原始生物數(shù)據(jù)可以被上傳到 GEDmatch 等開源數(shù)據(jù)庫中,允許用戶在所有 DNA 平臺上尋蹤溯源。此外,在未經(jīng)過你本人的同意的情況下,消費(fèi)級 DNA 檢測機(jī)構(gòu)共享的數(shù)據(jù)可能會被第三方合法使用。2018 年, 23andMe 收取了 3 億美元把數(shù)據(jù)共享給了醫(yī)藥公司 GlaxoSmithKline。
消費(fèi)級 DNA 檢測服務(wù)為保險、醫(yī)藥等行業(yè)提供了無數(shù)的機(jī)會,但是目前還有一個疑點(diǎn)存在:在什么情況下,第三方能夠提取并使用私人數(shù)據(jù)庫中的遺傳數(shù)據(jù)?沙特阿拉伯、科威特、英國和中國政府一直在研究是否應(yīng)該建立一個公民遺傳信息通用數(shù)據(jù)庫。
此外,該報告還給出了一個 2019 年全球智能城市 Top50 排名,中國無錫、銀川、杭州、上海四座城市上榜。