左轉(zhuǎn)向善，右轉(zhuǎn)向惡，2020 年的九大 AI 風向標

情感導師 2023-07-25 7190

添加導師微信MurieL0304

獲取更多愛情挽回攻略婚姻修復技巧戀愛脫單干貨

2017 年底，美國社交新聞網(wǎng)站 Reddit 一位名叫 deepfakes 的用戶運用 AI 制作了一段“假”色情視頻，將《神奇女俠》女主角蓋爾·加朵的臉嫁接到一個成人電影女星身上，一時間引起轟動。

自此，AI 換臉核心算法就正式被命名為 DeepFakes，并一直頗具爭議。不過，它“有趣又愚蠢”的一面，也為媒體公司提供了新的機會。

2019 年 12 月，社交媒體應用 Snapchat 以 1.66 億美元收購了烏克蘭圖像和視頻識別初創(chuàng)公司 AI Factory，兩者此前曾合作，使用戶能將自拍照片插入 GIF 中以創(chuàng)建動畫化的 AI 換臉。另外，中國公司字節(jié)跳動的短視頻應用 TikTok 也在開發(fā)類似功能。三星發(fā)表了一篇有關使用神經(jīng)網(wǎng)絡創(chuàng)建逼真的“說話人的頭部”的論文。下面，左圖顯示了源圖片，右圖則是由 AI 生成的。

（來源：三星）

左轉(zhuǎn)向善，右轉(zhuǎn)向惡，2020 年的九大 AI 風向標

英國《金融時報》報道，價格昂貴且費時的傳統(tǒng)的計算機生成圖形，與最近出現(xiàn)的 AI 換臉技術(shù)正形成了鮮明對比。因此，好萊塢也朝著“數(shù)字化復活”那些“五、六十年代”電影中的演員這一方向發(fā)展。

而在零售方面，AI 換臉還使品牌為消費者提供超個性化的視覺營銷。如初創(chuàng)公司 Superpersonal 會將用戶的臉部視頻片段替換為虛擬試裝。

AI 換臉在影響者營銷方面也有所作為。在非政府組織“瘧疾必死”（Malaria Must Die）的活動宣傳視頻中，初創(chuàng)公司 Synthesia 使用 Deepfake 技術(shù)讓貝克漢姆在視頻中說了 9 種不同的語言。

（來源：“瘧疾必死”（Malaria Must Die））

而在中國，2019 年 3 月，B 站上一個名叫“換臉哥”的用戶上傳了一條《射雕英雄傳》片段，將其中黃蓉飾演者朱茵的臉換成了楊冪的臉。

（來源：網(wǎng)絡）

不久，更多作品跟風而至，網(wǎng)友們利用該技術(shù)，將某平臺女主播的臉換成劉亦菲、楊冪、唐嫣、范冰冰等女星的臉。另外，一款名叫 “ZAO” 的軟件受到熱捧，通過這款軟件，用戶可以將影視劇、綜藝節(jié)目片段中明星的臉換成自己的臉。不過這一軟件也被質(zhì)疑涉及隱私泄露和侵權(quán)等問題。

關鍵詞

個性化

零售中的換臉就是將消費體驗加倍。該技術(shù)將促進電子商務體驗和虛擬在線試用。

針對性的廣告

隨著技術(shù)的商品化，本地化的廣告，如使用不同語言的即時配音，將成為更加可用的成果。

創(chuàng)意領域的自動化

在電視和電影行業(yè)中使用 AI 換臉可能會導致續(xù)集、衍生產(chǎn)品和現(xiàn)有內(nèi)容的文化改編的泛濫。在鑄造和建模等對人臉要求非常高的領域，AI 換臉可能帶來負面影響。

下一代黑客：愚弄 AI 和利用 AI 的攻擊

AI 時代下的黑客正朝兩個方向發(fā)展：愚弄 AI 系統(tǒng)和利用 AI 發(fā)起攻擊。

在 2019 年，總部位于悉尼的安全公司 Skylight Cyber 的研究人員破解了網(wǎng)絡安全初創(chuàng)企業(yè) Cylance 開發(fā)的 AI 殺毒軟件。Skylight 報告說，它發(fā)現(xiàn)了其 AI 模型中的漏洞，并利用它創(chuàng)建了一個通用旁路，從而使惡意軟件無法被發(fā)現(xiàn)。

（來源：CB Insights）

黑客還可以通過污染數(shù)據(jù)來欺騙 AI。并且，還可能會在圖像上引入人眼看不見的細微擾動，以欺騙神經(jīng)網(wǎng)絡。

AI 本身也可用于制造更復雜的、針對性強的網(wǎng)絡攻擊。有關 AI 產(chǎn)生的語音欺騙的報道最早出現(xiàn)于 2019 年 3 月的歐洲。據(jù)《華爾街日報》報道，犯罪分子通過 AI 語音生成軟件，成功模仿并冒充一家英國能源公司的母公司 CEO，來欺騙其多位同事和合作伙伴，一天內(nèi)多次詐騙并轉(zhuǎn)移資金，使該公司損失約 173 萬元。

另外，IBM 早在 2018 年就開發(fā)的一種名為“DeepLocker”的惡意軟件表明，AI 可以繞過網(wǎng)絡安全保護進行攻擊。DeepLocker 被描述為“一種由 AI 驅(qū)動的具有高度針對性和規(guī)避性攻擊工具的新型惡意軟件”，只有在識別出如視覺、音頻、地理定位和系統(tǒng)級特性等特定標準時，才會“解鎖”惡意軟件以開始攻擊。由于幾乎不可能確定所有可能的觸發(fā)因素，就使深度神經(jīng)網(wǎng)絡的反向工程變得十分困難。

關鍵詞

黑客無情

如今所有人比以往任何時候都更容易使用 AI 工具，這為黑客提供了更多的土壤。

網(wǎng)絡 AI 初創(chuàng)企業(yè)可能面臨新的攻擊

黑客已經(jīng)證明，利用機器學習模型的內(nèi)在偏差并欺騙算法很容易。

重工業(yè)準備不足

在過去的十年中，已經(jīng)出現(xiàn)過幾例針對工業(yè)控制系統(tǒng)的惡意程序肆虐案例。如震網(wǎng)病毒 Stuxnet 2010 年被用于伊朗核設備攻擊、Black Energy 2015 年被用于烏克蘭電網(wǎng)攻擊、Havex 攻擊歐洲境內(nèi)組織，以及 Industroyer 2016 年侵入烏克蘭工控系統(tǒng)等。調(diào)查顯示，重工業(yè)抵御網(wǎng)絡風險的能力還很落后，也沒有為 AI 惡意軟件等更高級的威脅做好準備。

AutoML：未來“讓 AI 學習設計 AI”

機器學習的興起帶動了這一波人工智能的浪潮。而自動機器學習 AutoML 則有可能引領下一代潮流。

AutoML 是一套用于自動化神經(jīng)網(wǎng)絡設計和訓練的 AI 工具套件，它通過減少對 AI 專業(yè)知識的依賴，降低企業(yè)的準入門檻，使技術(shù)更民主化。通常，構(gòu)建表現(xiàn)優(yōu)良的機器學習應用，需要非常專業(yè)的數(shù)據(jù)科學家和領域?qū)＜?。?AutoML 的目標則是在即使沒有統(tǒng)計學和機器學習方面的廣泛知識的情況下，也能自動構(gòu)建機器學習應用。

“神經(jīng)網(wǎng)絡的設計非常耗時且對專業(yè)要求很高，為此，我們創(chuàng)建了一種名為 AutoML 的方法，希望讓神經(jīng)網(wǎng)絡自己設計神經(jīng)網(wǎng)絡?！惫雀?CEO 桑達爾·皮查伊（Sundar Pichai）在博文中寫道。于是，谷歌于 2017 年正式為此創(chuàng)造了 “ AutoML”。

（來源：谷歌）

而自谷歌提出這一概念后，用于 AI 設計的 AutoML 工具，包括數(shù)據(jù)準備、訓練、模型搜索及特征工程的采用率一直在逐漸增加。如 Waymo 最近與谷歌合作，使尋找最佳神經(jīng)網(wǎng)絡架構(gòu)的過程自動化，從而使自動駕駛汽車能夠從激光雷達（光檢測和測距）數(shù)據(jù)識別樹木、行人和車輛。谷歌云 AutoML 還可用于計算機視覺、視頻處理、翻譯和 NLP 任務。初創(chuàng)公司還為企業(yè)提供即插即用的解決方案。

同時，中國也出現(xiàn)了不少相關研究，稱能夠解放算法工程師，讓 AI 自動化。在去年的數(shù)據(jù)挖掘領域頂會 PAKDD 的 AutoML 挑戰(zhàn)賽上，中國公司深蘭的 DeepBlueAI、微軟&北航團隊、清華大學等團隊都有上榜。

其中，深蘭科技團隊設計的機器學習框架通過融合不同時期的數(shù)據(jù)以及結(jié)合 DNN 和 Light GBM 的訓練來自適應概念漂移，并引入了自適應采樣來緩解類別不平衡，同時在一定時間間隔上讓模型重復訓練以適應概念漂移，實現(xiàn)終身機器學習。

關鍵詞

人才短缺

在 AI 專家嚴重短缺的現(xiàn)實情況下，AutoML 能幫 AI 知識不足的企業(yè)將技術(shù)民主化。

成本和復雜性

即使對于專家而言，設計神經(jīng)網(wǎng)絡也是一個耗時的手動過程。AutoML 可創(chuàng)建更好的解決方案，并降低與試錯相關的計算成本。

聯(lián)邦學習將帶來全新的數(shù)據(jù)合作生態(tài)系統(tǒng)

聯(lián)邦學習（Federated Learning）在 2016 年由谷歌最先提出，是一種新興的人工智能基礎技術(shù)。

在谷歌 2019 年第二季度的財報會議中，谷歌 CEO 桑達爾·皮查伊強調(diào)，對谷歌來說，聯(lián)邦學習和一些其他的隱私管控是其現(xiàn)階段重點的關注和努力方向。他說：“我們一直以來都很關注用戶的隱私及管理，三年來我們一直在提議并推進聯(lián)邦學習的使用，這也是我們現(xiàn)階段的重點之一?！?/p>

最初聯(lián)邦學習被用在預測安卓系統(tǒng)用戶在使用鍵盤時下一步會輸入的內(nèi)容，也被用在谷歌的文本預測軟件以及火狐瀏覽器 URL 搜索方面。其設計目標是在保障大數(shù)據(jù)交換時的信息安全、保護終端數(shù)據(jù)和個人數(shù)據(jù)隱私、保證在合法合規(guī)的前提下，在多參與方或多計算結(jié)點之間開展高效率的機器學習。

如下圖所示，聯(lián)邦學習可以讓裝配有 Gboard （谷歌推出的虛擬鍵盤）的軟件在不向谷歌發(fā)送原始用戶個人數(shù)據(jù)的前提下提升其 AI 模型。這樣以來，用戶手機中的數(shù)據(jù)還保存在用戶手機中，而并未被發(fā)送或儲存到某個中央云服務器中。

（來源：谷歌）

云服務器將某個人工智能算法的最新版本發(fā)送到某一用戶群的設備上，然后用戶的手機可以根據(jù)本地數(shù)據(jù)更新 AI 模型。這時，發(fā)送回云服務器的只是更新部分，而非更新所使用的本地數(shù)據(jù)。云服務器可以再根據(jù)接收到的更新部分，提升算法的全局狀態(tài)（“global state”）。

聯(lián)邦學習既可以保護用戶數(shù)據(jù)，又不會影響 AI 算法的性能提升，其正在為包括醫(yī)療健康和銀行業(yè)在內(nèi)的、對于數(shù)據(jù)使用受到高度管控和關注的行業(yè)提供新的可能。

英偉達 AI 驅(qū)動的軟硬件框架 Clara 主要針對醫(yī)療健康場景，現(xiàn)也支持聯(lián)邦學習。其使用方包括美國放射醫(yī)學院、麻省總醫(yī)院、布列根和婦女醫(yī)院臨床數(shù)據(jù)科學中心、UCLA 醫(yī)學中心等。此外，英偉達還與醫(yī)療健康領域初創(chuàng)公司 Owkin 合作，Owkin 主要從事使用聯(lián)邦學習進行癌癥患者的抗藥性預測方面的業(yè)務。

（來源：英偉達）

中科院計算所泛在計算系統(tǒng)研究中心針對帕金森癥建立了 FedHealth 框架，使用聯(lián)邦學習、遷移學習、增量學習來判斷病人服藥前后的狀況變化、用藥效果等。

金融領域，中國的微眾銀行正與騰訊云和加拿大人工智能研究中心 Mila 合作進行聯(lián)邦學習方面的研究。今年 1 月底，微眾銀行 AI 團隊研發(fā)并推出了其聯(lián)邦學習開源框架 FATE（Federated AI Technology Enabler），該框架采用了多種安全計算協(xié)議，從而保證在符合監(jiān)管規(guī)定的數(shù)據(jù)保護前提下，進行跨域信息合作。

當然，聯(lián)邦學習作為一個新興概念正在越來越廣泛地應用在其他領域，比如智能城市、智能制造等方面。中國公司（包括京東、華為等）也在積極布局聯(lián)邦學習方面的應用，相信在未來可以看到更多聯(lián)邦學習相關的落地應用。

關鍵詞

全局模型+本地數(shù)據(jù)

通過使用聯(lián)邦學習，用戶可以通過使用本地數(shù)據(jù)訓練 AI 模型，并只將 AI 模型的更新部分更新到中央云端。云端通過所有網(wǎng)絡中使用者發(fā)送的模型更新來優(yōu)化其模型應用。

數(shù)據(jù)多樣化

聯(lián)邦學習可以助力跨域合作，從而通過更加多樣化的本地數(shù)據(jù)優(yōu)化全局模型。

Alphabet 將通過 AI 主導智慧城市合約

憑借其強大的 IoT 和機器學習能力，這家一萬億美元的 Al 巨頭正在積極布局城市發(fā)展及智慧城市規(guī)劃領域。

通過聯(lián)手政府，Alphabet 正在許多城市創(chuàng)造新的街區(qū)，并重新規(guī)劃房地產(chǎn)、公共能源設施、交通等布局。去年第二季度，Alphabet 旗下子公司 Sidewalk Labs 發(fā)布了一份 1500 頁的方案，其中詳述了如何通過與政府和其他企業(yè)的合作，以 13 億美元在多倫多打造一個智慧城市的項目。項目的重點和亮點就集中在 AI 在政府和城市規(guī)劃的應用上。

（來源：Sidewalk Labs）

從概念上來看，智慧城市可以包括智慧醫(yī)療、智慧出行、城市監(jiān)控、數(shù)據(jù)基礎設施以及許多其他 AI 和機器學習的應用領域。下圖列出了 Alphabet 在上述領域的主要布局，其優(yōu)勢不言自明，這也讓其成為從房地產(chǎn)到能源到交通領域再到咨詢服務方面強有力的市場競爭者。

（來源：CB Insights）

在這里略微說一下兩家小型初創(chuàng)公司 Replica 和 Coord。Replica 主要使用機器學習來為通勤行為建模，并關注影響通勤方式選擇的因素等。應用方面已有與伊利諾伊政府簽訂的 360 萬美元的三年合約，以及與波特蘭政府的一年服務協(xié)議。Coord 主要關注使用機器學習繪制街道資產(chǎn)圖景。其正在邀請各個城市參與其發(fā)起的“數(shù)字街道挑戰(zhàn)”活動，最終的獲勝城市將可以免費試用其技術(shù)，當然 Coord 也可以通過這次活動調(diào)試其平臺性能及調(diào)整其策略方向。

上文說到的 Alphabet 旗下子公司 Sidewalk Labs 在處理特定城市發(fā)展問題方面正在超過較小型的初創(chuàng)公司（如 Replica 和 Coord）。Sidewalk Labs 在多倫多的試點項目中突出了減少溫室氣體排放和更智能的資源管理兩個方面。通過機器學習工程師分析傳感器收集的數(shù)據(jù)以及搭建管理系統(tǒng)，來建立能耗以及可持續(xù)性方面的推薦引擎和預測模型。

關鍵詞

政府青睞

Alphabet 在 AI 方面的專業(yè)讓其自然而然地成為政府合作青睞的對象，加之旗下子公司，比如 DeepMind,、Waymo、lab X 等，更為其競爭力加碼。

端到端解決方案

相較于其他聚焦某一個領域的供應商，Alphabet 擅長基于機器學習的幾乎所有智慧城市相關方面，從城市發(fā)展工具到自動駕駛汽車再到能源管理。

分擔財務風險

Alphabet 有強大的實力分擔財務風險并進行前期方面的投資。比如 Sidewalk Labs 就宣稱，在其與其他機構(gòu)或企業(yè)的合作中，其可以分擔前期的創(chuàng)新成本，并在后期達標后獲得報酬。這樣一來，其與政府或相關機構(gòu)在進行技術(shù)合作或者試驗的時候，增加了合作的成功可能。

能源驅(qū)動的 AI 將會被用來解決能源問題

2020 年，更節(jié)省能源的 AI 將成為一個重要的話題。從科技巨頭、汽車制造商到油氣巨頭，無一不在尋求削減成本、提升效率、降低能耗。

一直以來，我們都在說人工智能，也在強調(diào)其所需要的算力。但是算力不是憑空產(chǎn)生的，是需要消耗能量的。在我們不斷強調(diào)要提高算力讓 AI 變得更聰明的時候，我們也需要考慮使用更具可持續(xù)性的能源解決方案。

現(xiàn)階段 AI 的進步多是自上而下的，也就是科技巨頭在領導 AI 方面的研發(fā)以及開發(fā)開源工具方向，這主要是因為科技巨頭在算力方面占有巨大優(yōu)勢。Fast Company 曾報道，2018 年谷歌在其 BigGAN 實驗中，為創(chuàng)造出高度逼真的圖像，消耗了相當于普通美國家庭半年的平均電量。

（來源：CB Insights）

相較于云計算，邊緣計算并不具有同等的算力和資源，所以在 AI 越來越多地被應用在邊緣設備（如電話、相機）的過程中，能源利用效率正變得越來越重要。這里第一個值得關注的方面是更加節(jié)能的 AI 設備。

Xnor.ai 是一家致力于開發(fā)低能耗邊緣 AI 工具的初創(chuàng)公司，它關注超低功耗、可運行 AI 算法的相機。其硬件工程和機器學習團隊曾提出一個問題：“（我們）是否可以開發(fā)出一臺能夠在沒有電池的情況下運行深度學習模型的硬件設備及機器學習架構(gòu)？它可以是非常低功耗，甚至太陽能驅(qū)動的?！苯衲瓿酰O果公司收購了 Xnor.ai，這一舉動反映了蘋果在低能耗 AI 方面的布局，以及其在蘋果手機的 AI 芯片及 VR 應用方面的積極努力。

中國深圳耐能人工智能有限公司（Kneron）主打高性能、低功耗、低成本的 AI 解決方案，最近發(fā)布了一款針對邊緣設備的低耗能 AI 處理器。本月初，耐能宣布完成 4000 萬美元 A2 輪融資，由李嘉誠旗下維港投資領投，其資方包括阿里巴巴創(chuàng)業(yè)者基金、高通、中科創(chuàng)達、紅杉資本子基金 Cloudatlas 等，總計獲得了超過 7300 萬美元的融資。

另一個值得關注的方向是用于大型能源工廠及其設備的 AI 管理預測工具。比如，比爾·蓋茨投資的初創(chuàng)公司 Heliogen 主要集中于一些能源行業(yè)的細分市場，比如通過使用 AI 算法來控制太陽能發(fā)電系統(tǒng)中的定日鏡。

根據(jù)天氣預報的數(shù)據(jù)以及收集到的風力發(fā)電機的數(shù)據(jù)，DeepMind 的神經(jīng)網(wǎng)絡可以提前 36 個小時預測未來風能產(chǎn)量。基于這些預測，DeepMind 的模型可以提前一天將如何實現(xiàn)最優(yōu)交付告知電網(wǎng)企業(yè)。對電網(wǎng)企業(yè)來說，能夠有計劃地調(diào)度能源非常重要。

谷歌一直在積極推動在其數(shù)據(jù)中心使用可再生能源，而且它正在使用 AI 來幫助實現(xiàn)這一行動。通過與 DeepMind 合作，借助其神經(jīng)網(wǎng)絡來提高風能產(chǎn)量。

（來源：Google AI research）

關鍵詞

超低功耗的機器學習設備

對于在邊緣設備（如智能手機、智能家居攝像頭等）來說，能效正在成為一個重要的考量因素。

大型能源企業(yè)

越來越多的大型云服務商正在向使用可再生能源方向轉(zhuǎn)變，并通過融合 AI 來提高可再生能源產(chǎn)量、簡化數(shù)據(jù)中心操作流程。

精簡操作

AI 可以很好地預測可再生能源產(chǎn)量、將電網(wǎng)管理自動化、幫助精確鉆探油井以及為智能家居和商業(yè)建筑中的可持續(xù)能源管理提供解決方案。

解決AI的小數(shù)據(jù)問題是重點

對深度學習算法，如果沒有足夠多的數(shù)據(jù)進行訓練，有兩種方法可以解決這個問題：生成合成數(shù)據(jù)，或者開發(fā)可利用小數(shù)據(jù)展開工作的 AI 模型。

眾所周知，深度學習需要數(shù)據(jù)，其模型訓練都是在大量標記數(shù)據(jù)的基礎上進行的，比如，利用數(shù)以百萬計的動物標記圖像訓練 AI 學會識別。但大量標記數(shù)據(jù)對某些應用來說并不適用，在這種情況下，從頭開始訓練一個 AI 模型，即使可能，也充滿了困難。

一個潛在的解決方案是用合成數(shù)據(jù)擴充真實數(shù)據(jù)集。這在自動駕駛領域得到了廣泛的應用。自動駕駛汽車在逼真的模擬環(huán)境中行駛數(shù)百萬英里，會面臨暴風雪以及行人突發(fā)行為等各種情況，而針對這些情況，我們很難獲取到真實數(shù)據(jù)。

合成數(shù)據(jù)正在出現(xiàn)，如下圖所示的來自英偉達（NVIDIA）的合成核磁共振（MRI ）圖像，就用于擴充罕見疾病的真實數(shù)據(jù)。

（來源：英偉達）

圍繞數(shù)據(jù)問題的另一種解決方案是開發(fā)能夠基于小數(shù)據(jù)集進行學習的 AI 模型。一種名為遷移學習（transfer learning）的方法已在計算機視覺任務中得到應用。該方法使用預先訓練的 AI 算法來執(zhí)行一個有大量標記數(shù)據(jù)的任務（如識別圖像中的汽車），然后將該知識轉(zhuǎn)移到另一個數(shù)據(jù)很少的不同任務上（如識別卡車）。使用預先訓練的模型就像包餃子時使用現(xiàn)成的餃子皮，免去了和面的步驟。

圖 | 美國有關遷移學習專利的統(tǒng)計（來源：CB Insights）

雖然預先訓練的模型在計算機視覺領域已經(jīng)取得了長足的發(fā)展，但在自然語言處理（NLP）領域，由于缺乏標記數(shù)據(jù)，到目前為止，一直是一項極具挑戰(zhàn)的工作。不過，一種名為自我監(jiān)督預訓練（self-supervised pre-training）的方法在自然語言處理領域中逐漸流行起來。

所謂自我監(jiān)督預訓練，首先要根據(jù)網(wǎng)絡上的大量數(shù)據(jù)訓練 AI 模型。例如，OpenAI 進行了一項計算極其密集的任務：用 800 萬個網(wǎng)頁作為訓練數(shù)據(jù)，訓練一個基于給定文本預測下一文本詞匯的 AI 模型。這一方法被稱為自我監(jiān)督學習，因為這里不涉及“標簽”：AI 通過基于句子中的其他單詞預測一個隱藏的單詞來學習語言。研究員 Jeremy Howard 在 Fast.ai 的一段摘錄中解釋了為什么這些自我監(jiān)督語言模型非常重要：

“我們不一定對語言模型本身感興趣，但事實證明，能夠完成這一任務的模型在學習語言的過程中必須了解語言的本質(zhì)，甚至要對世界有所了解。當我們把這個預先訓練好的語言模型用于另一項任務（比如情感分析）時，我們可以用很少的數(shù)據(jù)獲得比較滿意的結(jié)果。"

另一個典型的例子是谷歌 BERT，其 AI 語言模型不僅可以根據(jù)前文內(nèi)容進行預測，還可以基于后文展開，也就是說該模型采用了雙向語言模型的方式，能夠更好的融合前后文的知識。

（來源：谷歌）

由 Yann LeCun 領導的 Facebook AI 研究部門一直都看好自我監(jiān)督。比如，他們首先會訓練出一個語言模型（類似上文），然后進行預訓練，并對其進行微調(diào)以進行仇恨言論的識別。

（來源：Facebook）

最近，F(xiàn)acebook 還開源了其自我監(jiān)督語音識別模型，很好地解決了小型研究項目對人工標記文本的需求問題。非英語語言的標注訓練數(shù)據(jù)往往數(shù)量有限，針對這個問題， Facebook 開源了代碼 wav2vec，這對非英語語言的語音識別尤其有用。

關鍵詞

自然語言處理

由于自我監(jiān)督技術(shù)的出現(xiàn)，2020 年自然語言處理將成為人們關注的焦點。我們最終會看到像聊天機器人、高級機器翻譯以及類似于人類的寫作等更好的下游自然語言處理應用的出現(xiàn)。

大型科技公司牽頭

因為開發(fā)預訓練的語言模型需要進行大量的計算，針對小數(shù)據(jù)的 AI 模型的研究將是自上而下的?？萍季揞^正在開源自己的研究成果，以便其他研究人員可以將其用于下游應用。

合成數(shù)據(jù)及其工具

合成數(shù)據(jù)及其工具為那些無法像科技巨頭那樣訪問海量數(shù)據(jù)集的小公司提供了公平的競爭環(huán)境。

量子機器學習為傳統(tǒng)的AI算法注入活力

我們將很快看到結(jié)合了傳統(tǒng)機器學習算法與量子 AI 的模型的實際應用。

二進制計算中信息存儲為 0 或 1。與二進制計算不同的是，量子計算機是基于量子比特的。量子比特可以是 0 到 1 的任意值，或者同時具有這兩個值的屬性。因此，在運行計算方面有很大的優(yōu)勢。

但是，我們與傳統(tǒng)計算機交互的方式并不適用于量子計算機。它需要專門的數(shù)據(jù)、算法以及編程。

量子機器學習借鑒了傳統(tǒng)機器學習的原理，但其算法會運行在量子處理器上，這使得它們比傳統(tǒng)的神經(jīng)網(wǎng)絡更快，并且解決了當前 AI 在海量數(shù)據(jù)集上進行研究所受到的硬件限制問題。

不過，量子神經(jīng)網(wǎng)絡（Quantum Neural Networks，QNN）的研究尚處于起步階段。對此，谷歌曾表示：“傳統(tǒng)的機器學習從誕生到建立監(jiān)督學習的通用框架，花了很多年的時間。在量子神經(jīng)網(wǎng)絡的設計方面，我們還在探索?！?/p>

那么，QNN 算法將如何解決現(xiàn)實問題呢？

科技巨頭和量子創(chuàng)業(yè)公司正在考慮一種混合方法，其中一部分任務由運行在傳統(tǒng)計算機上的傳統(tǒng)神經(jīng)網(wǎng)絡完成，另一部分則由量子神經(jīng)網(wǎng)絡增強。

比如，多倫多創(chuàng)業(yè)公司 Xanadu 正在將量子與傳統(tǒng)相結(jié)合的 AI 應用于遷移學習，其結(jié)果在圖像分類任務中有很好的應用前景。

（來源：Xanadu 研究論文, arxiv.org）

另外，自 2013 年以來，谷歌 AI 團隊就一直專注于為量子計算機編寫算法。與 Xanadu 一樣，其近期目標是開發(fā)“可適用于量子設備的量子與傳統(tǒng)相結(jié)合的機器學習技術(shù)”。谷歌 AI 團隊曾撰文表示：“雖然目前關于 QNN 的工作主要是理論方面的，但在不久的將來，它們將可能會在量子計算機上進行測試并得以實現(xiàn)。”

在谷歌發(fā)表的兩片研究論文中，其分別探索了以不同于傳統(tǒng)神經(jīng)網(wǎng)絡訓練方法的方式訓練 QNN，以及在模擬中測試 QNN 執(zhí)行簡單圖像分類任務的能力。

盡管當今最強大的量子計算機，包括谷歌正在開發(fā)的那些，已經(jīng)可以控制 50 到 100 個量子比特。但研究人員表示，若要量子計算機產(chǎn)生更廣泛的商業(yè)影響，至少達到控制需要幾千個量子比特的水平。

鑒于量子信息的發(fā)展可能帶給信息領域的影響，政府和各科技公司巨頭都對量子技術(shù)研究展開了積極投資。 CB Insights 的數(shù)據(jù)顯示，2019 年量子計算領域共完成 14 筆交易，涉及金額達 1.978 億美元，相較 2018 年略有下降。

（來源：CB Insights）

其中，自 2015 年 1 月 1 日至 2020 年 2 月 9 日，就國家而言，相關交易數(shù)量占比位居前三位的分別是美國（45.3%）、加拿大（15.6%）以及英國（14.1%）。

（來源：CB Insights）

那么，中國在該領域的投資情況如何呢？

2019 年 10 月，Nature 曾發(fā)表一篇專欄文章，分析了近年來私人投資大量涌入量子科技領域初創(chuàng)公司的情況。其中，針對中國的投資，文章指出，鑒于英語媒體報道以及西方分析公司的報道很少涉及中國的投資交易，所以在文章很可能缺少一部分中國數(shù)據(jù)。不過對于量子計算在中國的發(fā)展情況，文章援引了中國科學技術(shù)大學潘建偉教授的話表示，中國的量子技術(shù)產(chǎn)業(yè)化也在順利進行。另外，專利的申請情況也能進行佐證：根據(jù)歐盟委員會聯(lián)合研究中心的數(shù)據(jù)，2012 年至 2017 年的量子技術(shù)創(chuàng)新專利中，超過 43% 來自中國的大學和企業(yè)。

（來源：Martino Travagnin/歐盟委員會聯(lián)合研究中心）

關鍵詞

與傳統(tǒng)計算機結(jié)合

我們將開始看到世界上最強大的兩種計算范式——量子計算和 AI ——通過與傳統(tǒng)計算機結(jié)合來解決實際問題。

量子云計算

量子云計算是“云戰(zhàn)爭”中的最新前沿領域，所有主要供應商，包括 AWS、谷歌、IBM 和微軟，都在大力投入其中。正如 Rigetti、微軟和 OpenAI 在 2020 年發(fā)表的一篇論文中所強調(diào)的那樣，這意味著量子計算機將與傳統(tǒng) GPU 和 CPU 協(xié)同工作。我們會看到云 AI 算法在這樣的混合硬件平臺上運行。

自然語言處理將幫助我們理解生命的構(gòu)成要素

自然語言處理和基因組有一個共同特點，即都是由序列數(shù)據(jù)組成。自然語言處理的發(fā)展，為基因組學的研究帶來了啟發(fā)。

在本報告前述的自我監(jiān)督學習案例中，研究人員會隱藏句子中的特定單詞，讓算法猜測缺失的單詞，從而更廣泛地學習語言。正如句子是由單詞按序列組成的一樣，蛋白質(zhì)是按特定順序排列的氨基酸序列。

來自德國的研究人員利用了一個類似于自我監(jiān)督語言模型的概念對蛋白質(zhì)進行分類。Facebook AI 研究部門和紐約大學的研究人員在蛋白質(zhì)序列的海量數(shù)據(jù)集上使用了自我監(jiān)督概念，用 AI 預測隱藏的氨基酸。

（來源：Biorxiv）

針對最近流行起來的基因組建模，DeepMind 開發(fā)了一種名為 AlphaFold 的算法，通過理解蛋白質(zhì)折疊（基因組學中最復雜的挑戰(zhàn)之一）來確定蛋白質(zhì)的 3D 結(jié)構(gòu)。

（來源：DeepMind）

雖然 AlphaFold 使用的是一種混合方法，但它借用了自然語言處理中的概念來預測氨基酸對之間的距離，以及連接它們的化學鍵之間的角度。

針對最近在中國爆發(fā)的新型冠狀病毒肺炎，百度在今年 2 月初開源了其 RNA 預測算法 LinearFold。該算法可以大大縮短預測病毒 RNA 的二級結(jié)構(gòu)的時間（將預測時間從 55 分鐘縮短至 27 秒），從而幫助為前線醫(yī)療研究人員更好更快地解析病毒及開發(fā)疫苗。

關鍵詞

更好的藥物設計

蛋白質(zhì)會根據(jù)環(huán)境因素動態(tài)地改變結(jié)構(gòu)，所以了解其結(jié)構(gòu)及折疊方式將為未知的靶點開發(fā)藥物帶來機會。

無需深入了解領域知識

AI 算法可以在不深入地了解領域知識的前提下，幫助蛋白質(zhì)建模并了解其結(jié)構(gòu)。

具有特定功能的蛋白質(zhì)設計

為醫(yī)療保健和材料科學開發(fā)或優(yōu)化具有特定功能的新的蛋白質(zhì)設計將成為可能。

結(jié)語

以上為 CB Insights 整理出來的 2020 年 AI 趨勢，雖然其中一些技術(shù)已經(jīng)取得了初步進展，但不可否認的是，我們也也面臨著很多技術(shù)及應用方面的挑戰(zhàn)。

希望在 2020 年我們能看到更多跨越了這些挑戰(zhàn)的技術(shù)突破。