百度CTO王海峰詳解NLP技術(shù)完整布局

情感導(dǎo)師 6604

 添加導(dǎo)師微信MurieL0304

獲取更多愛情挽回攻略 婚姻修復(fù)技巧 戀愛脫單干貨

AI正在向更深層次進化,語言與知識技術(shù)的重要性愈加凸顯。8月25日,以“掌握知識、理解語言、擁有智能”為主題的百度大腦語言與知識技術(shù)峰會重磅開啟,百度CTO王海峰發(fā)表主旨演講,解讀百度語言與知識技術(shù)的發(fā)展歷程與最新成果,與產(chǎn)學(xué)研各界分享技術(shù)及產(chǎn)業(yè)發(fā)展趨勢和展望,百度集團副總裁吳甜和百度技術(shù)委員會主席吳華分別發(fā)布百度語言與知識技術(shù)系列產(chǎn)品和數(shù)據(jù)集共建計劃,重磅推出5款產(chǎn)品的新發(fā)布,全面加速AI技術(shù)大規(guī)模應(yīng)用。在演講中,王海峰表示,“在百度語言與知識技術(shù)的布局和發(fā)展中,我們始終在注意把握兩個趨勢,即技術(shù)發(fā)展趨勢和產(chǎn)業(yè)發(fā)展趨勢,并力爭引領(lǐng)趨勢?!?/p>

語言與知識技術(shù)是人工智能認(rèn)知能力的核心,以語言和知識為研究對象,讓機器像人一樣掌握知識、理解語言的自然語言處理技術(shù),對于人工智能發(fā)展至關(guān)重要。十年來,百度大腦語言與知識技術(shù)成果豐碩,獲得包括國家科技進步獎在內(nèi)的20多個獎項,30多項國際競賽冠軍,發(fā)表學(xué)術(shù)論文超過300篇,申請專利2000多項。技術(shù)不斷突破創(chuàng)新的同時,也在產(chǎn)品上創(chuàng)新探索,同時將領(lǐng)先的技術(shù)輸出給開發(fā)者與合作伙伴,提升各行業(yè)智能化水平。

百度引領(lǐng)語言與知識技術(shù)創(chuàng)新,形成完整技術(shù)布局

半個多世紀(jì)前,老一輩自然語言處理學(xué)者,在一本名為《機器翻譯淺說》的書中,暢想了未來跨語言、跨文化的無障礙溝通場景。如今,機器同傳、翻譯機、跨模態(tài)翻譯等工具,已融入人們的工作和生活,溝通無國界的夢想正逐步實現(xiàn)。這一切是人工智能技術(shù),特別是語言與知識技術(shù)進步所帶來的結(jié)果。

百度CTO王海峰詳解NLP技術(shù)完整布局

歷經(jīng)近十年發(fā)展,百度已經(jīng)構(gòu)建了完整的語言與知識技術(shù)布局,包括知識圖譜、語言理解與生成技術(shù),以及上述技術(shù)所支持的包含智能搜索、機器翻譯、對話系統(tǒng)、智能寫作、深度問答等在內(nèi)的的應(yīng)用系統(tǒng)。

其中,知識圖譜是機器認(rèn)知世界的基礎(chǔ)。機器認(rèn)知能力的突破,越來越依賴對知識和大規(guī)模知識圖譜的運用。百度打造了世界上最大的多源異構(gòu)知識圖譜,擁有超過50億實體和5500億事實,并在不斷演進和更新,已應(yīng)用于各行各業(yè),每日調(diào)用次數(shù)超過400億次。

不僅如此,針對不同應(yīng)用場景和知識形態(tài),百度還建立起多樣化的知識圖譜類型,既有基礎(chǔ)的實體知識圖譜,也有行業(yè)知識圖譜、事件圖譜、關(guān)注點圖譜等,以及融合語音、視頻、圖片的多模態(tài)知識圖譜。這背后,是百度創(chuàng)建的包括無標(biāo)簽大數(shù)據(jù)開放知識挖掘技術(shù)、知識體系自擴展的知識圖譜自學(xué)習(xí)技術(shù)、以及融合多源異構(gòu)數(shù)據(jù)的知識補全與整合技術(shù)在內(nèi)一整套知識圖譜構(gòu)建方法。

在知識的加持下,語言理解相關(guān)技術(shù)的能力不斷增強,機器也可以逐漸像人一樣不斷學(xué)習(xí)、不斷進步。百度提出知識增強的語義理解框架ERNIE,在深度學(xué)習(xí)的基礎(chǔ)上融入知識,具備人類一樣的持續(xù)學(xué)習(xí)能力,曾一舉登頂全球權(quán)威數(shù)據(jù)集GLUE榜單,首次突破90分大關(guān),并且超越人類得分。而通過融入知識、語義理解、以及增強小樣本學(xué)習(xí)能力,機器的閱讀理解和對話能力也在迅速增強。

當(dāng)然,和人類認(rèn)知世界的形式類似,機器認(rèn)知世界時,也不僅是運用自然語言,而往往是對語音、視覺、語音等多模態(tài)信息的綜合應(yīng)用。

為此,百度研制了知識增強的跨模態(tài)深度語義理解方法,通過知識關(guān)聯(lián)跨模態(tài)信息,運用語言描述不同模態(tài)信息的語義,進而讓機器實現(xiàn)從“看清”到“看懂”、從“聽清”到“聽懂”,即圖像和語言、語音和語言的一體化理解。而融合場景圖知識的跨模態(tài)語義理解預(yù)訓(xùn)練技術(shù),則大幅提升了跨模態(tài)推理能力。

在機器理解自然語言之外,要與人進行交互,語言生成的任務(wù)也必不可少。百度基于多流機制的語言生成預(yù)訓(xùn)練技術(shù),在語言生成的過程中,兼顧詞、短語等不同粒度的語義信息,提升了生成效果。而多文檔摘要生成,則通過圖結(jié)構(gòu)語義表示,引入篇章結(jié)構(gòu)知識,增強長文本語義表示能力的同時,解決了跨文檔領(lǐng)域關(guān)系建模難題。結(jié)合語言生成技術(shù)和其他語言與知識技術(shù),百度打造了智能創(chuàng)作平臺,已被20多家媒體所采用,日調(diào)用量超過35萬次。

領(lǐng)先技術(shù)持續(xù)落地應(yīng)用,提升智能化水平

語言與知識技術(shù)的全面突破,在搜索、翻譯、對話系統(tǒng)等各類產(chǎn)品、應(yīng)用中得到突出體現(xiàn)。王海峰介紹,通過知識圖譜、語言理解和跨模態(tài)語義理解等技術(shù),智能搜索幫助用戶更加高效、精準(zhǔn)、便捷地獲取知識和信息。智能搜索再進一步發(fā)展,搜索將無處不在。

百度提出了知識圖譜驅(qū)動的對話控制技術(shù),以及首個基于隱空間的大規(guī)模開放域?qū)υ捘P蚉LATO等,并推出智能對話定制和服務(wù)平臺UNIT,可幫助開發(fā)者高效構(gòu)建智能對話系統(tǒng),實現(xiàn)規(guī)?;瘧?yīng)用。百度翻譯支持200多種語言,每天響應(yīng)超過千億字符的翻譯請求,支持超過40多萬家第三方應(yīng)用,技術(shù)上,提出了多智能體聯(lián)合學(xué)習(xí)、基于語義單元的同傳模型、稀缺語種分組混合訓(xùn)練算法等。

此外,百度語言與知識技術(shù)的成果,也在源源不斷通過開源開放平臺對外輸出,在互聯(lián)網(wǎng)、金融、醫(yī)療、教育等諸多領(lǐng)域發(fā)揮作用,提升產(chǎn)業(yè)智能化水平的同時,也得到了各方認(rèn)可,這是近十年來百度語言與知識技術(shù)不斷進步的最佳證明。

演講最后,王海峰對語言與知識技術(shù)的進一步發(fā)展做了展望。他表示,復(fù)雜知識表示和快速構(gòu)建技術(shù),知識與深度學(xué)習(xí)進一步融合,深度融合感知和認(rèn)知的跨模態(tài)語義理解技術(shù),模型可解釋性和魯棒性等等,仍有很多技術(shù)難題需要持續(xù)研究和解決。但對于未來,百度充滿信心,愿始終堅持探索機器“掌握知識、理解語言、擁有智能”,與學(xué)術(shù)界、產(chǎn)業(yè)界攜手,推動語言與知識技術(shù)、人工智能技術(shù)持續(xù)進步,為產(chǎn)業(yè)不斷升級、社會經(jīng)濟高質(zhì)量發(fā)展做出更大貢獻。

評論列表

頭像
2024-06-29 09:06:28

挺專業(yè)的一個情感機構(gòu),我一個朋友在那里咨詢過,服務(wù)很貼心!

頭像
2024-02-17 19:02:36

如果發(fā)信息,對方就是不回復(fù),還不刪微信怎么挽回?

頭像
2024-02-11 13:02:54

老師,可以咨詢下嗎?

 添加導(dǎo)師微信MurieL0304

獲取更多愛情挽回攻略 婚姻修復(fù)技巧 戀愛脫單干貨

發(fā)表評論 (已有3條評論)