人工智能時(shí)代,懂語(yǔ)言者“得天下”,NLP作為人工智能的“掌上明珠”,最新發(fā)展布局和未來(lái)發(fā)展趨勢(shì)究竟如何?

  8月25日,即七夕當(dāng)天,以“掌握知識(shí)、理解語(yǔ)言、擁有智能”為主題的百度大腦語(yǔ)言與知識(shí)技術(shù)峰會(huì)以直播形式召開,百度CTO王海峰、百度集團(tuán)副總裁吳甜、百度技術(shù)委員會(huì)主席吳華等大咖現(xiàn)身大會(huì),向外界全面介紹了百度在語(yǔ)言與知識(shí)領(lǐng)域的整體布局、技術(shù)創(chuàng)新及產(chǎn)業(yè)實(shí)踐,并重磅發(fā)布多項(xiàng)全新產(chǎn)品和技術(shù)等,希望攜手學(xué)界、產(chǎn)業(yè)界合作伙伴推動(dòng)語(yǔ)言與知識(shí)技術(shù)發(fā)展,為產(chǎn)業(yè)智能升級(jí)提供原動(dòng)力。

  在這場(chǎng)面對(duì)上百萬(wàn)人的極客大秀上,百度作為國(guó)內(nèi)乃至全球NLP領(lǐng)域的“佼佼者”,分享了很多重磅內(nèi)容,可謂AI大佬在線“劃重點(diǎn)”。他們到底說(shuō)了啥?帶來(lái)了哪些技術(shù)干貨呢?

  亮點(diǎn)一:百度已打造完整NLP技術(shù)布局,持續(xù)落地提升智能化水平

  王海峰表示,“在百度語(yǔ)言與知識(shí)技術(shù)的布局和發(fā)展中,我們始終在注意把握兩個(gè)趨勢(shì),即技術(shù)發(fā)展趨勢(shì)和產(chǎn)業(yè)發(fā)展趨勢(shì),并力爭(zhēng)引領(lǐng)趨勢(shì)!苯(jīng)過(guò)十余年的發(fā)展,百度已構(gòu)建完整的語(yǔ)言與知識(shí)技術(shù)布局,包括知識(shí)圖譜、語(yǔ)言理解與生成技術(shù),以及上述技術(shù)所支持的包含智能搜索、機(jī)器翻譯、對(duì)話系統(tǒng)、智能寫作、深度問(wèn)答等在內(nèi)的應(yīng)用系統(tǒng),而且百度語(yǔ)言與知識(shí)技術(shù)碩果正源源不斷地以平臺(tái)化的方式對(duì)外輸出,在互聯(lián)網(wǎng)、金融、醫(yī)療、教育等諸多領(lǐng)域發(fā)揮作用,提升了產(chǎn)業(yè)智能化水平。

  細(xì)品一下,就是說(shuō)百度語(yǔ)言與知識(shí)技術(shù)十年發(fā)展技術(shù)布局完善,實(shí)力硬核,這波秀肌肉值得滿分!

  image.png

  百度語(yǔ)言與知識(shí)的技術(shù)實(shí)力業(yè)界有目共睹,國(guó)家科技進(jìn)步獎(jiǎng)等20多個(gè)獎(jiǎng)項(xiàng)、30多項(xiàng)國(guó)內(nèi)外競(jìng)賽冠軍、2000多項(xiàng)專利等,成為了百度語(yǔ)言與知識(shí)技術(shù)實(shí)力最好的證明。

  image.png

  技術(shù)有多難,就有多重要。語(yǔ)言與知識(shí)技術(shù)的重要性不容小覷。在回顧完百度語(yǔ)言與知識(shí)技術(shù)的進(jìn)程以及最新進(jìn)展,王海峰引出了峰會(huì)中其他三大亮點(diǎn),首先是百度語(yǔ)言與知識(shí)產(chǎn)品的重磅發(fā)布和全新升級(jí),其次是數(shù)據(jù)共建和算力共享計(jì)劃,最后是百度NLP“十年十人”的發(fā)布,進(jìn)一步為技術(shù)和社會(huì)進(jìn)步做出更大貢獻(xiàn)!

  亮點(diǎn)二:重磅發(fā)布3大新產(chǎn)品、6項(xiàng)全新升級(jí),覆蓋4大NLP領(lǐng)域重點(diǎn)研究方向

  3、6、4這三個(gè)不起眼的數(shù)字,但對(duì)廣大開發(fā)者來(lái)說(shuō),卻一點(diǎn)也不普通。此次峰會(huì),百度為進(jìn)一步降低開發(fā)者應(yīng)用語(yǔ)言與知識(shí)技術(shù)的門檻和成本,將多年來(lái)語(yǔ)言與知識(shí)技術(shù)沉淀凝聚成一系列技術(shù)平臺(tái)和產(chǎn)品對(duì)外發(fā)布。

  image.png

  其中,3大新品包括語(yǔ)言理解方面的語(yǔ)義理解技術(shù)與平臺(tái)文心ERNIE、一站式TextMind智能文檔分析平臺(tái)、以及機(jī)器翻譯方面的AI同傳會(huì)議解決方案;6項(xiàng)技術(shù)全面升級(jí)包括智能創(chuàng)作平臺(tái)重磅推出的智能策劃、智能采編、智能審校3大媒體場(chǎng)景方案,以及智能對(duì)話定制與服務(wù)平臺(tái)UNIT平臺(tái)帶來(lái)更智能的任務(wù)式對(duì)話理解、極致便捷的表格問(wèn)答、融合通用對(duì)話的新引擎三大新能力升級(jí),這些全面覆蓋理解、生成、對(duì)話、翻譯4大NLP領(lǐng)域重點(diǎn)研究方向。

  百度語(yǔ)言與知識(shí)技術(shù)多年深耕、布局全面,核心技術(shù)持續(xù)發(fā)展突破,為廣大開發(fā)人員、業(yè)務(wù)應(yīng)用者提供以語(yǔ)言與知識(shí)技術(shù)為核心驅(qū)動(dòng)的系列產(chǎn)品,發(fā)揮應(yīng)用價(jià)值。對(duì)此,吳甜也給出了一組數(shù)據(jù):百度智能對(duì)話定制與服務(wù)平臺(tái)UNIT自發(fā)布以來(lái),已有2.7萬(wàn)多開發(fā)者積累下2.4億個(gè)知識(shí)條目,支撐了超過(guò)10萬(wàn)個(gè)智能對(duì)話應(yīng)用,與用戶展開超過(guò)4200億次交互。

  亮點(diǎn)三:共建開源數(shù)據(jù)+豪擲億元算力,要在世界范圍建設(shè)中文信息處理影響力

  數(shù)據(jù)、算力的缺乏,特別是相較英文下標(biāo)準(zhǔn)的中文開源數(shù)據(jù)集的匱乏,成為制約中文信息處理領(lǐng)域發(fā)展的瓶頸。

  對(duì)此,王海峰指出,復(fù)雜知識(shí)表示和快速構(gòu)建技術(shù),知識(shí)與深度學(xué)習(xí)進(jìn)一步融合,深度融合感知和認(rèn)知的跨模態(tài)語(yǔ)義理解技術(shù),模型可解釋性和魯棒性,這四大難題仍需要繼續(xù)研究解決。但對(duì)于未來(lái),百度充滿信心。

  會(huì)上,百度發(fā)布了“千言”數(shù)據(jù)共建計(jì)劃和價(jià)值一億元的算力共享計(jì)劃。吳華介紹到,“千言”的目標(biāo)是覆蓋豐富的任務(wù)類型,從復(fù)雜知識(shí)構(gòu)建、語(yǔ)義理解、知識(shí)融合、多模態(tài)融合等角度推動(dòng)技術(shù)進(jìn)步,同時(shí)提供能進(jìn)行多維度綜合評(píng)價(jià)的數(shù)據(jù)集從而評(píng)價(jià)模型的全面性、泛化性、魯棒性。首期千言項(xiàng)目已涵蓋了7大任務(wù)、20余個(gè)中文開源數(shù)據(jù)集。在未來(lái)3年中,百度計(jì)劃面向超20個(gè)任務(wù),收集和建設(shè)不少于100個(gè)中文自然語(yǔ)言處理數(shù)據(jù)集。

  image.png

  而語(yǔ)言與知識(shí)算力共享計(jì)劃,是指百度將通過(guò)AI STUDIO平臺(tái),提供價(jià)值一億元的算力支持,為語(yǔ)言與知識(shí)技術(shù)開發(fā)者助力。在未來(lái),百度還計(jì)劃邀請(qǐng)“千言”數(shù)據(jù)集的使用者,百度語(yǔ)言與知識(shí)開源開放用戶以及更多的中文語(yǔ)言與知識(shí)技術(shù)開發(fā)者、研究人員免費(fèi)使用這些算力。

  百度希望通過(guò)共建中文自然語(yǔ)言處理開源數(shù)據(jù)及算力支持,與學(xué)界、產(chǎn)業(yè)界共同推進(jìn)技術(shù)進(jìn)步?吹竭@里,百度AI技術(shù)的開放共享,確實(shí)讓開發(fā)者們感受到滿滿的中國(guó)科技實(shí)力的自豪感。

  亮點(diǎn)四:十年征程,不忘初心

  2010年,百度在國(guó)內(nèi)最先成立專門的自然語(yǔ)言處理部,在前瞻技術(shù)與產(chǎn)業(yè)格局上不斷引領(lǐng)、創(chuàng)新,十年間已成為中國(guó)NLP發(fā)展的一面旗幟。

  十年征程,百度語(yǔ)言與知識(shí)技術(shù)發(fā)展歷程中培養(yǎng)、吸引了大量全球頂尖人才。會(huì)上,百度推出以王海峰為代表的百度NLP“十年十人”,十年堅(jiān)守,不忘初心,秉持“技術(shù)信仰”,勇攀技術(shù)高峰,矢志不渝致力于讓機(jī)器更好地理解世界、更好地服務(wù)于人。

  image.png

  此次峰會(huì),匯聚了百度語(yǔ)言與知識(shí)的技術(shù)積累和產(chǎn)業(yè)實(shí)踐。不難看出,百度對(duì)整個(gè)語(yǔ)言與知識(shí)領(lǐng)域的布局是領(lǐng)先,且具有借鑒意義的。其實(shí),百度的語(yǔ)言與知識(shí)技術(shù)實(shí)力不僅領(lǐng)先國(guó)內(nèi),在國(guó)際上也絲毫不遜色。以百度知識(shí)增強(qiáng)的語(yǔ)義理解框架ERNIE為例,去年年底ERNIE在國(guó)際權(quán)威的通用語(yǔ)言理解評(píng)估基準(zhǔn) GLUE上首次突破 90大關(guān),超越人類三個(gè)點(diǎn),獲得全球第一。下圖正是全球AI三巨頭,從技術(shù)成果、研發(fā)力量、產(chǎn)品與服務(wù)三個(gè)維度展現(xiàn)了自身的語(yǔ)言與知識(shí)技術(shù)價(jià)值。 

  image.png

  2020年,是百度深耕語(yǔ)言與知識(shí)技術(shù)的第十年,更是技術(shù)成果厚積薄發(fā)的一年,站在十年發(fā)展的新起點(diǎn)上,百度舉辦百度大腦語(yǔ)言與知識(shí)技術(shù)峰會(huì),與產(chǎn)學(xué)研各界同仁分享NLP技術(shù)變遷和發(fā)展趨勢(shì),推動(dòng)技術(shù)創(chuàng)新與產(chǎn)業(yè)實(shí)踐,加速AI技術(shù)發(fā)展及智能社會(huì)建設(shè),助力中國(guó)產(chǎn)業(yè)智能化轉(zhuǎn)型。百度AI,實(shí)力引領(lǐng),未來(lái)可期。