追一科技 CTO 劉雲峰:翻過技術的「山」,越過落地的「嶺」,NLP 也有春天

情感導師 5479

 添加導師LINE:jaqg

獲取更多愛情挽回攻略 婚姻修復技巧 戀愛脫單幹貨

10 月 12 日,由追一科技主辦的 「首屆中文 NL2SQL 挑戰賽」 正式收尾。表面上看,這僅僅是一場學術性的技術比武。事實上,它承載着一家 NLP 企業對於推動行業發展的殷切願望。

在最近這一波人工智能浪潮中,視覺和語音行業的發展和應用表現出了強勁的增速,相比之下,NLP 行業的表現則較為暗淡。從市場上的新興技術導向企業來看,視覺和語音領域都跑出了獨角獸,如曠視科技已經申請 IPO,而這種現象在 NLP 領域尚未出現。

不過,儘管 NLP 尚未引起市場巨浪,但實際上其潛在的力量卻是不容小覷。「從理論上講,與視覺等領域相比,NLP 的市場會更大。因為人類的絕大多數信息還是以文字方式在存儲,交流方式也是以語言為主。有語言的地方就有 NLP 作用的機會。」 追一科技 CTO 劉雲峰在與媒體分享時表示,NLP 去年開始成熟,今年相對進入逐漸成熟的階段。「NLP 也會進入一個爆發期。從技術成熟度來看,今年肯定是 NLP 的一個大年,落地到產品應該還有一兩年的延後,後面會有一個比較大的爆發。」 他分析說道。

而眾所周知,新技術的應用發展有兩大核心要素:技術和產品,這也是 NLP 行業當前面臨的挑戰。在行業較初期的階段,「如何活着」 成為了市場拋給企業的命題。而在解決了基本的生存問題後,面臨 「持續發展」 時,則需要結合對企業自身的戰略規劃和行業生態的推動。這即是追一科技目前正在探索的事情。一個技術創新驅動的 NLP 企業,在面臨將至的行業大爆發,如何厚積薄發?劉雲峰分享了追一科技的理解與實踐。

追一科技 CTO 劉雲峰:翻過技術的「山」,越過落地的「嶺」,NLP 也有春天

首先,他分享了針對技術的探討。「算力的突破,解決了語音和視覺的問題。但 NLP 不太依賴算力,人們對於這項技術的期望值也很高。」 追一科技 CTO 劉雲峰認為,NLP 需要突破的核心較為特別。當然,技術不能是空中樓閣,必須要走出論文投入實際生產。除了基礎技術的潛在可能性待挖掘,落地能力也成為決定性因素。「很多技術從論文到工業的轉換周期比以前加快了很多,這是很好的事情。基礎設施已經搭建好了,我們需要加速這個過程。」 他表示,近兩年有很多基礎能力的突破,特別是語言模型上突破,但這些基礎能力並不可以直接在工業應用中落地,還需要擴展到如 NL2SQL 這類技術的突破,然後再落地。

首先,是來自技術層面的嘗試與突破。今年 9 月,其打破了 CoQA 多輪對話閱讀理解紀錄,位列榜單第一。除了在研發上發力,該公司也致力於搭建 NLP 細分方向應用研究的平台,如其發起的中文 NL2SQL 挑戰賽。

據介紹,NL2SQL(自然語言轉結構化查詢語句)作為新興的研究領域,在國外由 SalesForce 耶魯大學等發布了 WikiSQL 和 Spider 數據集,但在國內市場,目前還處於起步階段。 NL2SQL 在銀行、保險、證券、電商、汽車、地產等數據富礦領域,有很大的應用潛力,可以大大地降低數據庫訪問和使用門檻,更好地挖掘數據特別是結構化數據價值,讓數據庫不再 「沉睡」。 「我們希望搭建一個平台,讓企業、學術屆都關注到這個方向。這叫眾人拾柴火焰高。」

追一科技發布了業內首個大規模的中文數據集,包括 4870 張表格數據、近 50000 條標註數據以及相應的 SQL 語句。「這個數據集就像一個 NLP 領域的公開尺子。」 劉雲峰解釋,就像李飛飛做的視覺領域數據集,對整個計算機視覺的作用一樣,大家都願意把自己最好的方法用這個尺子度量一下。「技術的研究下一步肯定是踩在之前已經度量過的,比較穩固的結論基礎上進行,所以它為技術發展起到了很大作用。」 他說。

技術在被一步步突破的同時,也要置於實際落地場景中檢驗。然而,這一過程也並非一帆風順。劉雲峰直言,對於做企業服務的 AI 企業來說,很大一個問題是技術提供方和使用方互不理解。「客戶有一個釘子,但是不知道用什麼錘子來砸。AI 公司有一個錘子,但不知道在哪裡找釘子。」 他表示需要一個平台來加速從論文到工業應用的蛻變過程。

那麼,具體到 AI 技術的 「老大難」 問題——落地,追一科技又是如何接招?劉雲峰分享了幾個方向。

一是全棧式的技術布局策略。「融合、開放」 是現市場上的趨勢,這不僅體現在企業關係之間的微妙變化,也表現在技術的應用邏輯中。「真正在工業落地時,視覺和 NLP 集合得越來越多,這個趨勢叫做多模態的融合。」 劉雲峰介紹道,工業落地時,經常需要同時處理多種信號,而很多應用企業沒有能力,也不會去融合兩家不同技術公司的方案。「未來頭部的 AI 公司一定是全棧的。」 他補充強調。所以,實際上,追一科技以 NLP 為核心的同時,也在涉足語音識別等方面,如,其研究在對話的交互場景里,有上下文的情況時怎麼把語音識別做得更准。

二是商業閉環能力,這也是 NLP 領域較難出獨角獸的原因之一。技術牛不等於商業上的成功,劉雲峰認為,一個創新企業的成功,應當是研發、產品和商務三方面都會比較強。「研發提高了企業的天花板和想象空間;產品和工程化團隊負責把上限的內容轉化為平台和產品;商務團隊要解決可複製性問題,讓一套系統不僅僅適用於一個客戶,而是所有的行業。」 他表示,要能夠把公司的上限轉化為下限,形成一股強有力的商業閉環能力。「最終一個公司在市場上的地位肯定是由上限和下限的位置共同來決定的,這兩個都很高的話,這個企業在市場上的地位就會比較高。」 他說道。

三是突破大規模商業化的困難。當產品順利交付時,規模化成為了一個企業做大做強的重要路徑。然而,做企業服務和消費者市場並不一樣,消費者市場出現爆點時,可形成指數級增長,但企業服務就需要更加踏實地去布局和規劃。劉雲峰介紹說:「企業服務更多需要定製化,但是如果我們產品化做得比較好的話,即可實現 「配置即定製」(配置就是PaaS化),能通過配置就可以實現定製。」 當然,在 PaaS 化無法滿足要求時,就需要通過合作夥伴的建設助力。「我們完成了 80% 的基礎事情,剩下 20% 也許可以交給合作夥伴。」 他說。

顯然,NLP 行業的前景是美好的,但過程是還需要探索的。而在此過程中,那些積極為推動行業發展奔走呼喊的企業,或許將成為行業爆發時的 「黑馬」 或者 「獨角獸」,這是關於厚積薄發的故事。

題圖來源:pixabay

評論列表

頭像
2024-02-25 04:02:05

情感機構有專業的老師指導,我就在老師的指導下走出了感情的誤區,真的很不錯!

頭像
2023-10-18 18:10:34

發了正能量的信息了 還是不回怎麼辦呢?

 添加導師LINE:jaqg

獲取更多愛情挽回攻略 婚姻修復技巧 戀愛脫單幹貨

發表評論 (已有2條評論)