
2017年是人工智能爆發(fā)的元年,但今年以來,AI步入更加冷靜的狀態(tài),那么AI新的驅(qū)動力是什么呢?近日,AI商業(yè)周刊記者與京東副總裁、京東大數(shù)據(jù)平臺負責(zé)人翁志進行了一場深入對話,他分享了對這個問題的看法。此外,我們還探討了京東大數(shù)據(jù)平臺規(guī)劃、AI芯片、無界零售等話題。本文共十個問題,從不同維度深度碰撞,干貨滿滿。
01
2018年以來AI步入更加冷靜的狀態(tài),AI新的驅(qū)動力是什么?
翁志:AI技術(shù)發(fā)展當(dāng)中,數(shù)據(jù)基礎(chǔ)和數(shù)據(jù)的處理能力是非常重要的。人工智能的底層是數(shù)據(jù),數(shù)據(jù)越多,我們可以看到的現(xiàn)象越全面。
每年京東產(chǎn)生和要處理的數(shù)據(jù)量都是翻番的、倍增的,這源于我們對于入口的掌握,數(shù)據(jù)流越來越多,數(shù)據(jù)量越來越大,來自于手機、端、內(nèi)部產(chǎn)生的各種各樣的數(shù)據(jù)。
數(shù)據(jù)量越來越多就產(chǎn)生一個問題:如何有效管理?
我們的任務(wù)就是在數(shù)據(jù)的增長情況下,讓數(shù)據(jù)的實效性增長、數(shù)據(jù)處理能力倍增,但是服務(wù)器的數(shù)量和投入是有一個有序、可控的增長,而不是跟著數(shù)據(jù)的增長倍增。
這背后,涉及到軟硬件一系列的改造和增進,需要很多內(nèi)部的軟件挖掘。
市場有很多開源軟件,是針對通用的使用方式,而不是為一個特定的需求進行定制。開源軟件在一定的數(shù)據(jù)范圍內(nèi)達到一定的效能是OK的,當(dāng)我們增長超過這個范圍,它的性能會急劇下降。我們就要對這個軟件進行深度定制,打破它的瓶頸,處理更大規(guī)模的數(shù)據(jù)。
總結(jié)數(shù)據(jù)處理的核心價值就兩個:一個是降低成本,包括運營成本和維護成本;另一個是提升效率,在沒增加硬件投入情況下,軟件效率提升是線性提升,在有限投入下,對公司開源節(jié)流節(jié)省大量成本。
02
京東大數(shù)據(jù)平臺未來有怎樣的規(guī)劃?
翁志:我們曾經(jīng)和國內(nèi)BAT及一些獨角獸公司做過深刻的技術(shù)交流,大多數(shù)公司都是使用開源軟件搭建大數(shù)據(jù)平臺。就像找來不同的施工隊蓋了許多不同高度,不同規(guī)格的房子,整個小區(qū)的效果可想而知。
我們的思考是按照用戶的需求,進行有效合理統(tǒng)一的規(guī)劃,比如說,底層存儲硬件,如何使用硬盤、SSD、NvMe的SSD、Optane,甚至未來的AEP進行有機的組合將成本與效能進行合理的搭配;硬件上面的軟件存儲層是HDFS和有限的scalable的分布式文件系統(tǒng)組成,可以支持不同類型的數(shù)據(jù)存儲,對于冷數(shù)據(jù)通過有序的搬遷和擦除。對于它之上的數(shù)據(jù)存取,根據(jù)用戶的不同需求API化。降低使用過程中不必要的復(fù)雜度。
同時,利用深度學(xué)習(xí)將整個數(shù)萬臺服務(wù)器的IO使用以及數(shù)據(jù)分布進行有效分析,并且通過增強學(xué)習(xí)的方式指引調(diào)度器控制數(shù)據(jù)的分布和使用等等。應(yīng)該說京東大數(shù)據(jù)對于未來數(shù)據(jù)平臺的發(fā)展規(guī)劃已經(jīng)有了完整的規(guī)劃。
03
你們具體是如何將數(shù)據(jù)轉(zhuǎn)化成產(chǎn)品的?
翁志:這涉及到對不同行業(yè)的深刻理解,針對行業(yè)特點,做有針對性的數(shù)據(jù)分析。我們通過深度學(xué)習(xí)的方式找出規(guī)律、趨勢,給用戶提供反饋,做預(yù)測,決策。
例如,化妝品的種類很多,通過數(shù)據(jù)可以知道某一類化妝品在全國各地的銷售情況;同品類這些細分化的產(chǎn)品在什么地區(qū)好賣。我們可以分析出這個產(chǎn)品在哪些城市做得不足,這些產(chǎn)品缺少哪些用戶所喜好的特性,它的競爭者有哪些缺失。
機器可以根據(jù)銷量做預(yù)測,分析同類化妝品哪些特殊成分對用戶吸引程度高,找出改進的空間。
除了商品的維度,還可以分析商品的庫存、供應(yīng)鏈的管理以及送貨快慢影響用戶體驗,決定是否增加儲存?zhèn)}。
品牌的忠誠度方面,可以知道什么收入階層對什么商品感興趣,用戶年齡段,男孩還是女孩,根據(jù)這個推送相關(guān)產(chǎn)品,或者做關(guān)聯(lián)銷售。
京東在行業(yè)內(nèi)擁有全價值鏈的大數(shù)據(jù),數(shù)據(jù)鏈條是很完整的,數(shù)據(jù)質(zhì)量很高。擁有自建物流,可以了解到送達到用戶最后一公里的各類數(shù)據(jù),通過不同的維度來分析。數(shù)據(jù)獲取方面我們有優(yōu)勢。
04
中國芯片技術(shù)處于什么水平?中美差距有多大?
翁志:半導(dǎo)體的發(fā)展,美國從頭到尾都參與,而且是領(lǐng)先的。芯片設(shè)計上美國還是走在最前面,他們有英特爾、Nvidia,高通、AMD等芯片大廠。但在制造工藝上,美國不是獨占鰲頭,亞洲已經(jīng)非常領(lǐng)先,三星和臺積電的制成技術(shù)甚至比美國還強。未來的市場亞洲并沒有落后,但中國在半導(dǎo)體行業(yè)制造水平上還沒達到這種水準(zhǔn)。中國最好的就是華為的海思、紫光的展訊。
移動端芯片方面,海思也進步到一流水平,進入5G時代中國縮小差距了與美國的差距,只是還不能達到領(lǐng)先。
芯片積累非常重要,它需要一個過程,目前中國還沒有一個世界領(lǐng)先的芯片大廠。
05
國內(nèi)也有很多AI芯片廠商,比如寒武紀(jì)、地平線,你怎么看?
翁志:我們做一個細分領(lǐng)域的AI芯片不難,但要做一個通用化的AI芯片還是很難的。我個人認為地平線和寒武紀(jì)還需要一個很艱辛的發(fā)展歷程,初創(chuàng)公司人力財力有限,不可能鋪得非常廣。
06
京東有沒有研發(fā)芯片的規(guī)劃?
翁志:我相信也會有一系列的行動、舉措跟蹤這方面,但現(xiàn)在還不是很方便透露。
我們做過inference端用于OCR領(lǐng)域的FPGA實現(xiàn),提供API服務(wù)滿足需求,也有團隊嘗試過CPU定制化的歷程,對于技術(shù)的探索我們從未停止。
07
谷歌IO大會上推出TPU3.0,有人說它能夠與英偉達GPU對標(biāo),您怎么看?
翁志:谷歌Brain在出第一版本TenserFlow的時候就有跟硬件合作,那時候是TPU1.0版本,他們設(shè)計的時候會把軟硬件有機結(jié)合,知道什么方面的算力需要放到硬件是最有效的。它的TenserFlow做了很多優(yōu)化,很多工作由硬件完成能夠使能效最高。
我感覺谷歌應(yīng)該不會售賣TPU3.0,而是通過云的方式來輸出。要想使它的TPU,就要用它的云。
08
京東的無界零售,未來規(guī)劃是要做成什么樣?
翁志:無界零售就是線上線下數(shù)據(jù)有機融合,供應(yīng)鏈一體化。把線上電商的技術(shù)優(yōu)勢帶到線下門店來,包括非結(jié)構(gòu)化數(shù)據(jù)的轉(zhuǎn)化的能力,供應(yīng)鏈的集成,物流配送體系的結(jié)合。線下店可以得到線上的效率,服務(wù)更到位,用戶對商品的需求可以通過超越時空的方式滿足。商戶、用戶、商店各種場景有機結(jié)合。
京東的無界零售就是重新定義人、貨、場,達到效率、成本和用戶體驗有機結(jié)合。這是一個新生事物,有一個摸索過程,有失敗也會有成功,它不會是坦途,是一個經(jīng)驗的積累,需要一定的時間,不斷嘗試。
從客戶、商家,to B到to C全面來布局。成立專門從事無界零售的事業(yè)部,調(diào)動整個體系來做連接,以及投資的方式來布局。布局非常廣泛。IOT也是其中一個方面。
09
商湯、曠視也在切新零售,和京東相比AI創(chuàng)業(yè)公司做新零售的優(yōu)勢和弊端有哪些?
翁志:商湯、曠視是技術(shù)公司,他們切入更多是對人臉識別、場景識別等領(lǐng)域。他們更多的是通過合作獲取數(shù)據(jù)。很難自己獨立完成這件事情,更多的是和各種電商線下店一塊合作做。對我們來說,電商本身就擁有很多應(yīng)用場景。
現(xiàn)在技術(shù)和算法彼此差距都不是很大,體現(xiàn)出差距的地方是在數(shù)據(jù)。獲取數(shù)據(jù)的能力在這方面決定了對公司的未來成功與否,技術(shù)公司必須與場景結(jié)合才能有獲取數(shù)據(jù)的能力。
這些數(shù)據(jù)的能力又可以反哺使其技術(shù)得到升華,數(shù)據(jù)的獲取能力決定了技術(shù)的深度。大家都看到了這是問題癥結(jié)所在。
10
在AI這波浪潮,很多公司是非常激進的,尤其是百度全面押寶于人工智能,但京東相對來說節(jié)奏更慢一些,為什么呢?
翁志:其實京東的人工智能的應(yīng)用并不慢,我們在腳踏實地的將我們的業(yè)務(wù)場景去實現(xiàn)。并且在人工智能學(xué)術(shù)領(lǐng)域的研究也在穩(wěn)步的探索,并將研究成果在京東豐富的業(yè)務(wù)場景中得到實踐。在京東內(nèi)部有太多應(yīng)用場景,AI的滲透可以說是各個方面的,從我們的無人倉、無人車、無人門店、智慧供應(yīng)鏈等等,每一個業(yè)務(wù)場景都有著我們AI的助力。而AI的應(yīng)用就是隨著這些業(yè)務(wù)場景的不斷積累,最終產(chǎn)生質(zhì)變的。
百度的投入很大,大力在推動阿波羅計劃。這些公司都看到AI的方向和潛在價值,包括谷歌、微軟都在調(diào)整重心。這個行業(yè)會越來越熱,但會是一個漫長的征途,不會在兩三年內(nèi)有一個翻天覆地的變化,它還是一個漸進式的過程。大家還是把人工智能看得非常觸手可及,在很多方面還需要更多的耐心。
關(guān)鍵詞:
人工智能
要回
副總裁