(資料圖片)
9月7日,在2023外灘大會(huì)“新一代數(shù)據(jù)底座——探索圖智能的應(yīng)用與發(fā)展”分論壇上,螞蟻集團(tuán)帶來(lái)了一項(xiàng)融合研究—“大圖模型”(Large Graph Model,簡(jiǎn)稱LGM)。這項(xiàng)研究將圖計(jì)算與圖學(xué)習(xí)及大語(yǔ)言模型結(jié)合,利用大語(yǔ)言模型的生成能力和圖計(jì)算的關(guān)聯(lián)關(guān)系分析能力,提供更直觀、更全面的信息呈現(xiàn)和更精準(zhǔn)的洞察,從而更好地解決海量復(fù)雜的數(shù)字化應(yīng)用難題。目前螞蟻已完成第一階段“生成式異質(zhì)圖增強(qiáng)”的研究工作,相關(guān)成果論文被世界計(jì)算機(jī)頂會(huì)(WWW 2023)收錄。
圖計(jì)算是一種強(qiáng)大的數(shù)據(jù)處理技術(shù),可以解決復(fù)雜關(guān)系網(wǎng)絡(luò)中的關(guān)聯(lián)性難題,在金融反欺詐、天氣預(yù)報(bào)、藥物開發(fā),甚至類腦研究領(lǐng)域都有應(yīng)用,被譽(yù)為人工智能“牛鼻子”。大模型是最有可能走向通用人工智能的技術(shù),在某些領(lǐng)域的任務(wù)達(dá)到了與人類相當(dāng)甚至更好的表現(xiàn)。
為什么要用尖端技術(shù)驅(qū)動(dòng)尖端技術(shù)?大語(yǔ)言模型不能獨(dú)立完成數(shù)據(jù)分析和挖掘任務(wù)嗎? 螞蟻集團(tuán)高級(jí)技術(shù)專家劉永超表示,大語(yǔ)言模型可以推理出隱性關(guān)聯(lián)關(guān)系,但是無(wú)法繪制關(guān)系圖,而研究數(shù)據(jù)關(guān)系需要體現(xiàn)清晰的鏈路,使用圖結(jié)構(gòu)表示更便于理解。“將大語(yǔ)言模型與圖計(jì)算結(jié)合,就是先從海量信息中邏輯推理,再利用超級(jí)計(jì)算算出關(guān)系,這就類似給人類大腦外接了一臺(tái)超級(jí)計(jì)算機(jī),能力更強(qiáng)了”,劉永超解釋。
在這項(xiàng)研究中,螞蟻集團(tuán)主要開展了兩項(xiàng)工作。 第一,利用大語(yǔ)言模型豐富圖數(shù)據(jù)。區(qū)別于普通的上下文依賴模型,大語(yǔ)言模型可以根據(jù)現(xiàn)有數(shù)據(jù)生成新的數(shù)據(jù)點(diǎn)。這項(xiàng)工作名為 “生成式異質(zhì)圖增強(qiáng)”工作,即通過(guò)大語(yǔ)言模型來(lái)擴(kuò)展和豐富不同類型的圖數(shù)據(jù)。第二,通過(guò)Prompt(一種指令或提示)引導(dǎo)模型學(xué)習(xí)和發(fā)現(xiàn)特定數(shù)據(jù)特性。例如,設(shè)置一個(gè) Prompt“一年內(nèi)違約3次以上的群體的共同特征”,模型便會(huì)生成滿足特定條件的數(shù)據(jù)樣本。這種能力可以加速數(shù)據(jù)分析和特性發(fā)現(xiàn)的過(guò)程。
在本場(chǎng)論壇上,國(guó)內(nèi)外圖智能領(lǐng)域的專家和學(xué)者還分享了更多熱點(diǎn)進(jìn)展。加拿大滑鐵盧大學(xué)校級(jí)教授M. Tamer ?zsu分享了在業(yè)內(nèi)富有挑戰(zhàn)性的流式圖計(jì)算技術(shù)。浙江大學(xué)計(jì)算機(jī)學(xué)院教授陳華鈞講述了大模型時(shí)代知識(shí)處理的機(jī)遇與挑戰(zhàn)。之江實(shí)驗(yàn)室圖計(jì)算研究中心副主任陳紅陽(yáng)帶來(lái)了之江朱雀圖科學(xué)計(jì)算與生物醫(yī)藥研發(fā)的最新研究。機(jī)器之心聯(lián)合創(chuàng)始人、副主編李亞洲認(rèn)為圖智能和大模型相結(jié)合的研究有望為數(shù)據(jù)智能帶來(lái)重大提升。
關(guān)于人工智能和圖計(jì)算的可能性,外灘圖智能論壇匯聚了不同視角的見解,為圖智能發(fā)展描繪了重要的發(fā)展脈絡(luò)。