知識圖譜分為幾種?大型學(xué)科知識圖譜如何構(gòu)建呢?
文章摘要:目前已有的知識圖譜,分為通用知識圖譜,比如數(shù)據(jù)庫、YAGO、Freebase等,以及谷歌的KnowledgeGraph、百度“知心”、搜狗“知立方”等;另一種為領(lǐng)域知識圖譜,比如Geonames、“天眼查”等。目前,采用全自動化...
目前已有的知識圖譜,分為通用知識圖譜,比如數(shù)據(jù)庫、 YAGO、 Freebase等,以及谷歌的 Knowledge Graph、百度“知心”、搜狗“知立方”等;另一種為領(lǐng)域知識圖譜,比如 Geonames、“天眼查”等。
目前,采用全自動化的方法很難獲得更精確的知識圖譜,如 DBPedia、 YAGO等,錯(cuò)誤較多;而完全手工構(gòu)造的方法,雖能確保準(zhǔn)確率,但代價(jià)高昂,且耗費(fèi)大量的人力物力,難以建立大型的知識圖譜,因此,如何協(xié)調(diào)正確率與效率,平衡自動化方法與人工投入,以最有效的方法構(gòu)造出最精確的知識圖譜,是當(dāng)前知識圖譜建設(shè)中亟待解決的問題。
針對上述問題,以基礎(chǔ)地理知識圖譜為例,提出了一種系統(tǒng)的解決方案,即“四步法”,即:
(1)領(lǐng)域本體的建立:以地理科權(quán)威的教科書、輔助材料為基礎(chǔ),采用開放式 IE技術(shù)及相關(guān)統(tǒng)計(jì)方法,參照其它知識圖譜的本體結(jié)構(gòu),并根據(jù)地理學(xué)專業(yè)的專業(yè)和教學(xué)人員的建議,實(shí)現(xiàn)對基礎(chǔ)教育的地學(xué)本體的建構(gòu);
(2)“眾包”半自動語義標(biāo)注:以地理學(xué)科領(lǐng)域本體為基礎(chǔ),利用語義標(biāo)注系統(tǒng)實(shí)現(xiàn)半自動語義標(biāo)注,并在該過程中完善地理學(xué)科領(lǐng)域本體;
(3)外源資料補(bǔ)充:根據(jù)地理學(xué)知識圖譜的本體結(jié)構(gòu),將結(jié)構(gòu)化的外部資料進(jìn)行適當(dāng)?shù)募庸?,獲得外源資料,成為地理學(xué)科知識圖譜中的一項(xiàng)重要內(nèi)容;
(4)信息提?。焊鶕?jù)地理知識圖譜的本體結(jié)構(gòu),采用有監(jiān)督、半監(jiān)督、不監(jiān)督的方式提取百度百科中的實(shí)體和關(guān)聯(lián),從而獲得更多的數(shù)據(jù)。
以上就是大型學(xué)科知識圖譜構(gòu)建的解決方案。
文章為沃豐科技原創(chuàng),轉(zhuǎn)載需注明來源:http://www.yzny.net.cn/ucm/faq/19328
