手機(jī)號(hào)
未認(rèn)證執(zhí)照
張寶(先生)
普通會(huì)員
張寶 (先生)
隨著網(wǎng)絡(luò)、數(shù)據(jù)庫(kù)技術(shù)的迅速發(fā)展以及數(shù)據(jù)庫(kù)管理系統(tǒng)的廣泛應(yīng)用,人們積累的數(shù)據(jù)越來(lái)越多。數(shù)據(jù)挖掘(data mining)就是從大量的實(shí)際應(yīng)用數(shù)據(jù)中提取隱含信息和知識(shí),它利用了數(shù)據(jù)庫(kù)、人工智能和數(shù)理統(tǒng)計(jì)等多方面的技術(shù),是一類深層次的數(shù)據(jù)分析方法。
數(shù)據(jù)的迅速增加與數(shù)據(jù)分析方法的滯后之間的矛盾越來(lái)越突出,人們希望在對(duì)已有的大量數(shù)據(jù)分析的基礎(chǔ)上進(jìn)行科學(xué)研究、商業(yè)決策或者企業(yè)管理,但是目前所擁有的數(shù)據(jù)分析工具很難對(duì)數(shù)據(jù)進(jìn)行深層次的處理,使得人們只能望“數(shù)”興嘆。數(shù)據(jù)挖掘正是為了解決傳統(tǒng)分析方法的不足,并針對(duì)大規(guī)模數(shù)據(jù)的分析處理而出現(xiàn)的。數(shù)據(jù)挖掘通過(guò)在大量數(shù)據(jù)的基礎(chǔ)上對(duì)各種學(xué)習(xí)算法的訓(xùn)練,得到數(shù)據(jù)對(duì)象間的關(guān)系模式,這些模式反映了數(shù)據(jù)的內(nèi)在特性,是對(duì)數(shù)據(jù)包含信息的更高層次的抽象。目前,在需要處理大數(shù)據(jù)量的科研領(lǐng)域中,數(shù)據(jù)挖掘受到越來(lái)越多的關(guān)注,同時(shí),在實(shí)際問(wèn)題中,大量成功運(yùn)用數(shù)據(jù)挖掘的實(shí)例說(shuō)明了數(shù)據(jù)挖掘?qū)茖W(xué)研究具有很大的促進(jìn)作用。數(shù)據(jù)挖掘可以幫助人們對(duì)大規(guī)模數(shù)據(jù)進(jìn)行高效的分析處理,以節(jié)約時(shí)間,將更多的精力投入到更高層的研究中,從而提高科研工作的效率。
數(shù)據(jù)挖掘是知識(shí)發(fā)現(xiàn)(kdd)過(guò)程中的一個(gè)特定步驟,它用專門算法從數(shù)據(jù)中抽取模式,它并不是用規(guī)范的數(shù)據(jù)庫(kù)查詢語(yǔ)言進(jìn)行查詢,而是對(duì)查詢的內(nèi)容進(jìn)行模式的總結(jié)和內(nèi)在規(guī)律的搜索。傳統(tǒng)的查詢和報(bào)表處理只是得到事件發(fā)生的結(jié)果,并沒有深入研究發(fā)生的原因,而數(shù)據(jù)挖掘則主要了解發(fā)生的原因,并且以一定的置信度對(duì)未來(lái)進(jìn)行預(yù)測(cè),用來(lái)為決策行為提供有利的支持。
北京理工大學(xué)大數(shù)據(jù)搜索與挖掘?qū)嶒?yàn)室張華平主任研發(fā)的nlpir大數(shù)據(jù)語(yǔ)義智能分析技術(shù)是對(duì)語(yǔ)法、詞法和語(yǔ)義的綜合應(yīng)用。nlpir大數(shù)據(jù)語(yǔ)義智能分析平臺(tái)平臺(tái)是根據(jù)中文數(shù)據(jù)挖掘的綜合需求,融合了網(wǎng)絡(luò)精準(zhǔn)采集、自然語(yǔ)言理解、文本挖掘和語(yǔ)義搜索的研究成果,并針對(duì)互聯(lián)網(wǎng)內(nèi)容處理的全技術(shù)鏈條的共享開發(fā)平臺(tái)。
其中kgb(knowledge graph builder)知識(shí)圖譜引擎是我們自主研發(fā)的知識(shí)圖譜構(gòu)建與推理引擎,基于漢語(yǔ)詞法分析的基礎(chǔ)上,采用kgb語(yǔ)法實(shí)現(xiàn)了實(shí)時(shí)高效的知識(shí)生成,可以從非結(jié)構(gòu)化文本中抽取各類知識(shí),并實(shí)現(xiàn)了從表格中抽取指定的內(nèi)容等。kgb同時(shí)可以定義不同的動(dòng)作,如抽取動(dòng)作,并能自定義各類后處理程序。利用kgb知識(shí)圖譜引擎可以抽取到產(chǎn)品的詳細(xì)報(bào)價(jià)信息,方便進(jìn)行下一步的數(shù)據(jù)挖掘與圖譜構(gòu)建。
例如kgb語(yǔ)法:
knowledge: { [/le;/w]+[采購(gòu)方;甲 方;發(fā)包方; 需方]} +1+{[-(/le;/w)]20}s+{[(/le;/w)]}
action: extract
argument:甲 方單位
表示的是:
如果 句首或者標(biāo)點(diǎn)后,跟了{(lán)采購(gòu)方;甲 方;發(fā)包方};后面1步內(nèi)跟的不是標(biāo)點(diǎn)也不是是句尾,20個(gè)單元內(nèi)的部分,將選中的詞抽取為甲 方單位。
數(shù)據(jù)挖掘技術(shù)及其應(yīng)用是目前國(guó)際上的一個(gè)研究熱點(diǎn),并在許多行業(yè)中得到了很好的應(yīng)用,尤其是在市場(chǎng)營(yíng)銷中獲得了成功,初步體現(xiàn)了其優(yōu)越性和發(fā)展?jié)摿。在信息管理領(lǐng)域,綜合應(yīng)用數(shù)據(jù)挖掘技術(shù)和人工智能技術(shù),獲取用戶知識(shí)、文獻(xiàn)知識(shí)等各類知識(shí),將是實(shí)現(xiàn)知識(shí)檢索和知識(shí)管理發(fā)展的必經(jīng)之路。
聯(lián)系人 | 需求數(shù)量 | 時(shí)間 | 描述 |
---|---|---|---|
暫無(wú)產(chǎn)品詢價(jià)記錄 |
采購(gòu)商 | 成交單價(jià)(元) | 數(shù)量 | 成交時(shí)間 |
---|---|---|---|
暫無(wú)購(gòu)買記錄 |
地區(qū):成都
主營(yíng)產(chǎn)品:電磁閥,氣缸,過(guò)濾器地區(qū):汕頭
主營(yíng)產(chǎn)品:物流公司,貨運(yùn)站,國(guó)內(nèi)陸運(yùn)地區(qū):成都
主營(yíng)產(chǎn)品:聲屏障,護(hù)欄網(wǎng),石籠網(wǎng)地區(qū):邢臺(tái)
主營(yíng)產(chǎn)品:回收煙酒,回收茅臺(tái)酒,邢臺(tái)回收五糧液