同時能夠非??焖倬珳?zhǔn)的處理一系列比較復(fù)雜的字符串的檢索、替換和提取,具有快速匹配文本進(jìn)行信息抽取的特點。普通字符,非打印字符,通用字符,原子表這些字符組成了正則的基本部分。描述和分析文本內(nèi)容可以適用正則表達(dá)式進(jìn)行文本匹配,一般的文本字符都是可以通過一定的轉(zhuǎn)化為對應(yīng)的正則表達(dá)式的形式。
正則表達(dá)式雖然描述能力強(qiáng),但是若要實現(xiàn)匹配功能,還要進(jìn)行等價轉(zhuǎn)化。復(fù)雜的正則語義邏輯會增加時間和空間的復(fù)雜度,因此,正則表示不太利于大規(guī)模集合的構(gòu)造和高速的數(shù)據(jù)流匹配。
本文地址:http://islandpacificappraisals.com//article/28160.html