刨丁解羊中文分詞器,主要用于對網絡蜘蛛或網絡爬蟲抓取的網頁進行分詞,支持繁體中文分詞、簡體中文分詞、英文分詞,是制作通用搜索引擎和垂直搜索引擎的核心組件。
該軟件在普通PC機器上測試顯示:TXT格式正文分詞速度約為3000萬字/分鐘,網頁分詞速度約為277.8個網頁/秒。
該軟件采用基礎詞庫(63萬詞語)+擴展詞庫(用戶可手工添加新詞)。DLL及OCX調用請聯(lián)系QQ(601069289)。
英語中的分詞[participle],分為現(xiàn)在分詞和過去分詞兩種,是一種非謂語動詞形式,尤指以-ing或-ed,-d,-t,-en或-n結尾的英語動詞性形容詞,具有形容詞功能,同時又表現(xiàn)各種動詞性特點,如時態(tài),語態(tài)、帶狀語性修飾語的性能及帶賓詞的性能。