信息采集的難點是什么?數(shù)據(jù)比較復雜,形式多樣;下載后的難點又是什么?數(shù)據(jù)管理。
網(wǎng)絡(luò)信息采集大師(NetGet)的主要功能,就是解決這兩個問題。一般數(shù)據(jù)采集是有針對性的,通常是針對某個或者某些網(wǎng)站,采集某些類別的數(shù)據(jù)。比如采集幾個網(wǎng)站的人才招聘信息,產(chǎn)品信息,供求信息,公司庫信息等等。對這些網(wǎng)站的數(shù)據(jù)結(jié)構(gòu)進行簡單分析后,設(shè)置相應(yīng)的采集規(guī)則,就可以把你想要的數(shù)據(jù)統(tǒng)統(tǒng)下載到本地。本軟件支持分類,分類的目的是數(shù)據(jù)便于管理,便于統(tǒng)計分析。
現(xiàn)有功能簡介:
1. 網(wǎng)絡(luò)信息采集大師可采集任何類型的網(wǎng)站信息。包括htm ,html, ASP , JSP , PHP等。采集速度快,信息一致準確。支持網(wǎng)站登錄。
2. 網(wǎng)絡(luò)信息采集大師分類。分類的目的,是方便地管理數(shù)據(jù)?梢蕴砑,刪除,修改分類。分類數(shù)據(jù)庫有三個最新備份,放在目錄 /files下,為數(shù)據(jù)安全提供了可靠保障。
3. 網(wǎng)絡(luò)信息采集大師任務(wù)。任務(wù)即采集任務(wù)。表現(xiàn)為相應(yīng)的采集規(guī)則。任務(wù)可以隨時開始,暫停和停止。本軟件支持多任務(wù),即同時采集不同的數(shù)據(jù)。
4.網(wǎng)絡(luò)信息采集大師 數(shù)據(jù)導出。采集的數(shù)據(jù)可導出為三種方式:文本,Excel和數(shù)據(jù)庫。可根據(jù)自己的需要,導出為不同的格式。
5. 數(shù)據(jù)庫。目前經(jīng)過測試的有Access和SqlServer數(shù)據(jù)庫。數(shù)據(jù)庫功能包括導入數(shù)據(jù)庫和數(shù)據(jù)查詢。
6. 網(wǎng)絡(luò)信息采集大師菜單功能擴展。一般是為了擴展數(shù)據(jù)分析功能。比如您自己開發(fā)了一個數(shù)據(jù)庫軟件,這個軟件用來分析采集的數(shù)據(jù),可把軟件掛接在本軟件上,方便使用。
7. 網(wǎng)絡(luò)信息采集大師日志。記錄每個重要的操作。比如對類別的維護,對任務(wù)的維護等等?蓪θ罩具M行清理和備份。
最新更新 | 專題合集|提交軟件 | 聯(lián)系我們 | 版權(quán)聲明
紅軟基地是免費軟件下載網(wǎng)站,以綠色軟件,免費軟件,瀏覽器,播放器,手機軟件,殺毒軟件,單機游戲下載為主,十萬用戶的選擇,沒有彈窗廣告的軟件下載網(wǎng)站!