- 軟(ruǎn)件(jiàn)大(dà)小:27.09M
- 軟件語言:中文
- 軟件類型(xíng):國產軟件
- 軟件類別:免費(fèi)軟(ruǎn)件 / 下載工具
- 更新(xīn)時間:2023-03-13 00:09
- 運(yùn)行環境:WinAll, WinXP
- 軟(ruǎn)件等級:
- 軟件廠(chǎng)商:
- 官方網站:http://www.51pashanhu.com
3.18M/中文(wén)/5.0
0KB/中文/5.0
2.98M/中(zhōng)文/10.0
3.41M/中文/5.0
700KB/中文/10.0
爬山虎(hǔ)采集器是一款專為(wéi)用戶(hù)提供信息采集功能的軟件,用戶可以使用軟(ruǎn)件將自己需要(yào)的信息數(shù)據從瀏覽器或者是其(qí)他的地方收(shōu)集,並生成(chéng)你想要的(de)文本格式,非常的簡單又方便,需要的用戶快(kuài)來綠色資源網下載吧!
爬山虎采集(jí)器是一(yī)款支持99%的網站數據采集的高效網頁(yè)信息采(cǎi)集軟件,軟(ruǎn)件能生成(chéng)excel表(biǎo)格,api數據(jù)庫(kù)文件等(děng)內容,幫助你管理網站數據信息,如果您(nín)需要對某個指定網頁數據進(jìn)行采集(jí),使用這款(kuǎn)軟件(jiàn)即可!
腳本定時運行(háng)
可按(àn)照計劃定時運(yùn)行,無需(xū)人工
獨創高速內核
自研的瀏覽器內核,速度飛(fēi)快,遠超對手(shǒu)
向導(dǎo)模式
簡(jiǎn)單(dān)易用(yòng),輕鬆通過鼠標點(diǎn)擊自動生(shēng)成
智能識別
對於網頁中的列表、表單結構(多選框下(xià)拉列(liè)表等)能夠智能識(shí)別
廣告屏(píng)蔽
定製(zhì)的廣告屏蔽模塊,兼(jiān)容adblockPlus語法,可添加自定義規則
多種數據導出
支持Txt 、Excel、mysql、SQLServer、sqlite、access、網站(zhàn)等
適用各(gè)種網(wǎng)站
能夠采集互聯網99%的網站,包(bāo)括單頁應用Ajax加(jiā)載(zǎi)等等動態類(lèi)型網站
一鍵(jiàn)提取數據
簡單易學,通過可視化界麵(miàn),鼠(shǔ)標(biāo)點擊即(jí)可(kě)抓取數據
快速(sù)高效
內置一(yī)套高速瀏覽(lǎn)器內核,加上HTTP引擎模式(shì),實現(xiàn)快速采集(jí)數據
問:如何(hé)抓包獲取(qǔ)Cookie,並且手(shǒu)動設置?
1.首先,使用穀歌瀏覽(lǎn)器打(dǎ)開要采集的網(wǎng)站,並且(qiě)登陸。
2.然後(hòu)按下 F12,會出現開發者工(gōng)具,選擇 Network
3.然(rán)後按下(xià)F5,刷(shuā)新下頁(yè)麵, 選擇其中一個請求。
4.複製完成(chéng)後,在爬山(shān)虎(hǔ)采集器(qì)中(zhōng),編輯任務,進入第三步,指定(dìng)HTTP Header。
問:如何過濾列表(biǎo)中的前N個數(shù)據?
1.有時我們需要(yào)對采(cǎi)集到的列表(biǎo)進行過濾,比如過濾掉第一組(zǔ)數據(在(zài)采集表格時,過濾掉表格(gé)列名)
2.點擊(jī)列(liè)表模式菜單中的,設置列表xpath
第一步:輸(shū)入采(cǎi)集網址
打開軟件,新(xīn)建(jiàn)任務(wù),輸入(rù)需要采集的網站地址。
第二步:智能(néng)分(fèn)析,全程自動化(huà)提取(qǔ)數據(jù)
進入到(dào)第二步後,爬山虎采集器全自動智能分析網(wǎng)頁,並(bìng)且從中(zhōng)提取出(chū)列表數據。
第三(sān)步:導出數據(jù)到(dào)表格(gé)、數(shù)據庫(kù)、網(wǎng)站等
運(yùn)行任務,將采(cǎi)集到的數(shù)據導出為Csv、Excel以及(jí)各種數據庫,支持api導出。
1.修複登(dēng)陸時的(de)DNS問題
2.修(xiū)複(fù)圖片下載問題
3.修複(fù) json 一些問題
4.增加插(chā)件功能
5.增加導出 txt (一條(tiáo)保存為一個文件)
6.多值(zhí)連接符支(zhī)持換(huàn)行(háng)符(fú)
7.修改數據處理(lǐ)的文(wén)本映射(支持查找替換(huàn))
請(qǐng)描述您所遇(yù)到的錯誤,我們將(jiāng)盡快予以修正(zhèng),謝謝!
*必填項,請(qǐng)輸入(rù)內容