后羿采集器 V3.6.1 官方安裝版

后羿采集器 V3.6.1 官方安裝版

評分:

文件大小:47.68 MB

類型:網(wǎng)絡軟件

開發(fā):

要求:WinAll

軟件介紹

后羿采集器官方安裝版是一款專業(yè)的網(wǎng)頁數(shù)據(jù)采集軟件,后羿采集器可以在各個平臺上進行使用,并且采集和導出數(shù)據(jù)全是免費的,并且后羿采集器擁有可視化自定義的采集程序,而且后羿采集器還支持后臺運行。

后羿采集器

軟件特色

1、可視化自定義采集流程。

全程問答式引導、可視化操作、自定義采集流程。

自動記錄和模擬網(wǎng)頁操作順序。

高級設置滿足更多采集需求。

2、點選抽取網(wǎng)頁數(shù)據(jù)

鼠標點擊選擇要爬取的網(wǎng)頁內(nèi)容、操作簡單。

可選擇抽取文本、鏈接、屬性、html標簽等。

3、運行批量采集數(shù)據(jù)

軟件按照采集流程和抽取規(guī)則自動批量采集。

快速穩(wěn)定,實時顯示采集速度和過程。

可切換軟件后臺運行,不打擾前臺工作。

4、導出和發(fā)布采集的數(shù)據(jù)

采集的數(shù)據(jù)自動表格化,自由配置字段。

支持數(shù)據(jù)導出到Excel等本地文件。

和一鍵發(fā)布到CMS網(wǎng)站/數(shù)據(jù)庫/微信公眾號等媒體。

使用方法

自定義采集百度搜索結(jié)果數(shù)據(jù)的方法。

步驟1:創(chuàng)建采集任務

后羿采集器

(1)、啟動后羿采集器,進入主界面,選擇自定義采集并點擊創(chuàng)建任務按鈕創(chuàng)建 “自定義采集任務”。

(2)、輸入百度搜索的URL,包括三種方式。

1、手動輸入:在輸入框中直接輸入URL,多個URL時須要換行分割。

2、點擊從文件中讀取方式:用戶選擇一個存放URL的文件,文件中可以有多個URL地址,地址須要換行分割。

3、批量添加方式:通過添加并調(diào)整地址參數(shù)生成多個有規(guī)律的地址。

后羿采集器

步驟2:自定義采集流程

1、點擊創(chuàng)建后自動打開第一個URL進而進入自定義設置頁面,默認已經(jīng)創(chuàng)建了開始、打開網(wǎng)頁、結(jié)束的流程塊。底部模板區(qū)用于拖拽到畫布中生成新的流程塊;點擊打開網(wǎng)頁中的屬性按鈕,可修改打開的網(wǎng)址。

后羿采集器

2、添加輸入文字流程塊:在底部模板區(qū)中拖拽輸入文字塊到打開網(wǎng)頁塊后面附近,當出現(xiàn)陰影區(qū)域的時候可以松開鼠標,此時會自動連接,添加完成。

后羿采集器

3、生成完整流程圖:仿照上面添加輸入文字流程塊的拖拽流程添加新塊:如下圖所示:

后羿采集器

關鍵步驟塊設置介紹

步驟1:定時等待用于等待前面打開網(wǎng)頁完成。

步驟2:點擊輸入框Xpath屬性按鈕,在屬性菜單中點擊圖標進行點選網(wǎng)頁中的輸入框,點擊輸入文本屬性按鈕,在菜單中輸入要搜索的文本。

步驟3:用于設置點擊開始搜索按鈕,點擊元素的xpath屬性按鈕,在菜單中點擊點選圖標,然后點擊網(wǎng)頁中的百度一下按鈕即可。

步驟4:用于設置循環(huán)加載下一列表頁。在循環(huán)塊內(nèi)部的循環(huán)條件塊中設置詳細條件,此處點擊操作按鈕,選擇單個元素,然后在屬性菜單中點擊元素的xpath屬性按鈕,同上進行點選網(wǎng)頁中的下一頁按鈕。循環(huán)次數(shù)屬性按鈕可默認為0,即不限制點擊下一頁的次數(shù)。

步驟5:用于設置循環(huán)抽取列表頁中的數(shù)據(jù)。在循環(huán)塊內(nèi)部的循環(huán)條件塊中設置詳細條件,此處點擊操作按鈕,選擇不固定元素列表,然后在屬性菜單中點擊元素的xpath屬性按鈕,然后在網(wǎng)頁中連續(xù)點選兩次抽取第一塊和第二塊元素。循環(huán)次數(shù)屬性按鈕可默認為0,即不限制列表中收取字段的數(shù)量。

步驟6:用于執(zhí)行點擊下一頁按鈕操作,點擊元素xpath屬性按鈕,選擇使用當前循環(huán)中元素的xpath選項。

步驟7:同理用于設置網(wǎng)頁加載等待時間。

步驟8:用于設置在列表頁抽取的字段規(guī)則,點擊屬性按鈕中使用循環(huán)中的元素按鈕,選擇使用循環(huán)中的元素選項。點擊元素模板屬性按鈕在字段表格中點擊加減進行添加刪除字段,添加字段使用點選操作,即點擊加號后鼠標移動到網(wǎng)頁元素上點擊選擇。

4、點擊開始采集,啟動采集

后羿采集器

步驟3:數(shù)據(jù)采集及導出

1、采集任務運行中。

后羿采集器

2、采集完成后,選擇“導出數(shù)據(jù)”可以把數(shù)據(jù)都導出到本地文件。

后羿采集器

3、選擇“導出方式”,將采集好的數(shù)據(jù)導出,這里可以選擇excel作為導出為格式。

后羿采集器

4、采集數(shù)據(jù)導出后如下圖。

后羿采集器

微信二維碼
主站蜘蛛池模板: 欧美成人a人片| 被女同桌调教成鞋袜奴脚奴| 日韩精品人妻系列无码专区 | 2022国产麻豆剧果冻传媒剧情 | 国内不卡一二三四区| 亚洲国产欧美91| 中文国产成人精品久久app| 香蕉久久国产精品免| 成年女人免费v片| 免费人成网站7777视频| 69日本xxxxxxxxx19| 日韩欧美一区二区三区在线播放 | 国产精品高清一区二区三区| 五月开心播播网| 色yeye在线观看| 在线人成精品免费视频| 人人看人人添人人谢| ww在线观视频免费观看| 无码综合天天久久综合网| 伊人久久大香线蕉av一区二区| 18禁无遮挡无码网站免费| 日本最新免费二区| 免费无码一区二区三区| xxxxx日韩| 成年午夜视频免费观看视频| 亚洲精品永久www忘忧草| 黄色一级电影免费| 日韩精品无码免费专区午夜不卡| 午夜激情电影在线观看| 3d玉蒲团之极乐宝鉴| 无翼乌无遮挡h肉挤奶百合| 亚洲精品无码mv在线观看网站 | silk131中字在线观看| 欧美丰满熟妇XXXX性大屁股| 四虎亚洲国产成人久久精品| 中文字幕一区二区三区久久网站| 永久免费视频v片www| 国产内射爽爽大片视频社区在线| a级高清观看视频在线看| 日韩精品一区二区三区老鸦窝 | 一本之道高清在线|