圖片來(lái)源:圖蟲(chóng)創(chuàng)意
因?yàn)镼A模塊信息太重要,所以寫(xiě)個(gè)QA自動(dòng)爬取程序,在瀏覽器中爬取競(jìng)品Q(chēng)A。
部分?jǐn)?shù)據(jù)效果圖如下。
圖片來(lái)源:乃超老師
本文分4個(gè)部分:
1. QA的作用
2. 使用步驟
3. 觸類(lèi)旁通思路
4. 工具代碼
一、QA的作用
1. 從競(jìng)品中找到買(mǎi)家關(guān)注的點(diǎn),進(jìn)行產(chǎn)品優(yōu)化及問(wèn)題規(guī)避
2. 弱客服情況下,盡可能從QA層面解答買(mǎi)家疑問(wèn),提高轉(zhuǎn)化率
二、使用步驟
1. 谷歌瀏覽器中安裝web scraper插件
2. 導(dǎo)入文章末尾代碼
3. 設(shè)置需爬取的鏈接
https://www.amazon.com/ask/questions/asin/愛(ài)森跨境/[1-n]?sort=SUBMIT_DATE
* 將‘愛(ài)森跨境’換成想爬的ASIN
* 將‘[1-n]’中的n換成想爬取的頁(yè)數(shù)
4. 點(diǎn)擊爬取按鈕、下載表格
圖片來(lái)源:乃超老師
三、觸類(lèi)旁通思路
爬取思路很簡(jiǎn)單,針對(duì)QA模塊,當(dāng)然能收集到的數(shù)據(jù)有很多,可以按思路自定義自己的爬取規(guī)則
1. 分析網(wǎng)頁(yè)結(jié)構(gòu),打開(kāi)QA模塊主頁(yè)
https://www.amazon.com/ask/questions/asin/B08D6CLGLH/1?sort=SUBMIT_DATE
圖片來(lái)源:亞馬遜平臺(tái)截圖
根據(jù)網(wǎng)頁(yè)分析,得出三點(diǎn)結(jié)論:
* 鏈接拼湊結(jié)果為 公共部分+ASIN+頁(yè)序號(hào)+排序方式
* 排序方式有兩種 Most Helpful first 和 Newest first。對(duì)應(yīng)字段值為SUBMIT_DATE、HELPFUL
* 遇到多條回答的問(wèn)題,無(wú)法展開(kāi),只能跳到問(wèn)答詳情頁(yè)
因此,根據(jù)流程,要爬取一個(gè)問(wèn)題的所有回答,則必須抓取詳情頁(yè)數(shù)據(jù)。問(wèn)答詳情頁(yè)分析如下:
圖片來(lái)源:亞馬遜平臺(tái)截圖
由圖可知,一個(gè)問(wèn)答對(duì)應(yīng)一個(gè)問(wèn)答ID,問(wèn)答詳情頁(yè)面也是由該ID拼接而成。所以只需打開(kāi)不同問(wèn)題拿到對(duì)應(yīng)問(wèn)題下的所有回答就好。
加入我們獲取更多純干貨內(nèi)容,教你如何用通俗代碼解決平常數(shù)據(jù)收集和分析問(wèn)題。
(來(lái)源:乃超老師)
以上內(nèi)容屬作者個(gè)人觀點(diǎn),不代表雨果跨境立場(chǎng)!本文經(jīng)原作者授權(quán)轉(zhuǎn)載,轉(zhuǎn)載需經(jīng)原作者授權(quán)同意。?