文章詳情頁

python - scrapy 處理文章分頁的內容

瀏覽：189日期：2022-08-03 16:15:10

問題描述

如一篇文章有2-3頁，然后想把這些內容頁爬下來，拼接成一頁，然后再放入數據庫。文章url如：article_1.html,article_2.htmlitem有：item[’title’],item[’content’]而item[’content’]就是拼接成一頁的內容。大概怎么寫呢？

問題解答

回答1：

找到分頁接口url

回答2：

找到那個下一頁的鏈接，加入到爬取url列表中

回答3：

可以在rules里面寫正則自動掃描符合的url

Python 編程

上一條：python - 如何讓dataframe A 的一列與dataframe B的一列相減相加結果記到A的c列？下一條：亂碼 - VS2013+PTVS，python編碼問題

相關文章：

1. javascript - 最近用echarts做統計圖時遇到兩個問題！！2. 淺談Vue使用Cascader級聯選擇器數據回顯中的坑3. node.js - less-loader 使用Mixins出錯4. 利用IPMI遠程安裝centos報錯！5. android - TextInputLayout的空白顯示問題6. 為什么redis中incr一個“0” 會報錯？7. celery+redis 怎么看redis里面的內容8. android - 使用百度sdk調用SDKInitializer.initialize(this)時報錯？9. android - 使用MTP連接的時候如何使自己的app加入選擇列表10. android - 優酷的安卓及蘋果app還在使用flash技術嗎？

排行榜

					
					淺談Vue使用Cascader級聯選擇器數據回顯中的坑
android - 使用百度sdk調用SDKInitializer.initialize(this)時報錯？
android - 優酷的安卓及蘋果app還在使用flash技術嗎？
angular.js - angular ng-focus ng-blur 存在問題
為什么redis中incr一個“0” 會報錯？
javascript - 最近用echarts做統計圖時遇到兩個問題！！
celery+redis  怎么看redis里面的內容
node.js - less-loader 使用Mixins出錯
android - TextInputLayout的空白顯示問題
android - 使用MTP連接的時候如何使自己的app加入選擇列表
利用IPMI遠程安裝centos報錯！
				

熱門標簽

午夜剧场伦理_日本一道高清_国产又黄又硬_91黄色网战_女同久久另类69精品国产_妹妹的朋友在线

python - scrapy 處理 文章 分頁的內容

python - scrapy 處理文章分頁的內容