找回密码
 立即注册
搜索
查看: 665|回复: 0

[面向对象] phpspider爬虫知识储备

[复制链接]

581

主题

110

回帖

4066

积分

管理员

积分
4066

众神之神

发表于 2022-1-23 12:39:37 | 显示全部楼层 |阅读模式
phpspider爬虫知识储备

知识储备
从网页中抽取数据需要用XPath ( XPath选择器教程 )
https://www.w3school.com.cn/xpath/index.asp
https://doc.phpspider.org/xpath.html



当然我们还可以使用CSS选择器 ( CSS选择器教程 )
https://www.w3school.com.cn/cssref/css_selectors.asp



很多情况下都会用到正则表达式 ( 正则表达式教程 )
https://www.w3cschool.cn/regexp/


模拟登录:
https://doc.phpspider.org/development_skills/simulateLanding.html

谷歌XPath插件:XPath Helper

注意:在命令行中运行

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|十三博客 ( 鲁ICP备2023000528号 )

GMT+8, 2026-6-1 18:40 , Processed in 0.049144 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表