找回密码
 立即注册
搜索
查看: 382|回复: 1

[基础语法] 微信公众号文章采集,公众号文章列表,获取登录信息

[复制链接]

581

主题

110

回帖

4066

积分

管理员

积分
4066

众神之神

发表于 2024-10-29 10:53:15 | 显示全部楼层 |阅读模式
结合以往文章:

微信公众号文章爬虫记录

通过微信公众平台,搜索公众号名称获取该公众号下文章


主要是需要获取:
fakeid:需要提取的公众号的fakeid
cookie:需要登录公众号的cookie
token:登录公众号的token
参数链接如下:

  1. https://mp.weixin.qq.com/cgi-bin/appmsg?action=list_ex&begin=0&count=7&fakeid=MzAxNjAzNTYwNA==&type=9&query=&token=1010140964&lang=zh_CN&f=json&ajax=1&a=1
复制代码


1.登录到公众号,进入草稿编辑页面
2.点击超链接


3.选择公众号

4.打开F12,点击Network或网络

5.输入搜索公众号名称






本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

581

主题

110

回帖

4066

积分

管理员

积分
4066

众神之神

 楼主| 发表于 2024-10-29 11:11:42 | 显示全部楼层
流程:借助coze智能体API来实现,大概需要2个将插件做成工作流
第一个:给扣子工作流,发送不同的fakeid(公众号ID),工作流会返回该公众号下5个最新文章链接、标题、头像、更新时间等等;
  1. {
  2.             "aid": "2651315247_1",
  3.             "album_id": "0",
  4.             "appmsg_album_infos": [],
  5.             "appmsgid": 2651315247,
  6.             "checking": 0,
  7.             "copyright_type": 0,
  8.             "cover": "https://mmbiz.qlogo.cn/mmbiz_jpg/u0S0sac2zvib3aFc1MnFNsYQaWV3KwZaia4to7U7WIl61JVqadqWdDeiacw6rbhDwoqH8IT8qS7smq7IbNsRcd0ZA/0?wx_fmt=jpeg",
  9.             "create_time": 1729787487,
  10.             "digest": "",
  11.             "has_red_packet_cover": 0,
  12.             "is_pay_subscribe": 0,
  13.             "item_show_type": 0,
  14.             "itemidx": 1,
  15.             "link": "http://mp.weixin.qq.com/s?__biz=MzAxNjAzNTYwNA==&mid=2651315247&idx=1&sn=5bea928db69ae14e1d5720ee75eebe63&chksm=80098654b77e0f4268b9a116afa0cca8bdd756b64efa215c5884af5b839b0b738458d025d471#rd",
  16.             "media_duration": "0:00",
  17.             "mediaapi_publish_status": 0,
  18.             "pay_album_info": {
  19.                 "appmsg_album_infos": []
  20.             },
  21.             "tagid": [],
  22.             "title": "舌边有齿痕不光在脾,在肝也在肾,一个中成药肝脾肾一起补",
  23.             "update_time": 1729818000
  24.         }
复制代码


第二个:给另外一个工作流发送,公众号文章的链接,来完成最终要提取的文章,因为文章带有合格式、还有公众号文章头部或尾巴常见的与主体内容无关的广告或者引导信息,这个时候可以让大模型筛选清洗一下信息之后再输出。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|十三博客 ( 鲁ICP备2023000528号 )

GMT+8, 2026-6-1 16:12 , Processed in 0.099494 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表