type
date
status
slug
summary
tags
category
password
icon
工作需要对各类薅羊毛信息、黄牛动态进行捕捉,例如热门商品价格舆情,营销活动被攻击信息。而这类一手消息往往在各类社群中,特别是微信群。那么就需要实现对微信群信息进行采集、数据清洗、分析,设置预警。
本文简单记录下采集这一步的技术实现,对微信机器人等一番搜索并实践,发现共有两种方式可以完成信息采集,1是通过wechaty来实现,2是通过DLL注入PC端微信实现。效果演示,仅供参考:


一、Wechaty(长期使用不推荐,容易封号)
Wechaty 是一个开源的的对话机器人 SDK,支持 个人号 微信。它是一个使用Typescript 构建的Node.js 应用。
直接上代码,核心是index.js文件,通过nodejs运行生成登陆二维码,微信扫描授权即可接收个人消息与群聊消息,这里我只实现了群聊消息监听并自动转发至HttpServer进行后续处理。
二、WeChatFerry
支持发送文本消息、图片、文件、XML、表情等,可以接收好友申请、添加群成员等功能,提供了RPC通信和间谍模块来实现微信消息的转发。
要注意版本与微信要一致,否则会失败,长期运行可以采购一台windows云服务器。
转发所有接受到的微信群消息到我搭建的flask服务端处理,代码如下:
因为微信群的消息都是杂乱的非结构化数据,所以接下来使用大模型数据清洗后存入数据库。或者直接将消息通过正则匹配关键词,结合公司内部IM产品或者飞书/钉钉/企微等机器人能力进行预警。