Skip to content

一个 Golang 实现的相对智能、无需规则维护的通用新闻网站数据提取工具库。含域名探测、网页编码语种识别、网页链接分类提取、网页新闻要素抽取以及新闻正文抽取等组件。

License

Notifications You must be signed in to change notification settings

GreyOfShadow/go-pkg-spider

Repository files navigation

go-pkg-spider

go-pkg-spider

"api",
"download",
"upload",
"register",
"login",
"mail",
"vipmail",
"email",
"music",
"yinyue",
"movie",
"film",
"dianying",
"video",
"tv",
"dianshi",
"pay",
"hr",
"help",
"vip",
"map",
"sitemap",
"about",
"qiye",
"weather",
"tianqi",


"ad", // 广告
"user", // 用户
"member", // 会员
"passport", // 通行证
"sso", // 通行证
"reg", // 注册
"v", // 视频
"book", // 读书,阅读
"job", // 招聘
"pic" // 图片
"photo" // 图集
"picture" // 图片
"live", // 直播
"zhibo", // 直播
"search", // 搜索
小说网站
招聘网站
音乐网站
游戏网站
电商网站

About

一个 Golang 实现的相对智能、无需规则维护的通用新闻网站数据提取工具库。含域名探测、网页编码语种识别、网页链接分类提取、网页新闻要素抽取以及新闻正文抽取等组件。

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Go 100.0%