Skip to content
View liujin163's full-sized avatar

Block or report liujin163

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Please don't include any personal information such as legal names or email addresses. Maximum 100 characters, markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
Showing results

SafeLine is a self-hosted WAF(Web Application Firewall) / reverse proxy to protect your web apps from attacks and exploits.

Go 15,396 928 Updated Jan 22, 2025

text2vec, text to vector. 文本向量表征工具,把文本转化为向量矩阵,实现了Word2Vec、RankBM25、Sentence-BERT、CoSENT等文本表征、文本相似度计算模型,开箱即用。

Python 4,602 406 Updated Jan 2, 2025

Facilitating the design, comparison and sharing of deep text matching models.

Python 3,850 898 Updated Aug 2, 2024

中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库、汽车品牌词库、汽车零件词库、连续英文切割、各种中文词向量、公司名字大全、古诗词库、IT词库、财经词库、成语词库、地名词库、…

Python 70,887 14,668 Updated May 10, 2024

数据挖掘、计算机视觉、自然语言处理、推荐系统竞赛知识、代码、思路

Jupyter Notebook 4,361 1,069 Updated Oct 8, 2024

Bitnami Helm Charts

Smarty 9,234 9,363 Updated Feb 10, 2025

Fair-code workflow automation platform with native AI capabilities. Combine visual building with custom code, self-host or cloud, 400+ integrations.

TypeScript 59,670 12,366 Updated Feb 11, 2025

Flink CDC is a streaming data integration tool

Java 5,936 2,002 Updated Feb 11, 2025

使用scrapy,redis, mongodb,graphite实现的一个分布式网络爬虫,底层存储mongodb集群,分布式使用redis实现,爬虫状态显示使用graphite实现

Python 3,248 1,596 Updated Apr 18, 2017

Dinky is a real-time data development platform based on Apache Flink, enabling agile data development, deployment and operation.

Java 3,311 1,202 Updated Feb 10, 2025

Distributed web crawler admin platform for spiders management regardless of languages and frameworks. 分布式爬虫管理平台,支持任何语言和框架

Go 11,501 1,810 Updated Feb 7, 2025

Python ProxyPool for web spider

Python 21,954 5,237 Updated Sep 10, 2024

python pandas pyecharts streamlit echarts

Jupyter Notebook 317 87 Updated Nov 12, 2024

通达信预警信号程序化交易

Python 87 29 Updated Feb 8, 2025

AKShare is an elegant and simple financial data interface library for Python, built for human beings! 开源财经数据接口库

Python 10,243 2,019 Updated Feb 10, 2025

实战🐍多种网站、电商数据爬虫🕷。包含🕸:淘宝商品、微信公众号、大众点评、企查查、招聘网站、闲鱼、阿里任务、博客园、微博、百度贴吧、豆瓣电影、包图网、全景网、豆瓣音乐、某省药监局、搜狐新闻、机器学习文本采集、fofa资产采集、汽车之家、国家统计局、百度关键词收录数、蜘蛛泛目录、今日头条、豆瓣影评、携程、小米应用商店、安居客、途家民宿❤️❤️❤️。微信爬虫展示项目:

Python 4,864 1,370 Updated May 22, 2024

小红书笔记 | 评论爬虫、抖音视频 | 评论爬虫、快手视频 | 评论爬虫、B 站视频 | 评论爬虫、微博帖子 | 评论爬虫、百度贴吧帖子 | 百度贴吧评论回复爬虫 | 知乎问答文章|评论爬虫

Python 19,706 5,891 Updated Feb 10, 2025

Python Backtesting library for trading strategies

Python 15,813 4,120 Updated Aug 19, 2024

基于Python的开源量化交易平台开发框架

Python 27,078 9,075 Updated Jan 25, 2025

📚 技术面试必备基础知识、Leetcode、计算机操作系统、计算机网络、系统设计

178,782 51,182 Updated Aug 21, 2024

The interactive graphing library for Python ✨ This project now includes Plotly Express!

Python 16,704 2,588 Updated Feb 10, 2025

Full stack, modern web application template. Using FastAPI, React, SQLModel, PostgreSQL, Docker, GitHub Actions, automatic HTTPS and more.

TypeScript 29,595 5,404 Updated Feb 10, 2025

INFO-SPIDER 是一个集众多数据源于一身的爬虫工具箱🧰,旨在安全快捷的帮助用户拿回自己的数据,工具代码开源,流程透明。支持数据源包括GitHub、QQ邮箱、网易邮箱、阿里邮箱、新浪邮箱、Hotmail邮箱、Outlook邮箱、京东、淘宝、支付宝、中国移动、中国联通、中国电信、知乎、哔哩哔哩、网易云音乐、QQ好友、QQ群、生成朋友圈相册、浏览器浏览历史、12306、博客园、CSDN博客…

Python 7,919 1,493 Updated Aug 20, 2024

一键同步文章到多个内容平台,支持今日头条、WordPress、知乎、简书、掘金、CSDN、typecho各大平台,一次发布,多平台同步发布。解放个人生产力

JavaScript 3,948 606 Updated Apr 22, 2024

python爬虫教程系列、从0到1学习python爬虫,包括浏览器抓包,手机APP抓包,如 fiddler、mitmproxy,各种爬虫涉及的模块的使用,如:requests、beautifulSoup、selenium、appium、scrapy等,以及IP代理,验证码识别,Mysql,MongoDB数据库的python使用,多线程多进程爬虫的使用,css 爬虫加密逆向破解,JS爬虫逆向,…

Python 19,089 3,796 Updated Jul 29, 2024

Lightweight analytics abstraction layer for tracking page views, custom events, & identifying visitors

JavaScript 2,511 244 Updated Dec 12, 2024

支持Springboot,基于注解的可使用变量、可以自定义函数的通用操作日志组件

Java 2,251 500 Updated Feb 8, 2025

使用注解优雅记录系统日志,操作日志,后端埋点等,支持SpEL表达式,自定义上下文,自定义函数,实体类DIFF等其他高阶处理。

Java 954 179 Updated Jul 11, 2024

为前端项目提供【 埋点、行为、性能、异常、请求、资源、路由、曝光、录屏 】监控手段

TypeScript 2,515 300 Updated Dec 11, 2024

一个用于提取简体中文字符串中省,市和区并能够进行映射,检验和简单绘图的python模块

Python 1,700 399 Updated Mar 19, 2024
Next