Starred repositories
🔮 ChatGPT Desktop Application (Mac, Windows and Linux)
文档全文翻译器:英文PDF/MD论文 → (PDF Doc2X识别) → 翻译(GPT deepseek ollama google deepL deepLX)→ 中文文档(Markdown/Word)
A python wrapper for the Doc2X API and comes with native texts processing (to improve PDF recall in RAG). | Doc2X API的python封装,同时附带本地的文本处理(提升PDF在RAG中的召回率)。
OCR, layout analysis, reading order, table recognition in 90+ languages
A Comprehensive Toolkit for High-Quality PDF Content Extraction
DocLayout-YOLO: Enhancing Document Layout Analysis through Diverse Synthetic Data and Global-to-Local Adaptive Perception
MinerU是一款开源的高质量PDF解析工具,基于深度学习技术,可自动提取PDF文档中的文字、表格、图片、公式等内容,并提供丰富的分析、统计、搜索等功能。 本项目为其提供一个简化版本的WebUI,方便用户上传PDF文件,并实时展示提取结果。
translate scientific papers in latex, especially arxiv papers
Official code for Goldfish model for long video understanding and MiniGPT4-video for short video understanding
OCR & Document Extraction using vision models
LaTeX.css is a CSS library that makes your website look like a LaTeX document
A high-quality tool for convert PDF to Markdown and JSON.一站式开源高质量数据提取工具,将PDF转换成Markdown和JSON格式。
基于MinerU的桌面应用程序,MinerU是一款开源的高质量PDF解析工具,基于深度学习技术,可自动提取PDF文档中的文字、表格、图片、公式等内容,并提供丰富的分析、统计、搜索等功能。 本项目为其提供一个简化版本的WebUI,方便用户上传PDF文件,并实时展示提取结果。
Make bilingual epub books Using AI translate
PDF scientific paper translation with preserved formats - 基于 AI 完整保留排版的 PDF 文档全文双语翻译,支持 Google/DeepL/Ollama/OpenAI 等服务,提供 CLI/GUI/Docker/Zotero
小红书笔记 | 评论爬虫、抖音视频 | 评论爬虫、快手视频 | 评论爬虫、B 站视频 | 评论爬虫、微博帖子 | 评论爬虫、百度贴吧帖子 | 百度贴吧评论回复爬虫 | 知乎问答文章|评论爬虫
包含350多个组件用法、组件继承关系图、40多个 loading 组件,App升级、验证码、弹幕、音乐字幕 4个插件,一个小而全完整的App项目。
html5 js 录音 mp3 wav ogg webm amr g711a g711u 格式,支持pc和Android、iOS部分浏览器、Hybrid App(提供Android iOS App源码)、微信,提供ASR语音识别转文字 H5版语音通话聊天示例 DTMF编码解码
Voice Recognition to Text Tool / 一个离线运行的本地音视频转字幕工具,输出json、srt字幕、纯文字格式
🛠「Watt Toolkit」是一个开源跨平台的多功能 Steam 工具箱。
An open-source script that automatically Cracks (removes DRM from) Steam games