Lists (1)
Sort Name ascending (A-Z)
Stars
VideoFinder is an advanced video analysis tool powered by multimodal AI, designed to help users easily locate and identify specific objects or people within video content. By combining the capabili…
AutoDL平台服务器适配梯子, 使用 Clash 作为代理工具
This repository provides implementation for the paper "Self-attention fusion for audiovisual emotion recognition with incomplete data".
This repository provides the ability to recoginize the emotion from video using audiovisual modalities。端到端的多模态情感识别代码
基于SpringBoot + Vue的智能云医疗系统 系统公告、医生管理、药品信息、问题求助、医院管理、库存统计、配送物流、医疗资讯、电子处方、科室管理、订单管理、订单评价、药店库存、医院采购、挂号记录、评论管理、医生排班、员工管理、用户管理、数据统计、医院统计、医院地图、销售统计、医生挂号统计、药品销售统计、个人信息、班次记录、挂号诊断、挂号开单、用户问题、业务大厅、我的信息、问题求助、医…
基于深度学习的肿瘤辅助诊断系统,以图像分割为核心,利用人工智能完成肿瘤区域的识别勾画并提供肿瘤区域的特征来辅助医生进行诊断。有完整的模型构建、后端架设、工业级部署和前端访问功能。TensorRT、PyTorch 、OpenCV 、Flask、Vue
整理开源的中文大语言模型,以规模较小、可私有化部署、训练成本较低的模型为主,包括底座模型,垂直领域微调及应用,数据集与教程等。
eladmin mybatis-plus版本:项目基于 Spring Boot 2.7.18 、MyBatis-Plus、Spring Security、Redis、Vue的前后端分离的后台管理系统, 权限控制采用 RBAC,支持数据字典与数据权限管理,支持一键生成前后端代码,支持动态路由
Efficient face emotion recognition in photos and videos
code for: POSTER: A Pyramid Cross-Fusion Transformer Network for Facial Expression Recognition
又一个小商城。litemall = Spring Boot后端 + Vue管理员前端 + 微信小程序用户前端 + Vue用户移动端
Emote Portrait Alive: Generating Expressive Portrait Videos with Audio2Video Diffusion Model under Weak Conditions
IEEE T-BIOM : "Audio-Visual Fusion for Emotion Recognition in the Valence-Arousal Space Using Joint Cross-Attention"
This is a Python 3 based project to display facial expressions by performing fast & accurate face detection with OpenCV using a pre-trained deep learning face detector model shipped with the library.
Firefly: 大模型训练工具,支持训练Qwen2.5、Qwen2、Yi1.5、Phi-3、Llama3、Gemma、MiniCPM、Yi、Deepseek、Orion、Xverse、Mixtral-8x7B、Zephyr、Mistral、Baichuan2、Llma2、Llama、Qwen、Baichuan、ChatGLM2、InternLM、Ziya2、Vicuna、Bloom等大模型
Fine-tuning ChatGLM-6B with PEFT | 基于 PEFT 的高效 ChatGLM 微调
为ChatGLM设计的微调数据集生成工具,速来制作自己的猫娘。
A collection of datasets for the purpose of emotion recognition/detection in speech.
✨✨Latest Advances on Multimodal Large Language Models
Robust Speech Recognition via Large-Scale Weak Supervision
Langchain-Chatchat(原Langchain-ChatGLM)基于 Langchain 与 ChatGLM, Qwen 与 Llama 等语言模型的 RAG 与 Agent 应用 | Langchain-Chatchat (formerly langchain-ChatGLM), local knowledge based LLM (like ChatGLM, Qwen and…
🎉 Repo for LaWGPT, Chinese-Llama tuned with Chinese Legal knowledge. 基于中文法律知识的大语言模型
中文LLaMA&Alpaca大语言模型+本地CPU/GPU训练部署 (Chinese LLaMA & Alpaca LLMs)