Website • Docs • Twitter • Join Slack Community
Label Studio是数据label和标注工具的瑞士军刀 ✌️
在线试用 running app 介绍博客 introductory post.
其目的是帮助您使用具有标准化输出格式的简单界面来标注不同类型的数据。 您正在处理自定义数据集并考虑创建工具吗? 使用Label Studio,您可以节省时间并在几分钟内创建自定义工具和界面。
- Quick Start
- One Click Deploy
- Features 🌟
- Use Cases
- Machine Learning Integration
- For Teams and Enterprises 🏢
- Ecosystem
- License
# Requires >=Python3.5
pip install label-studio
# 在labeling_project路径中初始化项目
label-studio init labeling_project
# Start 服务器 at http://localhost:8080
label-studio start labeling_project
要在Windows上运行,需要从以下位置手动下载以下: Gohlke builds, by ensuring the right python version:
Install Label Studio:
# Upgrade pip
pip install -U pip
# Assuming you are running Win64 with Python 3.8, install packages downloaded form Gohlke:
pip install lxml‑4.5.0‑cp38‑cp38‑win_amd64.whl
# Install label studio
pip install label-studio
conda create --name label-studio python=3.8
conda activate label-studio
pip install label-studio
如果在安装过程中发现任何错误,请尝试重新运行安装
pip install --ignore-installed label-studio
可以通过以下方式在本地运行最新版本的Label Studio,而无需从pip安装软件包:
# Install all package dependencies
pip install -e .
# Start the server at http://localhost:8080
python label_studio/server.py start labeling_project --init
试用docker运行 http://localhost:8080
:
docker run --rm -p 8080:8080 -v `pwd`/my_project:/label-studio/my_project --name label-studio heartexlabs/label-studio:latest label-studio start my_project --init
默认情况下,它在./my_project
目录中启动空白项目。
Note: if
./my_project
folder exists, an exception will be thrown. Please delete this folder or use--force
option.
您可以通过添加默认值来覆盖默认的启动命令 :
docker run -p 8080:8080 -v `pwd`/my_project:/label-studio/my_project --name label-studio heartexlabs/label-studio:latest label-studio start my_project --init --force --template text_classification
通过Dockerfile build一个本地的镜像:
docker build -t heartexlabs/label-studio:latest .
You can also start serving at http://localhost:8080
using docker-compose.
First time to run the app
INIT_COMMAND='--init' docker-compose up -d
Run the app with existing project data
docker-compose up -d
Run the app reseting project data
INIT_COMMAND='--init --force' docker-compose up -d
Or you can just use .env file instead of INIT_COMMAND='...' adding this line:
INIT_COMMAND=--init --force
您现在可以一键式部署这些云中的任何一个 :
- 简单: 用最少的UI设计制作。 简单的设计就是最好的设计 .
- 可配置: 使用高级jsx tags配置,您可以完全自定义数据的可视界面。 感觉就像为您的特定需求构建了自定义label工具。 而且这是快速的。
- 协作标注: 由两个或更多人label同一任务,然后比较结果。
- 多种数据类型: 您定义自己的具有不同的label类型, Images, Audios, Texts, HTMLs, Pairwise
- 支持导入格式: JSON, CSV, TSV, RAR and ZIP archives
- 移动设备友好: 适用于不同尺寸的设备。
- NPM嵌入: 前端是NPM包, NPM package. 您可以将其包含在您的项目中 .
- 机器学习: 机器学习的集成支持。 可视化并比较来自不同模型的预测。 使用最好的进行pre-labeling。
- Stylable: 配置视觉外观以匹配您的公司品牌,将label任务作为产品的一部分进行分发。
- Amazon S3 and Google GCS: Read more 有关Cloud Storages支持和版本0.7.0的信息。
数据标注支持的案例列表。 请贡献自己的配置,并随时扩展基本类型以支持更多方案。 请注意,这不是一个详尽的清单,只有主要方案。
Task | Description |
---|---|
Image | |
Classification | 图片分类 |
目标检测 | 使用边界框或多边形检测图像中的对象 |
Semantic Segmentation | 语义分隔,为每个像素检测其所属的对象类别 |
Pose Estimation | 姿势检测,标记人的关节位置 |
Text | |
Classification | 文本分类 |
Summarization | 创建一个代表原始内容中最相关信息的摘要 |
HTML Tagging | 标注诸如简历,研究,法律文件和转换为HTML的Excel工作表之类的内容 |
Audio | |
Classification | 音频分类 |
Speaker Diarisation | 根据说话人身份将输入音频流划分为同质段 |
Emotion Recognition | 标记并识别音频中的情感 |
Transcription | 用文字写下口头交流 |
Video | |
Classification | 视频分类 |
Comparison | |
Pairwise | 成对比较实体以判断哪个实体是首选 |
Ranking | 根据某些属性对列表中的项目进行排序 |
Time Series | |
Classification | |
Segmentation |
您可以轻松地将自己喜欢的机器学习框架与Label Studio机器学习SDK连接起来。 只需两个简单的步即可完成:
您可以使用:
- Pre-labeling: 使用模型预测进行pre-labeling(例如,使用实时模型预测创建粗略的图像分割,以进行进一步的手动优化)
- Autolabeling: 创建自动标注
- Online Learning: 进行标注的同时更新(重新训练)模型
- Active Learning: 在主动学习模式下执行label-仅选择最复杂的样本
- Prediction Service: 即时创建运行中的production-ready预测服务
- 你可以使用 Label Studio Frontend 独立的 React library, read more here.
- Label Studio后端(此仓库)可以通过Flask Blueprints集成到您的应用中 . See example of integration here.
Label Studio for Teams是我们的企业版(云和本地),其中包括数据管理器,高质量的基线模型,主动学习,协作者支持等。 请访问website了解更多信息。
Project | Description |
---|---|
label-studio | Server part, distributed as a pip package |
label-studio-frontend | 用JavaScript和React编写的前端部分可以嵌入到您的应用程序中 |
label-studio-converter | 将label编码为您喜欢的机器学习库的格式 |
label-studio-transformers | 连接并配置为与Label Studio一起使用的Huggface transformers库 |
@misc{Label Studio,
title={{Label Studio}: Data labeling software},
url={https://github.com/heartexlabs/label-studio},
note={Open source software available from https://github.com/heartexlabs/label-studio},
author={
Maxim Tkachenko and
Mikhail Malyuk and
Nikita Shevchenko and
Andrey Holmanyuk and
Nikolai Liubimov},
year={2020},
}
This software is licensed under the Apache 2.0 LICENSE © Heartex. 2020