gupta-abhay / pytorch-vit Public

Notifications You must be signed in to change notification settings
Fork 34
Star 287

An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale

arxiv.org/abs/2010.11929

287 stars 34 forks Branches Tags Activity

Notifications

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
model		model
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md

Repository files navigation

ViT

This is an attempt to implement An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale in PyTorch

Features

Current Support for:

Vanilla ViT
Hybrid ViT (with support for BiT-style resnets)

To Do:

Axial ViT
Training Script

About

An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale

arxiv.org/abs/2010.11929

transformers image-classification image-recognition vit vision-transformer hybrid-vit

Readme

MIT license

Activity

287 stars

9 watching

34 forks

Report repository

Languages

Python 100.0%

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ViT

Features

About

Languages

License

gupta-abhay/pytorch-vit

Folders and files

Latest commit

History

Repository files navigation

ViT

Features

About

Topics

Resources

License

Stars

Watchers

Forks

Languages