Browsing by Subject "Text recognition, Vision Transformer (ViT), You Only Look Once (YOLO), Generative Adversarial Network (GAN), multilingual-text recognition."

Now showing items 1-1 of 1

A vision transformer model for multilingual image-based text recognition

Unknown author (2024-01-08)

Multilingual image-based text recognition is a tough problem with several practical applications. This work suggests an integrated ViT-YOLO model which integrates the strengths of the Vision Transformer (ViT) and ...

All Journals