2025年1月16日 星期四

Illustrating AI Vision

YOLOv9 & LLaVA Architecture YOLOv9 Input Image Backbone Detection Object Detection Confidence: 95% LLaVA Vision Encoder LLM Natural Language Output "I see a white cat sitting on a windowsill..." Legend YOLO Components LLaVA Components

沒有留言:

張貼留言