健康照護科技專題
with Claude
2025年1月16日 星期四
Illustrating AI Vision
YOLOv9 & LLaVA Architecture
YOLOv9
Input Image
Backbone
Detection
Object Detection
Confidence: 95%
LLaVA
Vision
Encoder
LLM
Natural Language Output
"I see a white cat sitting
on a windowsill..."
Legend
YOLO Components
LLaVA Components
2025年1月5日 星期日
AI needs spatial intelligence 3: Detect obstacles
use template
one obstacle at a time
Add distance marker for each obstacle
Add height clearance
Hazard Alert
2025年1月4日 星期六
Perspectives in vision-enabled LLM
train photo
新幹線
top-down
aesthetic
Forward-facing
passengers on train
passengers on platform
2025年1月3日 星期五
Waypoint highlight, Speech, Accessibility
Navigate for people with low vision
Visual Scene Display (VSD)
ref only, nav not
forward-facing, not top-down
waypoint highlight
speed 1/5*
web speech
accessible
Navigation with speech
navigate
‹
›
首頁
查看網路版