健康照護科技專題

with Claude

2025年1月16日 星期四

Illustrating AI Vision

YOLOv9 & LLaVA Architecture YOLOv9 Input Image Backbone Detection Object Detection Confidence: 95% LLaVA Vision Encoder LLM Natural Language Output "I see a white cat sitting on a windowsill..." Legend YOLO Components LLaVA Components
Yao Jen 於 晚上8:27 沒有留言:
分享

2025年1月5日 星期日

AI needs spatial intelligence 3: Detect obstacles

 


use template





one obstacle at a time




Add distance marker for each obstacle





Add height clearance




Hazard Alert
Yao Jen 於 凌晨2:17 沒有留言:
分享

2025年1月4日 星期六

Perspectives in vision-enabled LLM

 train photo

新幹線



top-down




aesthetic




Forward-facing




passengers on train



passengers on platform





Yao Jen 於 凌晨1:45 沒有留言:
分享

2025年1月3日 星期五

Waypoint highlight, Speech, Accessibility


Navigate for people with low vision



Visual Scene Display (VSD) ref only, nav not




forward-facing, not top-down



waypoint highlight




speed 1/5*



web speech









accessible


Yao Jen 於 下午6:26 沒有留言:
分享

Navigation with speech

 

navigate

Yao Jen 於 凌晨1:49 沒有留言:
分享
‹
›
首頁
查看網路版
技術提供:Blogger.