2025年9月22日 星期一

AI 時代找文獻的方式

AI 工具很多,每個人方法也不一樣,我個人偏好利用 Claude



例如要搜尋 Wafer defect detection 近年論文,我可能提示 Wafer defect detection research in 2022-2025

或是 OOO  research in 2022-2025

搜尋結果


如果你可以使用 Claude Research 

這個搜尋會更加深入,而且會生成更加完整的文獻回顧

Claude Search搜尋結果


Claude


Claude Search




ChatGPT: 深入研究
Claude: Research
Grok: auto
Gemini 2.5 Flash: Deep Research

傳統的 IEEE xplore 也很好
不過AI 的方法比較有脈絡

另外Google scholar 可以同時搜尋不同資料庫,而且會呈現論文引用統計,無論廣度深度會比單獨 IEEE 完整


2025年9月21日 星期日

Unit 3-4 3d障礙偵測與避障演算法

knowledge graph 



Slides+


Unit 3: 3d障礙偵測演算法


障礙偵測(Recast 原理)

動態障礙偵測

Simulating A Navigation Assistant



Unit 4: 避障演算法

Voronoi an introduction 

Voronoi-based Safe Routing Planning (Country Alley  2d)



Voronoi start-up A* + Repelling (example illustrated)




Core Navigation Repalced with JEPA + A*












本單元重點在於 3D 感測、障礙物偵測以及安全路徑規劃演算法。


學習講義:3D 障礙物偵測與導航演算法

課程名稱: 健康照護科技專題
單元主題: Unit 3 & 4 – 3D 環境感知與路徑規劃


一、 Unit 3:3D 障礙物偵測演算法 (3D Obstacle Detection)

本單元探討輔具(如視障助行器)如何透過科技「看見」並分析 3D 環境中的潛在危險。

1. 核心概念:從 2D 到 3D

  • 全局障礙物分析 (Global Obstacle Analysis): 不同於傳統平面影像,3D 感測能分析物體的體積與深度。

  • 體素化 (Voxelization): 將 3D 空間切割成無數個小立方體(稱為「體素」,Voxel),以此判斷哪些空間是被佔據的,哪些是可以通行的。

  • 靜態與動態偵測:

    • 靜態偵測: 識別牆壁、家具等固定障礙物。

    • 動態偵測: 即時追蹤行人、車輛等移動目標。

2. Recast Navigation 導航流程

Recast 是一種廣泛應用於機器人與遊戲領域的導航網格生成技術,流程如下:

  1. 體素化 (Voxelization): 建立 3D 世界的實體模型。

  2. 濾波 (Filtering): 去除雜訊,並過濾掉人類/機器人無法通過的狹窄區域。

  3. 導航網格生成 (NavMesh Generation): 生成一個簡化的多邊形網格,定義出確切的「可行走區域」。

3. 聲納 (Sonar) 模擬應用

  • 利用超音波感測器模擬蝙蝠定位,將距離資訊轉化為提示音或觸覺回饋,協助使用者感知障礙物距離。


二、 Unit 4:避障與路徑規劃 (Obstacle Avoidance & Path Planning)

在偵測到障礙物後,系統必須計算出一條最安全的路徑。

1. 馮羅諾圖 (Voronoi Diagram) 的應用

  • 定義: 根據空間中障礙物點的分布,將空間劃分成多個區域。

  • 安全特性: 馮羅諾圖的「邊界線」恰好是距離周圍所有障礙物最遠的點

  • 健康照護應用: 對於輪椅使用者或視障者,沿著馮羅諾圖的邊界行走,可以確保與兩側障礙物保持「最大安全距離」,避免碰撞。

2. 路徑規劃演算法比較

  • 最短路徑演算法 (如 A 演算法):* 雖然路徑最短、速度最快,但路徑往往會「貼近」牆角或障礙物邊緣。

  • 基於馮羅諾圖的導航: 雖然路徑可能較長,但始終保持在通道的中央,安全性最高(Safest Path)。

3. 空間標記與地名 (Place Name)

  • 將 Voronoi 區域與具體地點連結(如「廚房」、「大門出口」),實現更直覺的語音引導導航。


三、 綜合工作流程總結

  1. 感知 (Sense): 透過 3D 感測器獲取原始數據。

  2. 建模 (Model): 使用 Recast 概念進行體素化並生成導航網格(Unit 3)。

  3. 規劃 (Plan): 應用 Voronoi 圖形理論,計算出一條最遠離障礙物的安全路徑(Unit 4)。

  4. 執行 (Execute): 透過語音或震動裝置,引導使用者避開危險。


四、 自我檢測與討論

  1. 為什麼在 3D 導航之前,必須先進行「體素化 (Voxelization)」?

  2. 在狹窄的室內環境中,使用「最短路徑」和「最大安全路徑 (Voronoi)」各有什麼優缺點?

  3. 聲納感測在偵測「動態障礙物」時會面臨哪些挑戰?



CL#2 Understanding environments

 建議工具

使用 Claude Sonnet 4

使用 ChatGPT 5

使用 Gemini 2.5 Pro 免費額度最高 1M tokens

使用 Grok 4



 課堂練習 

Deadline: Saturday at 23:59

Send all the share links to  me chang212@gmail.com by email with subject CL#2  [your id, your name]

How to share a Claude link

How to share a ChatGPT link

How to share a Grok link

How to share Gemini Link


至少做1題


 1. 選擇圖庫或你自己的照片,使用以下版型製作障礙物檢測


perspective




2.  選擇圖庫或你自己的照片,使用以下版型製作動態highlight障礙點,也可以自創動態顯示障礙點方式





3. 製作3d 障礙模型圖,模擬盲人行進









4. 分別製作雲與閃電的物件,再將其組合 (參考如何合成複雜物件




5. 已經製作洗手台與洗手訓練機的物件,請將其組合(參考如何合成複雜物件

洗手台場景

洗手遊體感戲機



6. 已經製作好 CVD animation 與 process schedule 物件,將兩者組合起來 (參考如何合成複雜物件


CVD


process schedule





如何合成複雜創作

 每次回應都有一個固定的 token 輸出上限,當一次要產生多個物件(比如多張投影片、多個元件、多段程式碼),每個物件能分配到的 token 預算就被稀釋了,結果就是每個都做得比較粗糙。

實務上比較好的策略是分批處理

先把整體架構規劃好,然後一次專注做一到兩個物件,讓每個都能得到充分的細節和完成度。比如做投影片的時候,與其一次叫我生 7 張,不如先做前 3 張做到位,再繼續下一批。

如果你接下來有需要產生多個物件的任務,我們可以用這個方式來確保每一個的品質。

start with A*








如何合成複雜創作 

Merge artifacts 雲與閃電的組合

 3d fractal cloud plain cloud


lightning (natural)

2025年9月14日 星期日

CL#1 AI in Computer Vision

 建議工具

使用 Claude Sonnet 4

使用 ChatGPT 5

使用 Gemini 2.5 Pro 免費額度最高 1M tokens

使用 Grok 4



 課堂練習 

Deadline: Saturday at 23:59

Send all the share links to  me chang212@gmail.com by email with subject CL#1  [your id, your name]

How to share a Claude link

How to share a ChatGPT link

How to share a Grok link

How to share Gemini Link


至少做2題


1. Coastal Defense 依據圖片生成動畫


2. 上傳一張食物照片,使用nutrition analysis 模板程式分析熱量與營養