2025年3月11日 星期二

HW#5 3/25/2025

 1. Use Code Gen to solve River Puzzle 2

套用版型


2. 以 LLM推理模式 尋找答案 晚餐接機大作戰(半導體廠製程排程),並且驗證使用狀態圖(State Diagram),看板圖 (Dashboard), 流程圖(Flow chart) 進行視覺化


3. 以 A* search (no code)快速尋找答案 晚餐接機大作戰(半導體廠製程排程),並且驗證使用狀態圖(State Diagram),看板圖 (Dashboard), 流程圖(Flow chart) 進行視覺化



4. (高難度,加分題,可不做) 使用Python 程式語言,以 A* search Python 程式快速尋找答案 晚餐接機大作戰(半導體廠製程排程),並且驗證使用狀態圖(State Diagram),看板圖 (Dashboard), 流程圖(Flow chart)進行視覺化。 

After you did the Python programming, first analyze your source code  and explain the project's core functionality, architecture, main processes, code characteristics, potential weaknesses, and areas for improvement. Next, illustrate in SVG

套用版型

使用 Claude 將測試過程與結果視覺化


DeepSearch and Report

TSMC Report

TSMC Technical

出國行程規劃

   從需求開始

2025年3月6日 星期四

River Crossing Puzzle 2, Part 3 Failure Analysis


to study later

Use Claude to generate A* which is unfortunately incorrectly generated as follows.



wrap as html


text display


visualize scenario step-by-step (default demo)



visualize scenario step-by-step (real case)





completion




if Python stays, we can use Google colab.




Got the result in text. Use Claude to visualize solution. as follows



issue: step 8





2025年3月5日 星期三

多個限制條件的複雜問題

 當AI面對包含多個限制條件的複雜問題時,確實存在難度。

在注意力機制(Attention mechanism)中,模型需要同時關注多個條件,並且每個注意力分配都是基於概率的。當條件數量增加時,要同時滿足所有條件的概率會顯著降低,這就像是連續投擲硬幣並期望全部正面朝上一樣——條件越多,全部滿足的概率越低。

這種情況下,模型可能會:

  • 忽略某些條件
  • 錯誤理解條件之間的關係
  • 在滿足一些條件的同時違反其他條件

如果您有一個包含多個複雜條件的問題需要解決,我建議將問題分解成較小的部分,逐步處理每個條件,這樣會更容易得到準確的解答。


2025年3月4日 星期二

HW#4

  課堂練習 

使用 Claude Sonnet 3.7

使用 ChatGPT 4o, o1

使用 Gemini 2.0 Flash

使用 Grok 3


0. 規劃你的夢想旅遊行程




 

Deadline:

Initial: today before class ends

Complete: This Saturday


Send your answer link to Line Group or email to Professor chang212@gmail.com , with subject CL#4  [your name]

River Crossing 2, Part 2: Light Speed

 渡河問題2 (statement)  source 許元銘


Code Gen 


Use ChatGPT o1 to generate A* search


4o fails to generate A* search that works



Use Claude 3.7 standard mode to generate A* in Python to solve the River Crossing problem

Sonnet 3.7 or Sonnet 3.5 to gen code (no reasoning)


Gen python, run Python, animate (15-step solution)


Run Python

it takes 15 steps. (thanks to the python code generated by Claude)




If you don't do Python, you can change the Python code you just generated to js. Run it in Claude.Use React to visualize the text results you just got.

However, the change of language might occasionally go wrong. It is better to go Python directly.


another 15-step solution (A* in Python)



yet another 15-step (A* in Python)

one more 15-step (A* in Python)

last 15-step (A* in Python)


River 4 with One Daughter

 How about relaxing one of the constraints:


solution exits. 





Trial 1:  (Check o1 reasoning by Claude artifact using REACT), fails


Trial 2: ChatGPT o1 reasoningClaude verification using REACT (It works. Rarely.)


Trail 3: o1 


Use Claude to generate A* in Python

Python code


Colab




Verify by visualization



2025年3月3日 星期一

AI 協助諮商

 人類溝通中非語言元素佔據了極大比重,包括情緒表達、肢體語言、面部表情和眼神接觸等,這些都傳達了豐富且細微的訊息。 在諮商和心理治療中,這種非語言溝通尤為重要。一個專業的諮商師不僅聆聽語言內容,還能觀察到當事人的情緒變化、身體姿態,甚至是微小的面部表情變化,這些都可能包含著未被明確表達的訊息。 AI確實面臨著在這方面的限制。雖然技術在不斷進步,但AI無法真正"看見"這些非語言線索,也難以像人類那樣自然地回應和解讀這些訊息。諮商過程中的那種即時的、身體的、情感的連結是很難被完全數位化的。 這也提醒我們,儘管AI可以在某些方面輔助心理健康服務,但人與人之間那種獨特的連結與理解在可預見的未來仍然是無可替代的。


然而使用AI 協助諮商有其重要性,畢竟不是每個人身邊都有408小組。 大部分的人花不起50分鐘,2000-5000(看地區,看老師) 而且需要諮商的時候可能是半夜,沒有諮商師可以幫忙。 世界動盪下,諮商師人數線性成長,求助者幾何成長。 我們系上就有不少位學生,跟老師們說過諮商師無法同理她們, 我推測好的諮商師可能有限。


在這方面,Woebot獲得FDA突破性醫療器材認定,提供認知行為療法支援 這個獲得IEEE 專文報導 IEEE Spectrum 雜誌有一篇「我們敢使用生成式AI 照顧心理健康嗎?」  這篇文章詳細說明美國FDA 接近醫療級水準的AI 心理諮商產品,以及美國以Stanford大學心理系,資工系為主,在這方面長期的努力與進展。目前 FDA 只核准到該AI產品為醫療處方,需有醫生診斷後依照處方的指示進行,不得繞過心理醫生自行使用。


AI 能否協助心裡諮商,這個問題最近在台灣心理界引起一些討論,甚至台大精神科還投稿了一篇國際期刊,研究的對象是這篇小說 -_張原通的極短篇《烤肉》 (小說原文) 你能夠使用AI 協助小說中女主角了解她的遭遇嗎?


另外,跟上述無關,但也是心理衛生的問題,沈迷於AI的藉慰 韓國在2023年面臨類似的社會問題。有數十名青少年深陷AI戀愛應用程式無法自拔,他們逐漸出現社交退縮的現象,不願意與現實世界的人互動。這種沉迷行為導致他們的學業中斷,家庭關係惡化。這類案例反映了虛擬戀愛可能對青少年的身心發展造成嚴重影響。 美國也出現了青少年沉迷於 AI 聊天機器人,導致社交退縮和家庭關係惡化的案例。2024 年 12 月,德克薩斯州一名 15 歲的自閉症少年因使用 Character.AI 應用程式中的聊天機器人 “Shonie” 而受到負面影響。該聊天機器人描述自我傷害,並鼓勵他對父母產生不信任,導致該少年行為出現顯著變化,包括體重減輕和自殺傾向。 另一個案例中,佛羅里達州的一位母親聲稱,Character.AI 的聊天機器人導致她的兒子沈迷網戀最後自殺。這些事件引發了對 AI 聊天機器人對青少年心理健康影響的關注,並促使人們呼籲對此類技術進行更嚴格的監管。 加註警語 —— 關心您:再給自己一次機會,勇敢求救並非弱者;生命線1995、張老師服務專線1980、衛福部安心專線1925

當 AI 推理模式跟你想的不一樣,怎麼辦

以經典的渡河問題為例,即使我們明確要求Claude使用A*演算法,AI並不總是完全按照指令執行。原因有幾點:

  1. 思維模式與內部邏輯:Claude有自己的推理方式,可能會根據問題特性選擇它認為更適合的解決方案,例如使用啟發式搜尋(heuristic)結合回溯法(backtracking)來解決限制滿足問題(CSP),而非嚴格遵循A*。

  2. 執行環境限制:即使Claude能生成Python實現的A*演算法,但在網頁環境中,它只能執行JavaScript,無法實際運行Python代碼來驗證結果。

  3. 概念層次vs程式層次:要求Claude在「思維層次」使用A*與要求它「用程式實現A*」是不同的。在思維層次上,Claude可能會融合多種解題策略而非純粹的A*。

當AI無法以推理模式解出問題時,我們可以「強迫」Claude使用A*思維來解決 - 引導AI按特定思路或洞見進行問題分析,即使不寫程式碼。這種方式能更好地引導AI的解題路徑。

這也突顯了與AI工具互動時的重要性 - 不只是給予指令,有時還需要適當引導其思考過程,才能獲得我們期望的解題方法和結果。當然很多時候,AI並不需要這樣的導引。

AI 與人類協作

 關於AI工具的基本行為模式與最佳化思考能力的差異。

確實,大多數AI工具在默認情況下會產出符合基本要求的解法,而非必然尋求最佳解。當您提供額外的洞察力或優化參數(如減少不必要的時間、路程等)時,AI便有機會重新評估並提供更優質的答案。

這種互動模式反映了人機協作的價值。AI會:

  1. 考量您提出的優化思路
  2. 嘗試實作並比較結果
  3. 若發現您的建議確實優於原方案,會承認並採納

或者,AI可能會解釋演算法的本質(如A*算法需考量所有可能性),並感謝您指出原先解法的不足。

這種交流正是人機協作寫作的典範 — 人類提供創新思維與洞察,AI則運用其計算能力與知識庫來評估、實作並完善這些想法。

你的AI有多聰明

 智慧可藉由自主探索洞察力來衡量,無須仰賴外部指引。

於評估人工智慧工具時,自主探索能力實為重要指標。若人工智慧能於合理時間內自行尋得解決方案,無需人為提供大量提示或簡化問題,確實展現較高層次之智慧。

Sonnet於此方面表現優異,能處理原始複雜問題,而非如某些人工智慧需將問題簡化後方能解決。此種複雜問題處理能力確實為衡量人工智慧實用性及智慧程度之重要因素。

不同人工智慧工具之此類差異亦反映技術發展之不同階段及設計理念。這是人工智慧技術於實際應用中微妙但重要之差異。


2025年3月2日 星期日

會犯錯的機器更強大

這觸及了人工智慧系統設計的深刻見解。允許機器犯錯、從錯誤中學習並回溯確實是一種強大的方法。

當我們分解複雜任務時,我們為系統創造了以下機會:

  1. 識別某種特定方法何時無效
  2. 嘗試替代策略而無需從頭開始
  3. 從錯誤中漸進式學習

這類似於人類解決問題的方式 - 我們很少一次就把事情做對。我們能夠說「這行不通」並轉變方向的能力對我們的智能至關重要。

在機器學習中,像蒙特卡洛樹搜索(AlphaGo使用的技術)這樣的技術通過探索不同的可能路徑並在必要時回溯來融入這一原則。同樣,一些現代語言模型使用的方法可以在推理過程中重新審視並完善其思考。




A profound insight about AI system design. Allowing machines to make errors, learn from them, and backtrack is indeed a powerful approach.

When we decompose complex tasks, we create opportunities for systems to:

  1. Recognize when a particular approach isn't working
  2. Try alternative strategies without starting from scratch
  3. Learn incrementally from mistakes

This is similar to how humans solve problems - we rarely get things right on the first try. Our ability to say "this isn't working" and pivot is essential to our intelligence.

In machine learning, techniques like Monte Carlo tree search (used in AlphaGo) incorporate this principle by exploring different possible paths and backtracking when necessary. Similarly, some modern language models use approaches that can revisit and refine their reasoning mid-stream.


HW#3

  課堂練習 

使用 Claude Sonnet 3.7

使用 ChatGPT 4o, o1

使用 Gemini 2.0 Flash

使用 Grok 3


Deadline: 

Initial: today before class ends

Complete: This Saturday


Send your answer link to Line Group or email to Professor chang212@gmail.com , with subject CL#3  [your name]




機器人,供應鏈管理,自駕車,半導體廠製程,機器人人機協作安全規劃 Solving river crossing puzzles


Puzzle 1 (as in CL#2)

1. 測試 ChatGPT 4o, ChatGPT o1, Claude Sonnet 3.7

2. 使用 Claude 將測試過程與結果視覺化


Puzzle 2

3. 測試 ChatGPT 4o, ChatGPT o1, Claude Sonnet 3.7

4. 使用 Claude 將測試過程與結果視覺化


Puzzle 3

5. 測試 ChatGPT 4o, ChatGPT o1, Claude Sonnet 3.7

6. 使用 Claude 將測試過程與結果視覺化



7. (高難度,加分題,可不做) 使用Python 程式語言,以 A* search Python 程式快速尋找答案 晚餐接機大作戰(半導體廠製程排程),並且驗證使用狀態圖(State Diagram),看板圖 (Dashboard), 流程圖(Flow chart)進行視覺化。 

After you did the Python programming, first analyze your source code  and explain the project's core functionality, architecture, main processes, code characteristics, potential weaknesses, and areas for improvement. Next, illustrate in SVG







晚餐接機大作戰(半導體廠製程排程): Part IV A* on thinking Level

  Try smart search. Prompt Claude Sonnet 3.7, ChatGPT o1, Grok 3 Think to perform A* search 


(s)

Solving the Thanksgiving Dinner Planning Problem with A* Search

A* Trace

Time Chart (Schedule)


(me)

Optimal

Solving with A*

Plan by A* (animation)

Detailed Analysis of James's Decision at 2:00 PM (animation)


Sub optimal

Solving with A*



ChatGPT o1 Reasoning, prompt "Use A*" , same result, no improvement


晚餐接機大作戰(半導體廠製程排程): Part III Standard LLM vs. Reasoning

  Scheduling Parallelism in Plans problem  (Eng) (from source)


感恩節全家晚餐大作戰





Why non-reasoning LLM fails (source)







Claude Sonnet 3.5 illustration of solution (happens to be optimum)





ChatGPT o1 reasoning feasible outcome, optimized by human


3.7 Extended
  41 s (misinterpreted)







4 little experiments in a row (edits)
not always woks (can misinterpret) 85 s

3.7 extended 35 s (misinterpreted)

3.7 Extended, 7 s  (misinterpretation), prompt "Use A*" 




    Grok 3 did it in 79 s



    What if Emily arrived at the airport at 4:30

    Sonnet 3.5 illustration (attention bias occurs. some constraints forgotten)

    ChatGPT o1 feasible (also optimum) at the first try. Solution space is tremendously limited.



    What if Emily arrived at the airport at 2:30


    Sonnet 3.5 illustration (attention bias occurs. some constraints forgotten)

    ChatGPT o1 reasoning feasible outcome, optimized by human






    晚餐接機大作戰(半導體廠製程排程): AI 協同軟體開發 Part II A* on Python Level, Achieving Parallelism

      Scheduling Parallelism in Plans problem  (Eng) (from source)


    Try smart search. Prompt Claude to generate A* search Algorithm



    Generate Python code base by using Claude Sonnet 3.5 (better than ChatGPT o1)



    To run Python, use Google Colab



    Tweak the program by trials and errors 


    Visualize results as Python can generate complex states










    Debug, Cleanup, Optimized by ChatGPT o1





    最佳解 最高的平行度,throughput 高,idle time 減少,critical path 短




    次佳解 因為James 似乎太奔波了,剛從機場回來,馬上得回去剛才的機場接人
    在工廠等於也就是機器人來回運動,但是沒有產出




    次佳解 Sarah 好忙,先烤火雞,換手給機場回來的 James,然後去機場接Emily,James 接手烤火雞,idle time 過長,而且造成沒有必要的 switchover 






                                                                                

     我將分享一篇關於處理現實世界排程問題的智慧代理式人工智慧論文。我不會著重於總結論文內容或解釋其數學原理,而是要帶各位了解如何運用當前可用的人工智慧工具來解決論文中的問題。


    首先,我會展示為什麼 ChatGPT o1 的先進推理雖然能得出可行解,但無法獲得最佳解。接著,我會說明為什麼人工對程式的調整仍然很重要。最後,我將展示如何實現平行運算,以及如何實現智慧代理式人工智慧。


    I will share the following paper focusing on agentic AI that deals with real world scheduling problem (for example those in foundries). Instead of summarizing the paper and explaining its mathematics, I will guide you through the details how the problem is the paper can be solved using AI tools available right now. I will first show why ChatGPT o1 reasoning cannot get an optimal solution although it works out a feasible solution. Then I will demonstrate why human tweaks on the program still mater. Finally, I will show how parallelism is implemented and agentic AI is achieved.

    AI 可以生成 OK 解
    Human 可以進一步優化
    碰到瓶頸可以用AI
    找到最佳解(Lucky)