2024年10月2日 星期三

Sonnet 3.5 vs. DeepNAVI

 2023年這篇DeepNAVI 論文做的時候還沒有 LLM,事實上用什麼方法做內文有寫。


因為論文是2023 年出刊,表示2022就投稿了,也就是說研究很有可能是 2020-2022 之間做的(假設是碩士論文)


ChatGPT 是2022/11/30 發布的,在這之前的AI技術很容易被LLM 超越,因為ChatGPT 與Claude 的算力太巨大了,一個學術單位擁有的算力根本小巫見大巫


當然學者會宣稱他們的模型有最佳化啦,考慮多種細微的層面…


然而最近的研究發現,只有模型夠大,參數夠多,大數據夠大,就算最簡單的三層結構也可以很強大(因此不需「深」度學習),重點在於「多」「大」,深不是重點。


我有一門課是白天給研究生的,這一年多來,發現只要是超過一年前的AI 論文,幾乎都已經過了賞味期,方法舊結果也不夠好(雖然發表時可能是當時最好的),然後很快被ChapGPT 或 Claude 「輕鬆」超車







沒有留言:

張貼留言