大型語言模型
閱讀設定
大型語言模型(粵拼:daai6 jing4 jyu5 jin4 mou4 jing4),英文簡稱 LLM,係教 AI 處理語言嗰時會用到嘅一個概念,屬於運算模型嘅一類,做法涉及讀取極大量用目標語言寫成嘅文字(文字要貼近口語),學習隻語言內部嘅統計關係。事實表明,LLM 可以達致貼近人類嘅語言處理能力。
睇埋
[編輯]文獻
[編輯]- Semnani, S. J., Yao, V. Z., Zhang, H. C., & Lam, M. S. (2023). WikiChat: Stopping the hallucination of large language model chatbots by few-shot grounding on Wikipedia (PDF). arXiv preprint arXiv:2305.14292,講到點樣用維基百科嚟改良 LLM,令到 LLM 有問題唔識答嗰陣唔會老作答案。
![]() |