大型語言模型

出自維基百科，自由嘅百科全書

大型語言模型（粵拼：daai6 jing4 jyu5 jin4 mou4 jing4），英文簡稱 LLM，係教 AI 處理語言嗰時會用到嘅一個概念，屬於運算模型嘅一類，做法涉及讀取極大量用目標語言寫成嘅文字（文字要貼近口語），學習隻語言內部嘅統計關係。事實表明，LLM 可以達致貼近人類嘅語言處理能力。

睇埋

語言資源

文獻

Semnani, S. J., Yao, V. Z., Zhang, H. C., & Lam, M. S. (2023). WikiChat: Stopping the hallucination of large language model chatbots by few-shot grounding on Wikipedia (PDF). arXiv preprint arXiv:2305.14292，講到點樣用維基百科嚟改良 LLM，令到 LLM 有問題唔識答嗰陣唔會老作答案。

自然語言處理（NLP）

教 AI 處理自然語言嘅技術

語言數據

語言資源
語料庫（口語語料庫 · Treebank · PropBank（英文：PropBank））
詞庫資源
機械可讀字典
受控詞表
索引典

字句層次

文字分割	字切割句子切割記號化詞法分析淺度解析同分析樹
N-gram（2-gram · 3-gram）詞形還原字幹提取命名實體識別合成詞處理語言辨認停用詞詞性標注字袋模型搭配詞抽取 Regex 解析 Tf-idf Truecasing

語義層次

詞義消歧同詞義歸納語義角色標籤指代解決情感分析自然語言理解本體學習自動總結（句子提取 · 文字簡化 · 多文件總結）主題模型（文檔分類）概念探勘文本蘊涵
分佈語義	語義距離文件詞彙矩陣外顯同潛在語義分析字嵌入 Word2vec

第啲應用

相關技術

相關領域

呢篇同AI相關嘅文係楔位文。歡迎幫維基百科擴寫佢。

由「https://zh-yue.wikipedia.org/w/index.php?title=大型語言模型&oldid=2163675」收

屬於1隱類：

有英文嘅文章