NLP（自然语言处理）是什么？核心技术从规则到 LLM 怎么演变的？

Question

Levenx · Accepted Answer

自然语言处理（Natural Language Processing，NLP）是让计算机理解、解释和生成人类语言的技术。你用的搜索引擎、翻译软件、智能客服、ChatGPT，背后都是 NLP。NLP 解决什么问题NLP 的任务可以分两大类：理解（从文本中提取信息）和生成（产出新的文本）。理解类任务：文本分类（这封邮件是不是垃圾邮件）、命名实体识别（提取人名地名）、情感分析（这条评论是正面还是负面）、问答（从文档中找到答案）。这类任务的核心是把非结构化的文本变成结构化的信息。生成类任务：机器翻译、文本摘要、对话生成、代码生成。这类任务不仅要理解输入，还要产出流畅、连贯、准确的新文本。生成比理解难得多——理解只需要判断对错，生成要在一个天文数字的候选空间里选出最好的。NLP 技术的三个时代规则时代（1950s-1990s）：手写语法规则和词典。专家系统写几千条 if-else 规则来解析句子。准确率在小领域内还行，但覆盖面极窄——换个领域规则全废，维护成本爆炸。统计机器学习时代（1990s-2012）：从数据中自动学习规律。HMM 做词性标注，CRF 做序列标注，SVM 做分类。关键突破是特

NLP（自然语言处理）是什么？核心技术从规则到 LLM 怎么演变的？

NLP 解决什么问题

NLP 技术的三个时代

NLP 的核心 Pipeline

中文 NLP 的特殊挑战

NLP 当前最热的方向