乐闻世界logo乐闻世界
探索AI 空间精选标签技术文章教程中心面试宝典问题集锦热门资源工具中心
标签

AI Evaluation

AI Evaluation(AI 评测)用于衡量大模型、RAG、Agent 和生成式应用的准确性、鲁棒性、安全性、用户体验和业务效果,是 AI 应用上线与迭代的重要环节。

AI Evaluation
文章0
前端阅读 186月6日 23:15
AI Agent 实战教程 20:从 Demo 到生产系统的落地清单总结 AI Agent 从 Demo 到生产的检查清单,覆盖目标边界、工具、权限、状态、评测、日志和运营。
AI AgentAI Evaluation
AI Agent 实战教程 20:从 Demo 到生产系统的落地清单
前端阅读 116月6日 22:32
AI Agent 实战教程 17:如何评测一个 Agent 是否可靠建立 Agent 评测体系,覆盖工具调用准确率、多步任务成功率、幻觉率、权限遵守和回归测试。
AI AgentAI Evaluation
AI Agent 实战教程 17:如何评测一个 Agent 是否可靠
热门标签
更多
Git(310)C语言(274)C++(259)React(249)前端(233)JavaScript(227)Cypress(224)ORM(211)Linux(202)Vue(199)Docker(196)Rust(195)MySQL(186)TypeScript(186)Mongoose(186)Tailwind CSS(177)ElasticSearch(177)Golang(172)CSS(171)网络(167)
乐闻世界

面向开发者和技术创作者的内容社区,持续整理文章、教程、面试题、资源和 AI 实践路径。

探索技术,连接经验

工具中心

手机号检查器文本对比二维码生成器时间戳转换JSON 格式化更多工具 →

平台链接

CSDN知乎

团队

关于我们联系我们
©2025 乐闻乐语,万物原理. All Rights Reserved.粤ICP备18041475号