乐闻世界logo乐闻世界
ExploreAI SpaceTagsArticlesTutorialsInterview PrepQ&AResourcesTools
标签

AI Evaluation

AI Evaluation(AI 评测)用于衡量大模型、RAG、Agent 和生成式应用的准确性、鲁棒性、安全性、用户体验和业务效果,是 AI 应用上线与迭代的重要环节。

AI Evaluation
文章0
前端阅读 196月6日 23:15
AI Agent 实战教程 20:从 Demo 到生产系统的落地清单总结 AI Agent 从 Demo 到生产的检查清单,覆盖目标边界、工具、权限、状态、评测、日志和运营。
AI AgentAI Evaluation
AI Agent 实战教程 20:从 Demo 到生产系统的落地清单
前端阅读 146月6日 22:32
AI Agent 实战教程 17:如何评测一个 Agent 是否可靠建立 Agent 评测体系,覆盖工具调用准确率、多步任务成功率、幻觉率、权限遵守和回归测试。
AI AgentAI Evaluation
AI Agent 实战教程 17:如何评测一个 Agent 是否可靠
热门标签
更多
Git(310)C语言(274)C++(259)React(249)前端(233)JavaScript(227)Cypress(224)ORM(211)Linux(202)Vue(199)Docker(196)Rust(195)MySQL(186)TypeScript(186)Mongoose(186)Tailwind CSS(177)ElasticSearch(177)Golang(172)CSS(171)网络(167)
Levenx

A content community for developers and tech creators, continuously curating articles, tutorials, interview questions, resources, and AI practice paths.

Explore Tech, Connect Experience

Tools

Phone CheckerText DiffQR Code GeneratorTimestamp ConverterJSON FormatterMore Tools →

Platforms

CSDNZhihu

Team

About UsContact Us
©2025 Levenx. All Rights Reserved.粤ICP备18041475号