标签库

人工智能全家桶

人工智能(AI)是当前科技领域最前沿、最具变革性的技术之一。它涵盖了机器学习、深度学习、自然语言处理、计算机视觉等多个子领域,为各行各业注入了新的活力和机遇。本集合收录人工智能的一些核心内容和应用场景,帮助你更好地理解这个快速发展的领域。

相关标签

查看该标签库下的内容标签。

MidjourneyMidjourney

Midjourney 是一个由 Midjourney 研究实验室开发的人工智能程序,可根据文本生成图像,目前架设在 Discord 频道上。于 2022 年 7 月 12 日进入公开测试阶段,使用者可通过 Discord 的机器人指令进行操作,可以创作出很多的图像作品。

ChatGPTChatGPT

ChatGPT 是一个免费使用的人工智能系统。使用它进行对话、获得见解、自动化任务并见证 AI 的未来,所有这一切都可以在一处实现。

4 个问答
TensorflowTensorflow

TensorFlow 是一个专为深度学习而设计的开源库和 API,由 Google 编写和维护。将此标签与特定于语言的标签([python]、[c++]、[javascript]、[r] 等)结合使用,以解决有关使用 API 解决机器学习问题的问题。TensorFlow API 可以使用的编程语言各不相同,因此您必须指定编程语言。

108 个问答37 道面试题
Opencv.jsOpencv.js

OpenCV.js 是 OpenCV(Open Source Computer Vision Library)库的 JavaScript 版本,它是一个面向实时计算机视觉任务的开源库。原始的 OpenCV 是用 C++ 编写的,它支持多种操作系统并且提供了 Python、Java 和其他语言的接口。OpenCV.js 则通过 Emscripten 编译器将 OpenCV 的 C++ 代码编译为 JavaScript,使得开发者能够在Web浏览器端利用 OpenCV 的强大功能进行图像处理和计算机视觉任务。

52 个问答14 道面试题
NLPNLP

自然语言处理 (NLP) 是一种机器学习技术,使计算机能够解读、处理和理解人类语言。如今,组织具有来自各种通信渠道(例如电子邮件、短信、社交媒体新闻源、视频、音频)的大量语音和文本数据。他们使用 NLP 软件自动处理这些数据,分析消息中的意图或情绪,并实时响应人际沟通。

56 个问答13 道面试题
LLMLLM

大型语言模型(LLM)是基于大量数据进行预训练的超大型深度学习模型。底层转换器是一组神经网络,这些神经网络由具有自注意力功能的编码器和解码器组成。编码器和解码器从一系列文本中提取含义,并理解其中的单词和短语之间的关系。

1 篇内容1 章教程9 个问答13 道面试题
AIAI

人工智能(AI,Artificial Intelligence)是计算机科学的一个分支,它涉及创建能够执行通常需要人类智能的任务的机器和软件系统。这包括但不限于学习、推理、问题解决、知识理解、语言理解和视觉感知。

1 篇内容4 个问答
机器学习机器学习

机器学习(Machine Learning, ML)是人工智能(AI)的一个子领域,它使计算机系统能够通过经验自动改进性能。机器学习侧重于开发算法,这些算法可以从数据中学习和做出预测或决策,而无需针对每种情况进行明确的编程。

27 个问答
LangChainLangChain

LangChain 是一个开源框架,用于构建基于大型语言模型(LLM)的应用程序。LLM 是基于大量数据预先训练的大型深度学习模型,可以生成对用户查询的响应,例如回答问题或根据基于文本的提示创建图像。LangChain 提供各种工具和抽象,以提高模型生成的信息的定制性、准确性和相关性。

1 篇内容
强化学习强化学习

强化学习(Reinforcement Learning, RL)是机器学习的一个子领域,它涉及让智能体(Agent)在环境(Environment)中通过试错的方式学习行为策略,以最大化一定期间内的总奖励。智能体根据与环境的交互获得奖励(或惩罚),并利用这些反馈信息来调整其行为策略。

深度学习深度学习

深度学习(Deep Learning)是机器学习(Machine Learning)的一个子集,它主要依赖于使用称为人工神经网络的算法结构,尤其是深层神经网络。深度学习模型通过模仿人脑的结构和功能来处理数据和创建模式用于决策制定。

OllamaOllama

Ollama是一个开源项目,它是一个强大且用户友好的平台,用于在本地机器上运行llm。它在LLM技术的复杂性和对可访问和可定制的人工智能体验的渴望之间架起了一座桥梁。

1 篇内容11 道面试题
QdrantQdrant

Qdrant是一个基于向量检索的开源搜索引擎,旨在帮助开发者高效地处理大规模的结构化和非结构化数据。Qdrant提供了一组易于使用和高度可定制的API,可以支持实时检索、相似度搜索、范围查询、聚合分析等各种场景。Qdrant的核心算法基于向量空间模型和倒排索引,可以在高维度的向量空间中进行快速的相似度搜索和聚合分析。Qdrant还具有负载均衡、故障转移、数据分片等功能,可以轻松地处理大量的并发访问和复杂的场景。Qdrant的易用性、高性能和可扩展性,使其成为一个备受欢迎的向量检索引擎,并被许多企业和开发者使用。

AI AgentAI Agent

AI Agent(AI代理,或称AI代理人) 是一种具备自主理解任务、规划步骤、灵活运用多种工具执行任务并完成目标,同时拥有记忆能力的智能应用。 简而言之,它就像一位能够“自己思考、自己行动”的数字助手。 - 它不仅仅是对指令做出单一反应, - 更是基于“目标”来判断下一步该做什么, - 并且在执行过程中能够灵活调整策略、选择合适的工具、优化执行流程。 这种能力使得AI代理能够更智能、更高效地完成复杂任务,体现出类似人类的自主决策和适应能力。

13 篇内容2 章教程
TransformerTransformer

Transformer 模型 是由 Vaswani 等人在 2017 年提出的一种深度学习架构,广泛应用于自然语言处理(NLP)领域,尤其是大型语言模型(LLM)的核心基础。它的关键创新是基于自注意力机制(Self-Attention),能够捕捉序列中任意位置之间的依赖关系,突破了传统循环神经网络(RNN)在处理长距离信息时的局限。 Transformer 由编码器和解码器堆叠组成,主要模块包括输入嵌入、位置编码、多头自注意力、前馈神经网络,以及残差连接和层归一化。多头自注意力机制使模型能够从多个角度理解上下文信息,提升语言理解和生成的能力。 相比传统模型,Transformer 支持并行计算,大幅提高训练和推理效率。大型语言模型如 GPT、BERT 等,都是基于 Transformer 架构,通过堆叠大量层来学习海量文本数据,实现强大的语言理解和生成能力。 简而言之,Transformer 是现代 NLP 和 LLM 的基石,凭借其高效的注意力机制和灵活的结构,推动了人工智能在语言处理领域的飞速发展。

OpenClawOpenClaw

OpenClaw 是一个开源、跨平台的个人 AI 助手,支持 macOS、Windows 和 Linux,能够集成到 WhatsApp、Telegram、Slack 等主流聊天工具,通过自然语言与用户交互,自动化处理邮箱、日历、文件、网页抓取、系统命令等任务,并且具备持久记忆、插件扩展、权限控制等功能,用户可以在本地或私有环境部署,保障数据隐私与安全,同时支持自定义开发插件和技能,适合个人、团队和家庭使用,实现真正“能帮你做事”的智能助手体验,极大提升日常与工作效率,兼具可控性、可扩展性与高度自定义能力。

DifyDify

Dify 是一个开源的 AI 应用开发平台,支持多种大语言模型(如 OpenAI、Azure、Claude、本地 LLM),为开发者和企业提供一站式的低代码工具和可视化界面,方便快速构建、部署、管理和集成智能问答、知识库、对话机器人、自动化流程等 AI 应用,具备多轮对话、插件扩展、数据安全与权限管理、API 接口、团队协作等功能,支持私有化部署和云端托管,适用于个人、企业和团队,极大降低 AI 应用开发门槛,提升生产效率与创新能力,是打造智能化业务流程和客户服务的理想平台。

19 道面试题
RAGRAG

RAG(Retrieval-Augmented Generation,检索增强生成)是一种将外部知识检索与大语言模型生成能力结合的 AI 应用架构,常用于知识库问答、企业搜索、文档助手和可信内容生成。

2 篇内容
EmbeddingEmbedding

Embedding 是将文本、图片、音频等数据映射为向量表示的技术,是语义搜索、相似度匹配、推荐系统、RAG 和向量数据库的基础能力。

2 篇内容
Vector DatabaseVector Database

Vector Database(向量数据库)用于存储、索引和检索高维向量数据,广泛应用于语义搜索、RAG、推荐系统、多模态检索和 AI 知识库。

2 篇内容
Prompt EngineeringPrompt Engineering

Prompt Engineering(提示词工程)关注如何设计、优化和评估输入提示,以提升大语言模型在问答、生成、推理、工具调用和 Agent 工作流中的表现。

AI EvaluationAI Evaluation

AI Evaluation(AI 评测)用于衡量大模型、RAG、Agent 和生成式应用的准确性、鲁棒性、安全性、用户体验和业务效果,是 AI 应用上线与迭代的重要环节。

2 篇内容
LangGraphLangGraph

LangGraph 是 LangChain 生态中的 Agent 工作流编排框架,适合构建有状态、多步骤、可控的 LLM 应用、单 Agent、多 Agent 和复杂自动化流程。

2 篇内容
CrewAICrewAI

CrewAI 是一个用于构建多 Agent 协作系统的框架,支持为不同智能体分配角色、目标和工具,适合任务分解、自动化协作和复杂工作流。

1 篇内容
LlamaIndexLlamaIndex

LlamaIndex 是面向 LLM 应用的数据框架,帮助开发者连接文档、数据库、API 和知识源,构建 RAG、知识库问答、Agent 和上下文增强应用。

vLLMvLLM

vLLM 是高吞吐、内存高效的大语言模型推理与服务框架,常用于模型部署、OpenAI-compatible API 服务、推理加速和大规模生成式 AI 应用。

2 篇内容
Fine-tuningFine-tuning

Fine-tuning(微调)是基于预训练模型在特定数据集或任务上继续训练的方法,用于提升模型在垂直领域、风格控制、指令遵循和业务场景中的表现。

Multimodal AIMultimodal AI

Multimodal AI(多模态 AI)关注文本、图像、音频、视频等多种模态的理解、生成和交互,是视觉问答、图像生成、语音助手和视频生成的重要方向。

Hugging FaceHugging Face

Hugging Face 是 AI 模型、数据集、Transformers、推理服务和开源机器学习生态平台,广泛用于模型下载、微调、部署和 AI 应用开发。

CodexCodex

Codex 是 OpenAI 面向编程任务的 AI 编码能力与产品方向,常用于代码生成、代码理解、自动化修改、命令行编程助手和软件工程 Agent。

3 篇内容1 章教程
ClaudeClaude

Claude 是 Anthropic 推出的 AI 助手和大语言模型系列,常用于长文本理解、代码辅助、工具调用、Agent 工作流和企业级 AI 应用。

1 篇内容
CursorCursor

Cursor 是一款 AI 原生代码编辑器,面向开发者提供代码生成、代码库问答、智能重构、Agent 编程和自动化开发体验。

GeminiGemini

Gemini 是 Google 的多模态大模型与 AI 产品系列,覆盖文本、图像、代码、搜索、办公和移动端智能助手等应用场景。

DeepSeekDeepSeek

DeepSeek 是面向通用对话、代码、推理和开源模型生态的大模型系列,在中文 AI、推理模型、代码生成和低成本部署方向具有较高关注度。

PerplexityPerplexity

Perplexity 是 AI 搜索与答案引擎产品,结合大模型、搜索检索和来源引用,为用户提供面向问题的总结式答案和研究辅助体验。

NotebookLMNotebookLM

NotebookLM 是 Google 推出的 AI 笔记与研究助手,围绕用户提供的资料进行问答、摘要、知识整理和内容生成,适合学习、研究和文档分析。

ComfyUIComfyUI

ComfyUI 是 Stable Diffusion 生态中常用的节点式图像生成工作流工具,适合构建可视化、可复用、可组合的 AI 绘图和多模态生成流程。

Stable DiffusionStable Diffusion

Stable Diffusion 是开源图像生成模型生态的重要代表,广泛用于文生图、图生图、风格迁移、LoRA 微调、设计素材生成和创意工作流。

SoraSora

Sora 是 OpenAI 的视频生成模型方向,关注文本到视频、图像到视频、镜头叙事、动态场景生成和多模态内容创作。

RunwayRunway

Runway 是面向创作者的 AI 视频与多媒体生成平台,常用于视频生成、视频编辑、创意设计、短视频制作和视觉内容自动化。

ElevenLabsElevenLabs

ElevenLabs 是 AI 语音生成与语音克隆平台,覆盖文本转语音、配音、语音合成、多语言音频内容和声音智能应用。

Tool CallingTool Calling

Tool Calling(工具调用)是大语言模型与外部函数、API、数据库、文件系统和业务系统交互的关键能力,使 AI Agent 能够从回答问题扩展到执行真实任务。

2 篇内容2 章教程