5月28日 09:25

GraphQL 项目开发有哪些最佳实践

GraphQL 在实际项目落地时，如果缺乏规范约束，很容易演变成「写起来爽，维护起来痛」的局面。N+1 查询、Schema 膨胀、错误处理不统一、权限漏洞——这些问题在代码量增长后会被迅速放大。以下是经过大量项目验证的关键实践，覆盖 Schema 设计、性能、安全、工程化四个维度。

Schema 设计：从源头控制复杂度

Schema-First 还是 Code-First

Schema-First 先写 GraphQL Schema 文件，再实现 Resolver。好处是前后端可以基于 Schema 文件对齐接口契约，评审时聚焦于数据模型而非实现细节。Code-First 用代码生成 Schema，适合快速迭代但可读性稍弱。对于团队协作项目，Schema-First 更利于维护一致性。

模块化 Schema 拆分

把一个大 Schema 拆成多个子模块，每个模块独立管理自己的类型、查询和变更：

graphql
# user.graphql
type User {
  id: ID!
  name: String!
  email: String!
}

extend type Query {
  user(id: ID!): User
  users(limit: Int, offset: Int): [User!]!
}

extend type Mutation {
  createUser(input: CreateUserInput!): User!
}

关键点：用 extend type 扩展 Query 和 Mutation，避免所有定义堆积在一个文件里。最终通过工具（如 @graphql-tools/schema 的 mergeTypeDefs）合并成完整 Schema。

命名约定

类型名用 PascalCase：User、CreateUserInput
字段名用 camelCase：firstName、createdAt
Mutation 以动词开头：createUser、updatePost、deleteComment
枚举值用 SCREAMING_SNAKE_CASE：ADMIN、ACTIVE
Input 类型以 Input 后缀结尾：CreateUserInput

一致性命名降低团队沟通成本，也让 Code Generator 产出的类型更规整。

字段废弃策略

不要直接删除字段，用 @deprecated 标注并提供替代方案：

graphql
type User {
  id: ID!
  name: String!
  fullName: String @deprecated(reason: "使用 name 字段替代")
}

给客户端至少一个大版本的迁移窗口，等监控显示废弃字段调用归零后再移除。

性能：解决 N+1 是第一优先级

DataLoader 批量加载

N+1 问题是 GraphQL 最常见的性能陷阱。一个查询用户的列表，每个用户的 posts 字段都会触发一次数据库查询，10 个用户就是 11 次查询。DataLoader 通过批量化和缓存机制将 11 次合并为 2 次：

typescript
import DataLoader from 'dataloader';

const userLoader = new DataLoader(async (ids: string[]) => {
  const users = await User.findByIds(ids);
  const userMap = new Map(users.map(u => [u.id, u]));
  return ids.map(id => userMap.get(id));
});

// 在 Resolver 中使用
const resolvers = {
  Post: {
    author: (post, args, { loaders }) => {
      return loaders.user.load(post.authorId);
    }
  }
};

每个请求创建新的 DataLoader 实例，避免跨请求缓存污染。

查询复杂度限制

恶意客户端可以构造深度嵌套查询，把服务器打挂。必须设置限制：

typescript
import { createComplexityLimitRule } from 'graphql-validation-complexity';

const complexityLimit = createComplexityLimitRule(1000, {
  onCost: (cost) => console.log(`Query cost: ${cost}`),
  formatErrorMessage: (cost) =>
    `Query complexity ${cost} exceeds limit of 1000`
});

const server = new ApolloServer({
  typeDefs,
  resolvers,
  validationRules: [complexityLimit]
});

同时限制查询深度（通常 7-10 层）和别名数量，防止资源耗尽攻击。

分页设计

列表查询必须分页。推荐使用游标分页（Cursor-based Pagination），比偏移量分页更稳定：

graphql
type Query {
  users(first: Int!, after: String): UserConnection!
}

type UserConnection {
  edges: [UserEdge!]!
  pageInfo: PageInfo!
  totalCount: Int!
}

type UserEdge {
  cursor: String!
  node: User!
}

type PageInfo {
  hasNextPage: Boolean!
  hasPreviousPage: Boolean!
  startCursor: String
  endCursor: String
}

游标分页在数据插入或删除后不会出现重复或遗漏，适合实时性要求高的场景。

持久化查询

生产环境建议启用 Automatic Persisted Queries（APQ），客户端发送查询哈希而非完整查询字符串，减少网络传输体积并提高缓存命中率：

typescript
import { ApolloServerPluginCacheControl } from 'apollo-server-core';

const server = new ApolloServer({
  typeDefs,
  resolvers,
  plugins: [
    ApolloServerPluginCacheControl({ defaultMaxAge: 60 })
  ]
});

安全：认证、授权与输入校验

认证放在 Context 层

在 Context 初始化阶段完成身份认证，而非每个 Resolver 重复校验：

typescript
const server = new ApolloServer({
  context: async ({ req }) => {
    const token = req.headers.authorization?.replace('Bearer ', '');
    if (!token) throw new AuthenticationError('未提供认证令牌');

    const user = await verifyToken(token);
    return { user, loaders: createLoaders() };
  }
});

授权逻辑放在业务层

不要在 Resolver 里写权限判断，委托给 Service 层：

typescript
// 不要这样做
const resolvers = {
  Mutation: {
    deletePost: (_, { id }, context) => {
      if (context.user.role !== 'ADMIN') throw new Error('无权限');
      // ...
    }
  }
};

// 应该这样做
const resolvers = {
  Mutation: {
    deletePost: (_, { id }, { user }) => {
      return postService.delete(id, user); // 授权逻辑在 Service 内
    }
  }
};

这样 Resolver 保持薄层，权限规则集中管理，方便审计和测试。

输入校验

所有客户端输入必须校验，不能只依赖 GraphQL 类型系统：

typescript
import { z } from 'zod';

const CreateUserSchema = z.object({
  name: z.string().min(2).max(50),
  email: z.string().email(),
  age: z.number().int().min(0).max(150).optional()
});

const resolvers = {
  Mutation: {
    createUser: (_, { input }) => {
      const validated = CreateUserSchema.parse(input);
      return userService.create(validated);
    }
  }
};

GraphQL 的类型系统只做结构校验，不做值域校验。用 Zod 或 Yup 补上这一层。

错误处理：统一格式，不泄露内部细节

自定义错误分类

typescript
class AppError extends Error {
  constructor(
    message: string,
    public code: string,
    public statusCode: number = 500
  ) {
    super(message);
  }
}

class ValidationError extends AppError {
  constructor(message: string, public field?: string) {
    super(message, 'VALIDATION_ERROR', 400);
  }
}

class NotFoundError extends AppError {
  constructor(resource: string, id: string) {
    super(`${resource}(${id}) 不存在`, 'NOT_FOUND', 404);
  }

class AuthError extends AppError {
  constructor(message = '认证失败') {
    super(message, 'AUTH_ERROR', 401);
  }
}

错误格式化中间件

typescript
const formatError = (err: GraphQLFormattedError) => {
  const original = err.originalError as AppError;

  if (original instanceof AppError) {
    return {
      message: original.message,
      code: original.code,
      field: original.field
    };
  }

  // 生产环境隐藏内部错误
  if (process.env.NODE_ENV === 'production') {
    return { message: '服务器内部错误', code: 'INTERNAL_ERROR' };
  }

  return { message: err.message, code: 'UNKNOWN' };
};

生产环境绝不向客户端暴露堆栈信息或数据库错误，这是基本的安全底线。

工程化：项目结构、测试与监控

Resolver 测试

测试 Resolver 不需要启动完整服务器，直接测试函数即可：

typescript
describe('User Resolvers', () => {
  it('按 ID 查询用户', async () => {
    const mockUser = { id: '1', name: '张三', email: 'zhang@test.com' };
    jest.spyOn(userService, 'findById').mockResolvedValue(mockUser);

    const result = await userResolvers.Query.user(
      null,
      { id: '1' },
      { user: { id: 'admin' }, loaders }
    );

    expect(result).toEqual(mockUser);
  });

  it('用户不存在时抛出 NotFoundError', async () => {
    jest.spyOn(userService, 'findById').mockResolvedValue(null);

    await expect(
      userResolvers.Query.user(null, { id: '999' }, context)
    ).rejects.toThrow('User(999) 不存在');
  });
});

集成测试则验证完整的查询链路：

typescript
const { query } = createTestClient(server);

it('查询用户列表', async () => {
  const { data, errors } = await query({
    query: GET_USERS,
    variables: { first: 10 }
  });

  expect(errors).toBeUndefined();
  expect(data.users.edges).toHaveLength(10);
});

监控与可观测性

在 Apollo Server 的插件钩子中记录查询耗时和错误率：

typescript
const server = new ApolloServer({
  plugins: [{
    requestDidStart: () => ({
      didResolveOperation: (ctx) => {
        ctx.requestedAt = Date.now();
      },
      willSendResponse: (ctx) => {
        const duration = Date.now() - ctx.requestedAt;
        const op = ctx.request.operationName || 'anonymous';
        metrics.record(op, duration, ctx.errors?.length > 0);
      }
    })
  }]
});

关注 P99 耗时和错误率两个核心指标，设置告警阈值。

日志规范

使用结构化日志，每条日志包含 requestId、operationName、userId 等上下文字段，方便日志平台检索和关联：

typescript
logger.info('查询完成', {
  operationName: ctx.request.operationName,
  duration: elapsed,
  userId: ctx.context.user?.id
});

面试追问

Q: GraphQL 的 N+1 问题怎么解决？ DataLoader 是标准方案。它利用事件循环的微任务队列，在同一轮事件循环中收集所有对同一资源的 load 调用，然后批量执行一次数据库查询。每个请求新建 DataLoader 实例，避免跨请求缓存污染。

Q: 怎么防止恶意查询打挂服务器？ 三层防线：查询深度限制（通常 7-10 层）、查询复杂度评分（如 graphql-validation-complexity）、服务端超时（如 5 秒）。生产环境还应启用持久化查询，只允许预注册的查询执行。

Q: GraphQL 和 REST 怎么选？ 核心判断依据是数据获取的复杂度。客户端需要从多个关联资源聚合数据的场景（如首页信息流），GraphQL 的按需获取优势明显。CRUD 为主的简单场景，REST 更直白。很多团队采用混合方案：核心聚合接口用 GraphQL，独立资源操作用 REST。

Q: Schema 如何做版本管理？ GraphQL 官方立场是不做版本号，通过 @deprecated 和新增字段实现向前兼容演进。删除字段必须经过废弃周期：先标记 @deprecated 并写明替代方案，至少一个大版本后监控调用归零再移除。

标签：GraphQL