乐闻个人主页 - 乐闻世界

乐闻

主页文章专栏面试题问题

前端2月19日 14:12

Puppeteer 在实际项目中怎么用？Puppeteer 是 Google 维护的 Node.js 浏览器自动化库，通过 Chrome DevTools Protocol 控制无头浏览器。它的实际应用远不止"跑个脚本打开网页"，在爬虫、测试、文档生成、性能监控等场景中都是生产级方案。 ## 核心应用场景一览 | 场景 | 典型用途 | 复杂度 | |------|---------|--------| | 网页爬虫 | SPA 数据采集、价格监控 | 中 | | 自动化测试 | E2E 测试、视觉回归 | 中高 | | PDF 生成 | 报表、发票批量输出 | 低 | | 性能监控 | 页面加载分析、Core Web V...

服务端2月19日 19:29

Ollama API 有哪些核心端点，怎样正确调用？Ollama 启动后默认在 `http://localhost:11434` 提供 RESTful API，所有端点均以 JSON 交互。调用前先验证服务是否就绪： ```bash curl http://localhost:11434 # 返回 "Ollama is running" 即表示正常 ``` ## 文本生成与对话 ### POST /api/generate —— 单轮文本生成向模型发送 prompt 并获取生成结果，适合一次性问答、代码补全等场景： ```bash curl http://localhost:11434/api/generate -d '{ ...

服务端2月19日 19:31

Ollama 生产环境部署有哪些关键点和最佳实践？## 核心回答 Ollama 生产环境部署的核心在于三点：**GPU 资源规划决定推理性能上限**，**反向代理与认证保障接口安全**，**监控与并发配置维持服务稳定**。实际落地中，Ollama 更适合中小规模内网场景和企业私有化 Agent 部署，若面对高并发 API 服务需求，需评估 vLLM 等专业推理框架。 ## 硬件选型与系统要求 GPU 是影响推理速度的决定性因素。生产环境推荐 NVIDIA T4 及以上，CUDA 11.0+ 驱动。Apple Silicon（M1/M2/M3/M4）凭借统一内存架构，单机也能跑 70B 参数模型。内存和存储的底线配置： - *...

服务端2月19日 19:30

如何在 Python、JavaScript 等编程语言中集成 Ollama？## Python 集成 Ollama Python 是 Ollama 生态中最成熟的集成语言，官方提供了 `ollama` 库，同时也兼容 LangChain、LlamaIndex 等主流框架。 ### 安装与基础调用 ```bash pip install ollama ``` 最简单的文本生成方式： ```python import ollama response = ollama.generate(model='llama3.1', prompt='用一句话解释什么是递归') print(response['response']) ``` `generate` 方法...

服务端2月19日 19:30

什么是 Ollama 的 Modelfile，如何创建自定义模型？## Modelfile 是什么 Modelfile 是 Ollama 用来定义和构建自定义模型的配置文件，语法设计参考了 Dockerfile——从基础模型出发，逐层叠加参数、系统提示词和模板指令，最终打包成一个可复用的模型镜像。一个最简的 Modelfile 只需要一行： ```bash FROM llama3.1 ``` 这就等于直接复制了一份 llama3.1。真正的自定义发生在你往里面添加指令之后。 ## 核心指令逐一拆解 ### FROM — 指定基础模型 FROM 是唯一必填指令，支持三种来源： ```bash # 从 Ollama 仓库拉取 FROM l...

服务端2月19日 19:32

如何在 Ollama 中实现多模型并发运行和资源管理？Ollama 支持两级并发：多模型同时加载和单模型并行处理请求。核心配置通过环境变量控制，资源管理由内存驱动，空闲模型自动卸载。 ## 两级并发机制 Ollama 的并发能力分两层： - **多模型并发加载**：系统内存充足时，多个模型可同时驻留在 RAM/VRAM 中，各自独立处理请求 - **单模型并行推理**：单个模型为多个请求分配并行 KV-cache 槽位，共享模型权重，吞吐量成倍提升两者可以组合使用：2 个模型各开 4 个并行槽位，总共可同时处理 8 个请求。 ## 核心环境变量配置三个关键变量控制并发行为： | 变量 | 作用 | 默认值 | |-----...

服务端2月19日 19:31

如何在 Ollama 中使用流式响应（streaming）来实时生成文本？Ollama 的流式响应（streaming）允许模型逐 token 返回结果，而不是等待全部生成完毕后一次性返回。这在聊天界面、代码补全等场景下几乎是必须的能力——用户能立刻看到内容逐步出现，感知延迟大幅降低。 ## 核心原理 Ollama 的流式响应基于 HTTP 长连接 + NDJSON（Newline Delimited JSON）格式。服务端每生成一个 token 就立即写一行 JSON 到响应体，客户端逐行读取并解析。关键参数是请求中的 `"stream": true`——默认情况下 REST API 的流式是开启的，但在各语言 SDK 中通常默认关闭。每行 JSON...

服务端2月19日 19:30

Ollama 支持哪些大语言模型，如何选择合适的模型？## Ollama 支持的主要模型系列截至 2026 年，Ollama 模型库已支持超过 100 个大语言模型，覆盖主流开源模型家族。以下是按厂商分类的核心模型： **Meta Llama 系列** - `llama3.1` — 8B / 70B / 405B，通用对话基线模型 - `llama3.2` — 1B / 3B，轻量级端侧模型 - `llama3.3` — 70B，Meta 当前最强开源模型，推理能力接近 Llama 3.1 405B **阿里通义千问系列** - `qwen2.5` — 7B / 14B / 32B / 72B，中文理解能力突出，128K 上下文 -...

前端2月19日 13:16

如何在 Jest 中测试 React 组件？常用的测试工具和查询方法有哪些？在 Jest 中测试 React 组件，核心思路是：渲染组件 → 查询元素 → 断言行为。React 官方推荐的测试方案是 Jest + React Testing Library（RTL），本文聚焦面试中高频考察的知识点。 ## React 组件测试的基本流程是什么？测试 React 组件通常分三步： 1. **渲染**：使用 RTL 的 `render` 方法将组件挂载到虚拟 DOM 2. **查询**：通过 `screen` 对象提供的方法定位页面元素 3. **断言**：使用 Jest 的 `expect` 验证元素状态或行为 ```javascript import ...

服务端2月19日 19:25

SSH 安全加固怎么做？生产服务器必改的 8 项配置与面试追问 SSH 安全加固是运维和后端面试中的高频考点，也是生产服务器上线前必须完成的配置。本文从实际生产场景出发，梳理 SSH 加固的核心配置项，每项给出"为什么做"和"怎么配"，并在文末附上面试常见追问。 ## 修改默认端口：降低被扫描概率 SSH 默认监听 22 端口，这是所有自动化扫描工具的首要目标。改成非标准端口后，扫描流量会大幅下降，日志噪音也明显减少。 ```bash # /etc/ssh/sshd_config Port 2222 ``` 修改端口后记得同步更新防火墙规则和 Fail2Ban 配置，否则改了端口反而把自己锁在外面。另外，改端口属于"降低攻击面"而非"增强安全...