前端2月19日 14:12
Puppeteer 在实际项目中怎么用?Puppeteer 是 Google 维护的 Node.js 浏览器自动化库,通过 Chrome DevTools Protocol 控制无头浏览器。它的实际应用远不止"跑个脚本打开网页",在爬虫、测试、文档生成、性能监控等场景中都是生产级方案。
## 核心应用场景一览
| 场景 | 典型用途 | 复杂度 |
|------|---------|--------|
| 网页爬虫 | SPA 数据采集、价格监控 | 中 |
| 自动化测试 | E2E 测试、视觉回归 | 中高 |
| PDF 生成 | 报表、发票批量输出 | 低 |
| 性能监控 | 页面加载分析、Core Web V...服务端2月19日 19:29
Ollama API 有哪些核心端点,怎样正确调用?Ollama 启动后默认在 `http://localhost:11434` 提供 RESTful API,所有端点均以 JSON 交互。调用前先验证服务是否就绪:
```bash
curl http://localhost:11434
# 返回 "Ollama is running" 即表示正常
```
## 文本生成与对话
### POST /api/generate —— 单轮文本生成
向模型发送 prompt 并获取生成结果,适合一次性问答、代码补全等场景:
```bash
curl http://localhost:11434/api/generate -d '{
...服务端2月19日 19:31
Ollama 生产环境部署有哪些关键点和最佳实践?## 核心回答
Ollama 生产环境部署的核心在于三点:**GPU 资源规划决定推理性能上限**,**反向代理与认证保障接口安全**,**监控与并发配置维持服务稳定**。实际落地中,Ollama 更适合中小规模内网场景和企业私有化 Agent 部署,若面对高并发 API 服务需求,需评估 vLLM 等专业推理框架。
## 硬件选型与系统要求
GPU 是影响推理速度的决定性因素。生产环境推荐 NVIDIA T4 及以上,CUDA 11.0+ 驱动。Apple Silicon(M1/M2/M3/M4)凭借统一内存架构,单机也能跑 70B 参数模型。
内存和存储的底线配置:
- *...服务端2月19日 19:30
如何在 Python、JavaScript 等编程语言中集成 Ollama?## Python 集成 Ollama
Python 是 Ollama 生态中最成熟的集成语言,官方提供了 `ollama` 库,同时也兼容 LangChain、LlamaIndex 等主流框架。
### 安装与基础调用
```bash
pip install ollama
```
最简单的文本生成方式:
```python
import ollama
response = ollama.generate(model='llama3.1', prompt='用一句话解释什么是递归')
print(response['response'])
```
`generate` 方法...服务端2月19日 19:30
什么是 Ollama 的 Modelfile,如何创建自定义模型?## Modelfile 是什么
Modelfile 是 Ollama 用来定义和构建自定义模型的配置文件,语法设计参考了 Dockerfile——从基础模型出发,逐层叠加参数、系统提示词和模板指令,最终打包成一个可复用的模型镜像。
一个最简的 Modelfile 只需要一行:
```bash
FROM llama3.1
```
这就等于直接复制了一份 llama3.1。真正的自定义发生在你往里面添加指令之后。
## 核心指令逐一拆解
### FROM — 指定基础模型
FROM 是唯一必填指令,支持三种来源:
```bash
# 从 Ollama 仓库拉取
FROM l...服务端2月19日 19:32
如何在 Ollama 中实现多模型并发运行和资源管理?Ollama 支持两级并发:多模型同时加载和单模型并行处理请求。核心配置通过环境变量控制,资源管理由内存驱动,空闲模型自动卸载。
## 两级并发机制
Ollama 的并发能力分两层:
- **多模型并发加载**:系统内存充足时,多个模型可同时驻留在 RAM/VRAM 中,各自独立处理请求
- **单模型并行推理**:单个模型为多个请求分配并行 KV-cache 槽位,共享模型权重,吞吐量成倍提升
两者可以组合使用:2 个模型各开 4 个并行槽位,总共可同时处理 8 个请求。
## 核心环境变量配置
三个关键变量控制并发行为:
| 变量 | 作用 | 默认值 |
|-----...服务端2月19日 19:31
如何在 Ollama 中使用流式响应(streaming)来实时生成文本?Ollama 的流式响应(streaming)允许模型逐 token 返回结果,而不是等待全部生成完毕后一次性返回。这在聊天界面、代码补全等场景下几乎是必须的能力——用户能立刻看到内容逐步出现,感知延迟大幅降低。
## 核心原理
Ollama 的流式响应基于 HTTP 长连接 + NDJSON(Newline Delimited JSON)格式。服务端每生成一个 token 就立即写一行 JSON 到响应体,客户端逐行读取并解析。关键参数是请求中的 `"stream": true`——默认情况下 REST API 的流式是开启的,但在各语言 SDK 中通常默认关闭。
每行 JSON...服务端2月19日 19:30
Ollama 支持哪些大语言模型,如何选择合适的模型?## Ollama 支持的主要模型系列
截至 2026 年,Ollama 模型库已支持超过 100 个大语言模型,覆盖主流开源模型家族。以下是按厂商分类的核心模型:
**Meta Llama 系列**
- `llama3.1` — 8B / 70B / 405B,通用对话基线模型
- `llama3.2` — 1B / 3B,轻量级端侧模型
- `llama3.3` — 70B,Meta 当前最强开源模型,推理能力接近 Llama 3.1 405B
**阿里通义千问系列**
- `qwen2.5` — 7B / 14B / 32B / 72B,中文理解能力突出,128K 上下文
-...前端2月19日 13:16
如何在 Jest 中测试 React 组件?常用的测试工具和查询方法有哪些?在 Jest 中测试 React 组件,核心思路是:渲染组件 → 查询元素 → 断言行为。React 官方推荐的测试方案是 Jest + React Testing Library(RTL),本文聚焦面试中高频考察的知识点。
## React 组件测试的基本流程是什么?
测试 React 组件通常分三步:
1. **渲染**:使用 RTL 的 `render` 方法将组件挂载到虚拟 DOM
2. **查询**:通过 `screen` 对象提供的方法定位页面元素
3. **断言**:使用 Jest 的 `expect` 验证元素状态或行为
```javascript
import ...服务端2月19日 19:25
SSH 安全加固怎么做?生产服务器必改的 8 项配置与面试追问SSH 安全加固是运维和后端面试中的高频考点,也是生产服务器上线前必须完成的配置。本文从实际生产场景出发,梳理 SSH 加固的核心配置项,每项给出"为什么做"和"怎么配",并在文末附上面试常见追问。
## 修改默认端口:降低被扫描概率
SSH 默认监听 22 端口,这是所有自动化扫描工具的首要目标。改成非标准端口后,扫描流量会大幅下降,日志噪音也明显减少。
```bash
# /etc/ssh/sshd_config
Port 2222
```
修改端口后记得同步更新防火墙规则和 Fail2Ban 配置,否则改了端口反而把自己锁在外面。另外,改端口属于"降低攻击面"而非"增强安全...