2026 睿抗 CAIP 大模型及智能体应用赛项样题（二）答案

一、单选题（30 分，每题 1 分）

题目 1（单选题）

大语言模型中的 Token 通常指什么？

A. 用于 API 接口调用时的身份验证密钥 (API Key)
B. 文本被切分后供模型处理的基本语义或字符单位
C. 向量数据库中用于索引的高维特征向量
D. 模型输出层产生的概率分布最大值

答案

答案：B

题目 2（单选题）

Embedding 的主要作用是：

A. 将文本、图片等高维离散信息映射为低维稠密向量
B. 通过词频-逆文档频率 (TF-IDF) 压缩语料库体积
C. 在不改变模型参数的情况下进行上下文学习 (In-context Learning)
D. 自动对齐多语言模型中的跨语料实体标签

答案

答案：A

题目 3（单选题）

注意力机制（Attention Mechanism）主要解决的问题是：

A. 解决深层神经网络中的梯度消失与梯度爆炸问题
B. 允许模型在处理当前序列时，动态计算并聚焦于上下文的不同关键部分
C. 实现模型参数的分布式异步梯度更新
D. 限制生成文本的最大 Token 长度以节省算力

答案

答案：B

题目 4（单选题）

大模型中的“参数（Parameters）“主要用于表示：

A. 经过模型训练学习到的、存储在网络权重和偏置中的知识和模式
B. 运行推理任务时用户输入的提示词与上下文总长度
C. 客户端请求 API 时配置的 Temperature、Top-P 等超参数
D. 向量数据库进行近似最近邻检索（ANN）时的距离度量指标

答案

答案：A

题目 5（单选题）

下列哪项最能体现大模型的语言生成能力？

A. 基于上下文和指令概率分布，自回归式地预测并输出后续文本
B. 利用倒排索引技术在本地大规模语料库中执行 Sematic Search
C. 使用传统的正则表达式（Regex）匹配文本中的结构化命名实体
D. 通过有监督分类器将文本分配到预定义的标签体系中

答案

答案：A

题目 6（单选题）

大模型”幻觉（Hallucination）“通常指：

A. 模型生成了语法通顺、符合逻辑但与客观事实或上下文不符的内容
B. 模型在推理过程中由于显存溢出（OOM）导致的计算中断
C. 模型在处理长文本上下文时出现的”迷失在中部（Lost in the Middle）“现象
D. 模型由于温度参数设置过高导致的输出字符完全随机化

答案

答案：A

题目 7（单选题）

判断大模型是否适合某个任务，首先应考虑：

A. 任务的容错度、所需推理逻辑的复杂度以及对实时性的要求
B. 目标模型使用的是 PyTorch 框架还是 TensorFlow 框架
C. 部署服务器支持的是 NVLink 互联还是 PCIe 插槽
D. 前端页面采用的是单页面应用（SPA）还是服务端渲染（SSR）

答案

答案：A

题目 8（单选题）

下列哪类任务更适合大模型处理？

A. 基于非结构化文档的深度摘要与多视角语义提炼
B. 工业级微秒级低延迟的伺服电机闭环反馈控制
C. 强一致性分布式事务中的关系型数据 ACID 校验
D. 基于确定性有穷自动机（DFA）的静态代码语法扫描

答案

答案：A

题目 9（单选题）

对大模型能力边界的正确理解是：

A. 大模型本质上是基于概率分布的预测器，存在逻辑盲区，需结合外部约束与验证
B. 大模型已经具备强人工智能（AGI），能够自主进行无偏差的绝对理性决策
C. 只要上下文窗口（Context Window）足够大，大模型就能解决所有计算问题
D. 模型微调（Fine-tuning）可以彻底消除幻觉，使其输出完全等同于确定性算法

答案

答案：A

题目 10（单选题）

大模型应用于医疗、法律等高风险场景时，最需要注意的是：

A. 输出内容必须结合领域知识库检索，并经过专业人工或专家系统审核校验
B. 必须采用强化学习（RLHF）替代所有的前置提示词过滤
C. 必须将模型参数量限制在 7B 以下以保证单次推理的吞吐量
D. 必须采用零样本提示（Zero-shot Prompting）以避免引入样本偏差

答案

答案：A

题目 11（单选题）

下列属于大模型典型应用的是：

A. 基于多轮对话的上下文感知智能助手与知识问答
B. 关系型数据库底层 B+树索引的动态重平衡
C. 编译器中的词法分析与中间代码（IR）优化生成
D. 局域网内物理设备 MAC 地址的冲突检测

答案

答案：A

题目 12（单选题）

使用大模型写代码时，以下哪种提示词最合理？

A. ”帮我写一个用户登录的后端接口代码“
B. ”用最优雅、最高级的方式实现一个系统身份验证逻辑“
C. ”使用 Spring Boot 3.x 框架写一个登录接口，要求支持 JWT 验签、包含密码强规则校验和异常捕获，返回标准 JSON 格式“
D. ”帮我写一段能够直接运行在生产环境的 Web 安全防护代码“

答案

答案：C

题目 13（单选题）

大模型技术体系中，通常不包括：

A. 基础大语言模型（Foundation LLM）与微调算法
B. 高性能算力集群（如 GPU 节点与高速互联网络）
C. 向量数据库与大规模高质量多模态数据集
D. 传统确定性编译器的垃圾回收（GC）机制设计

答案

答案：D

题目 14（单选题）

大模型应用系统中的”工具链“主要指：

A. 支撑大模型开发、工程化编排、评测、部署和监控的一系列框架与中间件
B. 用于服务器机房硬件安装的标准化机柜和物理布线设备
C. 浏览器开发者工具中用于捕获网络请求的 Network 面板
D. 控制操作系统级进程调度和内存虚拟化的底层内核模块

答案

答案：A

题目 15（单选题）

在大模型应用中，训练/微调数据的质量会直接影响：

A. 模型的指令对齐效果、生成内容的准确性与偏见程度
B. 推理服务器网卡的吞吐带宽与 TCP 连接建立时长
C. 物理 GPU 核心在执行矩阵乘法（GEMM）时的硬件能效比
D. 客户端与 CDN 节点之间的静态资源加载延迟

答案

答案：A

题目 16（单选题）

一个高质量提示词通常不应缺少：

A. 明确的任务目标、上下文背景、限制条件以及输出格式规范
B. 复杂的学术背景说明和大量的负样本反例
C. 强制模型使用特定的低级系统 API 指令
D. 模型内部参数（如 Attention Heads）的具体计算公式

答案

答案：A

题目 17（单选题）

”你是一名资深法律顾问，请审查以下合同风险“中的”资深法律顾问“属于提示词中的：

A. 角色设定（Persona）
B. 少样本示例（Few-shot Example）
C. 检索增强提示（RAG Augmentation）
D. 输出格式约束（Format Constraint）

答案

答案：A

题目 18（单选题）

”请按表格输出，包含问题、原因、建议三列“属于提示词中的：

A. 结构化输出格式约束（Output Constraint）
B. 上下文语义对齐（Semantic Alignment）
C. 模型参数微调指令（Fine-tuning Directive）
D. 强化学习偏好对齐（Preference Alignment）

答案

答案：A

题目 19（单选题）

当大模型生成的代码运行报错时，最合理的做法是：

A. 仅向模型发送”代码报错了，请重新生成“
B. 将报错堆栈、相关代码片段、运行环境配置及预期行为一并反馈给模型进行 Debug
C. 立即切换模型，并使用完全不同的编程语言重新提示
D. 调高 Temperature 参数后多次重复提交相同的提示词

答案

答案：B

题目 20（单选题）

对复杂任务使用分步骤提示（如思维链 CoT），主要目的是：

A. 引导模型进行显式逐步推理，提高逻辑链路的清晰度与可控性
B. 减少输入和输出的 Token 总量以降低单次请求成本
C. 强制模型不使用外部工具，仅依赖内部参数完成计算
D. 缩短模型生成首个 Token 的延迟（Time-to-First-Token）

答案

答案：A

题目 21（单选题）

使用大模型优化代码时，以下哪类要求最容易得到可控结果？

A. ”帮我彻底优化一下这段代码的架构“
B. ”重构以下方法：在不改变其功能的前提下，提取重复逻辑为私有方法，并提升变量命名的语义可读性“
C. ”用最前沿的技术重写这个类的实现“
D. ”重写这段代码，使其执行速度提升 10 倍以上“

答案

答案：B

题目 22（单选题）

智能体 Agent 与普通问答机器人的重要区别是：

A. 智能体通常具备自主的目标拆解、逻辑规划、记忆存储及外部工具调用能力
B. 智能体采用单向、无状态的单次请求-响应（Request-Response）机制
C. 智能体不依赖底层基础大模型的自然语言理解能力
D. 智能体只能在专用的封闭边缘计算设备上运行

答案

答案：A

题目 23（单选题）

智能体中的”规划（Planning）“主要指：

A. 将复杂的终极目标拆解为可执行的子任务步骤，并根据执行反馈进行自我纠错
B. 在多租户云环境中为大模型实例分配虚拟 CPU 和内存资源
C. 为向量数据库设计最高效的物理分片（Sharding）方案
D. 为前端静态资源文件设计打包构建（Build）管道流

答案

答案：A

题目 24（单选题）

智能体中的”记忆（Memory）“主要用于：

A. 维持多轮对话中的短期上下文状态，以及通过向量库检索读取长期相关信息
B. 缓存深度学习框架中用于反向传播计算的激活值（Activations）
C. 在宿主机内存中对频繁调用的 API 响应结果进行强缓存（Redis）
D. 存储基础模型在预训练阶段所使用的全部无监督语料文本

答案

答案：A

题目 25（单选题）

工具调用失败后，智能体合理的做法是：

A. 捕获异常错误信息，通过自省机制重新生成调用参数、重试或切换备选工具方案
B. 绕过工具限制，由模型直接凭借内部知识库伪造工具的返回结果
C. 立即挂起当前的推理进程，并向用户抛出未捕获的运行时异常
D. 忽略调用错误，使用上一次工具调用留存的陈旧数据继续向下生成

答案

答案：A

题目 26（单选题）

多智能体（Multi-Agent）协作中，”角色分工“的主要意义是：

A. 降低单个 Agent 的上下文复杂度和指令认知载荷，提升垂直领域任务的解决精度
B. 允许不同的 Agent 共享完全相同的系统提示词以实现冗余备份
C. 限制 Agent 之间的通信交互，防止其产生协同幻觉
D. 提高系统的整体并行度，彻底消除 API 的网络传输延迟

答案

答案：A

题目 27（单选题）

RAG（检索增强生成）的主要作用是：

A. 在不修改模型权重的前提下，通过外部知识库检索相关文档来增强提示词上下文，缓解模型幻觉
B. 通过在海量私有数据上进行有监督微调，彻底改变模型的参数权重
C. 减少 Prompt 占用的 Context Window 大小，大幅降低模型推理功耗
D. 将自然语言问题直接转换为 SQL 语句并在关系型数据库中执行事务操作

答案

答案：A

题目 28（单选题）

RAG 中”检索（Retrieval）“的作用是：

A. 基于用户 Query 向量与知识库文档块向量的余弦相似度，筛选出最相关的候选文本段
B. 扫描本地文件夹中的文本文件，并将其全部翻译为统一的英文格式
C. 在大模型的预训练权重参数矩阵中搜索匹配的实体名词
D. 对用户的输入提示词进行拼写纠错和敏感词过滤（WAF）

答案

答案：A

题目 29（单选题）

文本分段（Chunking）的主要目的是：

A. 保证检索内容的局部语义完整性，并控制输入大模型的上下文 Token 长度在合理范围内
B. 去除文本中不必要的 HTML 标记，将非结构化数据转换为半结构化数据
C. 将长文档拆分为等长的数据帧，以便在 TCP 网络连接中进行流式传输
D. 为文档生成唯一的 MD5 签名，防止数据在传输过程中被篡改

答案

答案：A

题目 30（单选题）

向量化（Embedding）在 RAG 技术中的主要作用是：

A. 将文本片段转换为高维数值向量，以便通过距离公式高效计算文本间的语义相关性
B. 将任意格式的文本压缩为定长的二进制码，提高数据库的存储效率
C. 实现多模态数据的跨媒体格式转换（如直接将文本向量转为图片像素）
D. 加密敏感数据，防止企业知识库内容在传输给公有云 LLM 时泄露

答案

答案：A

二、多选题（40 分，每题 2 分）

题目 1（多选题）

以下属于大模型基础概念的有：

A. Tokenization 与词表征
B. 余弦相似度度量（Cosine Similarity）
C. 缩放点积注意力（Scaled Dot-Product Attention）
D. 参数化知识（Parametric Knowledge）

答案

答案：ACD

题目 2（多选题）

下列属于大模型能力边界问题的有：

A. 逻辑推理中的”幻觉“（Hallucination）
B. 时效性限制（Cut-off date）与知识过时
C. 复杂多步规划中的累计误差传播（Error Propagation）
D. 无法完美处理非分布内（OOD, Out-Of-Distribution）泛化问题

答案

答案：ABCD

题目 3（多选题）

判断大模型是否适合某个业务场景，应考虑：

A. 任务的容错率与确定性要求（Determinism Requirements）
B. 系统的吞吐量与时延限制（Throughput & Latency Bounds）
C. 数据的合规性与私有化部署可行性
D. 任务的推理复杂度和上下文窗口匹配度

答案

答案：ABCD

题目 4（多选题）

大模型适合处理的典型任务包括：

A. 非结构化文本的情感倾向性分类
B. 基于长文档的抽取式与生成式摘要
C. 遵循特定 Schema 的结构化数据提取
D. 大规模高并发下的微秒级高精度数值计算

答案

答案：ABC

题目 5（多选题）

大模型不宜直接独立承担的任务包括：

A. 自动驾驶中的紧急避障决策
B. 涉及重大财产安全的金融信贷最终授信审批
C. 处方药开具与临床诊断报告的最终签署
D. 基于私有知识库的跨部门周报自动校对

答案

答案：ABC

题目 6（多选题）

Embedding 可用于：

A. 稠密检索（Dense Retrieval）中的向量召回
B. 聚类分析（Clustering）与异常检测
C. 跨模态对齐（如 CLIP 中的图文匹配）
D. 精确匹配（Exact Match）的敏感词硬过滤

答案

答案：ABC

题目 7（多选题）

注意力机制有助于模型：

A. 解决长距离依赖（Long-range Dependencies）瓶颈
B. 实现输入序列的并行化计算
C. 动态分配不同 Token 之间的关联权重
D. 彻底消除生成过程中的”幻觉“（Hallucination）现象

答案

答案：AC

题目 8（多选题）

大模型应用场景包括：

A. 智能化 RPA 中的动态决策与表单解析
B. 基于 SLM（小语言模型）的端侧离线智能交互
C. 结合联邦学习（Federated Learning）的跨域隐私数据直接训练
D. 交互式多轮对话的个性化推荐系统

答案

答案：AD

题目 9（多选题）

大模型应用系统的技术要素通常包括：

A. 向量数据库（Vector DB）与检索工程
B. 编排框架（如 LangChain/LlamaIndex）与 Prompt 管理
C. 缓存机制（如 Semantic Cache）与网关路由
D. 基础硬件算力与推理加速引擎（如 vLLM/TensorRT-LLM）

答案

答案：ABCD

题目 10（多选题）

使用大模型写代码时，一个高质量提示词通常应包含：

A. 上下文与技术栈限制（Context & Tech Stack Constraints）
B. 示例代码与期望的输入输出模式（Few-shot Examples）
C. 异常处理与边界条件规范（Edge Cases Handling）
D. 自动化测试用例或断言要求（Assertion & Test Cases）

答案

答案：ABC

题目 11（多选题）

一个完整提示词通常可以包含：

A. 角色与受众设定（Role & Audience）
B. 上下文背景与输入数据（Context & Input Data）
C. 任务目标与思维链指引（Task & CoT Guidance）
D. 风格约束与格式化 Schema（Style & Output Schema）

答案

答案：ABCD

题目 12（多选题）

提示词中的约束条件可以包括：

A. 负向提示词（Negative Prompts）与安全边界
B. 响应格式（如强制输出为符合特定 JSON Schema 的数据）
C. 资源与依赖限制（如不得引用特定版本的外部 API）
D. 推理步数与最大 Token 消耗限制

答案

答案：ABCD

题目 13（多选题）

让大模型修改已有代码时，应尽量提供哪些信息？

A. 包含依赖关系的项目上下文（如 package.json 或 requirements.txt）
B. 完整的错误堆栈信息（StackTrace）及触发场景
C. 单元测试用例及预期的代码覆盖率要求
D. 底层编译器或解释器版本的硬件架构信息

答案

答案：ABC

题目 14（多选题）

下列属于对话控制策略的有：

A. 动态追问机制（Active Elicitation）以澄清模糊意图
B. 系统级提示词锚定（System Prompt Anchoring）与状态保持
C. 反射机制（Self-Reflection）引导模型自我修正
D. 动态上下文滑窗（Sliding Context Window）与 Token 截断

答案

答案：ABCD

题目 15（多选题）

使用大模型生成代码时，应警惕哪些问题？

A. 幻觉依赖（Hallucinated Dependencies）引入的安全隐患
B. 越权访问控制缺陷（如未授权的数据泄露风险）
C. 逻辑漏洞（如边界条件处理不当导致的空指针或溢出）
D. 许可证冲突（如生成的代码违反开源协议 GPL 等）

答案

答案：ABCD

题目 16（多选题）

面向场景改写提示词时，应关注：

A. 终端用户的专业背景与交互容错预期
B. 下游消费端（如解析器）对输出格式的严格程度
C. 业务场景的时延敏感度对提示词复杂性的制约
D. 评估指标（如 BLEU, ROUGE 或 LLM-as-a-judge）的对齐

答案

答案：ABCD

题目 17（多选题）

智能体的关键组件包括：

A. 短期记忆（In-context Memory）与长期记忆（Vector/External DB）
B. 子任务分解与自省规划能力（Decomposition & Self-Reflection）
C. 外部工具发现与选择机制（Tool Discovery & Tool Use）
D. 运行时的感知与动作空间（Perception & Action Space）

答案

答案：ABCD

题目 18（多选题）

智能体中的规划能力可以用于：

A. 将复杂长链目标分解为树状决策路径（如 Tree-of-Thoughts）
B. 在遇到执行障碍时主动调整后续行动步骤（Dynamic Replanning）
C. 预测多步骤执行中的潜在依赖关系与冲突
D. 建立全局最优解的直接映射，消除执行过程中的不确定性

答案

答案：ABC

题目 19（多选题）

工具调用流程通常包括：

A. 参数 Schema 定义与大模型意图识别（Argument Extraction）
B. 安全沙箱隔离与调用权限校验
C. 接口响应数据的结构化解析与截断处理
D. 容错重试及向模型反馈错误堆栈以请求重新生成

答案

答案：ABCD

题目 20（多选题）

工具调用中的异常处理可能包括：

A. 指数退避重试（Exponential Backoff Retry）
B. 回退至降级方案（Fallback to Non-tool Generation）
C. 将错误日志作为新上下文重新输入给 LLM 进行自纠错
D. 自动忽略所有 API 超时异常并强制返回空白数据

答案

答案：ABC

三、判断题（20 分，每题 1 分）

题目 1（判断题）

在基于 Transformer 架构的大语言模型中，Token 并非直接对应于自然语言中的字或词，而是经过分词器（Tokenizer）切分后，模型能够直接接收并进行数值化映射的最小语义或表征单元。

A. 正确
B. 错误

答案

答案：A

题目 2（判断题）

文本嵌入（Embedding）技术在数学本质上是一种高维空间的连续向量映射，能够将离散的文本符号转化为能捕捉复杂语义关系的低维稠密向量。

A. 正确
B. 错误

答案

答案：A

题目 3（判断题）

自注意力机制（Self-Attention）通过动态计算输入序列中不同元素之间的关联权重，从而赋予模型在不同上下文语境中区分并聚合关键特征的能力。

A. 正确
B. 错误

答案

答案：A

题目 4（判断题）

只要大模型的参数规模足够大（如达到万亿级别），且训练数据完全来源于经过严格清洗的权威学术语料库，其生成的推导过程和最终输出就必然完全真实可靠，不存在幻觉现象。

A. 正确
B. 错误

答案

答案：B

题目 5（判断题）

大语言模型受限于其概率预测机制以及不可避免的上下文窗口限制，其应用边界受任务确定性、实时性及容错率等场景维度的深刻制约，必须进行场景适应性评估。

A. 正确
B. 错误

答案

答案：A

题目 6（判断题）

鉴于现代前沿大模型（如 GPT-4 等）在复杂逻辑推理上的优异表现，它们完全可以作为高响应要求（如毫秒级工业控闸或自动驾驶避障）中的核心实时安全控制节点。

A. 正确
B. 错误

答案

答案：B

题目 7（判断题）

在医疗诊断、司法判决等高风险应用中，由于大模型的”黑盒“不可解释性与潜在的决策偏移，其生成的任何结论在付诸实施前，必须引入”人机协同“（Human-in-the-loop）或独立的权威硬性校验机制。

A. 正确
B. 错误

答案

答案：A

题目 8（判断题）

基于 Transformer 架构的自回归大语言模型，其底层概率分布建模方式决定了其在自然语言生成、跨领域多轮问答以及形式化代码自动补全等任务上具备天然的泛化应用价值。

A. 正确
B. 错误

答案

答案：A

题目 9（判断题）

根据定标法则（Scaling Laws），在大模型应用工程中，只要基础模型的参数量突破了关键涌现阈值，其最终业务表现便不再受到检索增强（RAG）、数据质量或提示词工作流等非模型层因素的影响。

A. 正确
B. 错误

答案

答案：B

题目 10（判断题）

构建一个完整的企业级大模型应用方案，不仅依赖于算法模型本身的权重参数，更需要异构计算算力支撑、高质量特定语料供给以及涵盖 Agent 框架和全生命周期评测的工具链协同。

A. 正确
B. 错误

答案

答案：A

题目 11（判断题）

在系统级提示词（System Prompt）中为模型显式定义”Persona“（角色人格），其技术实质是通过高维潜在空间中的概率引导，使模型激活与该专业背景高度关联的隐语料表征与语气风格。

A. 正确
B. 错误

答案

答案：A

题目 12（判断题）

在利用大模型进行辅助代码生成（Code Generation）时，在输入中提供具体的输入输出边界、约束条件（如时间复杂度）和框架版本，能够显著缩窄模型搜索空间，从而提高目标代码的精确匹配度。

A. 正确
B. 错误

答案

答案：A

题目 13（判断题）

在提示词中实施严格的输出格式规约（如 JSON Schema 或特定 XML 标签封装），有助于下游程序通过解析器（Parser）进行结构化提取，进而增强端到端系统的确定性与健壮性。

A. 正确
B. 错误

答案

答案：A

题目 14（判断题）

少样本提示（Few-Shot Prompting）技术通过在上下文中提供高质量的输入-输出对示例，能够在不改变模型权重的前提下，引导模型进行上下文学习（In-Context Learning）以符合特定格式和逻辑。

A. 正确
B. 错误

答案

答案：A

题目 15（判断题）

针对多步推理或算法设计等复杂任务，在提示词中显式引导模型采用类似于思维链（Chain of Thought, CoT）的渐进式解构指令，能够显著降低模型在处理长链条因果推导时的逻辑崩溃概率。

A. 正确
B. 错误

答案

答案：A

题目 16（判断题）

只要大语言模型生成的代码在沙箱（Sandbox）或本地测试环境中能通过编译并正常运行，即可从技术上彻底排除该代码中包含内存泄漏、越权漏洞或隐蔽后门等潜在应用安全隐患的可能性。

A. 正确
B. 错误

答案

答案：B

题目 17（判断题）

在多轮交互式会话中，采用主动反馈与意图澄清机制，可以动态调整交互策略并对模型缓存的上下文状态（Context Memory）进行精细化对齐，进而抑制理解漂移。

A. 正确
B. 错误

答案

答案：A

题目 18（判断题）

在提示词中设计严密的边界约束（如否定句限制、词数软约束、语义互斥等），本质上是在推理时通过条件概率分布阻断不合规 Token 序列的生成几率。

A. 正确
B. 错误

答案

答案：A

题目 19（判断题）

典型的 AI Agent 架构在功能闭环上通常超越了传统的无状态单轮生成，它具备将高阶抽象目标拆解为执行轨迹的规划引擎（Planning），并通过函数调用（Function Calling）与外部环境交互。

A. 正确
B. 错误

答案

答案：A

题目 20（判断题）

在所有低延迟、低预算的单表事实型简单检索问答场景中，部署一套具备规划、反思（Reflection）和工具调用的多 Agent 协同系统，是实现该场景技术 ROI（投资回报率）最大化的最佳工程实践。

A. 正确
B. 错误

答案

答案：B

四、简答题（10 分，每题 5 分）

题目 1（简答题）

很多人认为”大模型很强，所以什么任务都能做“。请结合实际应用场景，说明这种看法为什么不严谨，并举出至少两个不适合完全交给大模型自动完成的任务。

答案

这种看法不严谨的原因在于大模型的能力存在明确边界，并非万能工具（如数学证明需绝对严谨性）。不适合的任务举例：

高风险决策类（如自动驾驶紧急避障）需严格的安全冗余验证
强一致性事务类（如金融信贷审批）需符合法规审计要求
专业领域精准诊断类（如医疗诊断报告签署）需结合权威医学知识库人工审核
实时性极强场景类（如工业电机闭环控制）无法满足毫秒级响应需求

这些场景对准确性/可靠性/合规性/实时性的要求远超当前模型的能力范围或风险承受阈值。

题目 2（简答题）

请结合一个”智能客服“场景，说明大模型适合处理哪些问题，不适合直接处理哪些问题。

答案

在智能客服场景中：

大模型适合处理的问题：

常见问题解答：大模型可以处理大量的常见问题，提供快速、准确的回答
简单任务执行：如查询订单状态、预约服务等，大模型可以理解用户的意图并执行相应的操作
多轮对话：大模型可以理解用户的上下文，进行多轮对话，提供更个性化的服务

不适合直接处理的问题：

复杂问题：涉及复杂逻辑或需要深入了解用户具体情况的问题
敏感信息处理：涉及用户隐私、财务等敏感信息的处理
紧急情况：需要立即响应的紧急情况，如投诉、危机处理等
需要人工判断的问题：需要人工判断和决策的问题，如退款、赔偿等