每日简报 — 2026-01-20

今日一句话
本期为阅读记录与要点摘录;后续会选 1–2 条进一步展开。

最重要的 10 条(新闻)

  1. OpenAI 与 Cerebras 合作
    AI 前沿 | OpenAI Blog
    推理/硬件合作动向,可能影响延迟、成本与高速推理的可获得性。
  2. 差分变压器V2
    AI 前沿 | Hugging Face Blog
    面向长上下文效率改进的注意力变体,可与标准 Transformer 做对照。
  3. 对话式考试:AI 时代可扩展的评估设计
    教育 / 学习科学 / 教育技术 | arXiv
    一种面向 AI 时代的评估形式,尽量保持测评的有效性。
  4. Open Responses:你需要了解什么
    AI 前沿 | Hugging Face Blog
    多模型对照与整合的工作流范式:用多样性拓展思路,用验证收敛结论。
  5. 用大语言模型评估高等教育课程的 21 世纪能力:性能基准与推理式提示策略
    教育 / 学习科学 / 教育技术 | arXiv
    用 LLM 读课程材料评估能力覆盖,并提供基准与提示策略对照。
  6. aiPlato:用于物理作业的 AI 辅导与分步反馈系统
    教育 / 学习科学 / 教育技术 | arXiv
    物理作业辅导系统:强调分步反馈/支架,而非直接给完整答案。
  7. 拿出你的计算器:用“LLM 学生模拟”估计题目真实难度
    教育 / 学习科学 / 教育技术 | arXiv
    用“LLM 学生模拟”估计题目难度:适用于数据不足场景,但需要校准。
  8. AI 迎合:用户如何标记与回应
    CSS / AI 与社会 | arXiv
    整理用户识别/反馈“迎合型”行为的可观测信号,可用于信任与安全评估。

AI 工具 / 模型更新

-(本窗口暂无条目。)

全部列表(新闻)(8 条)
AI 前沿 · OpenAI Blog
推理/硬件合作动向,可能影响延迟、成本与高速推理的可获得性。
AI 前沿 · Hugging Face Blog
面向长上下文效率改进的注意力变体,可与标准 Transformer 做对照。
AI 前沿 · Hugging Face Blog
多模型对照与整合的工作流范式:用多样性拓展思路,用验证收敛结论。
教育 / 学习科学 / 教育技术 · arXiv
一种面向 AI 时代的评估形式,尽量保持测评的有效性。
教育 / 学习科学 / 教育技术 · arXiv
用 LLM 读课程材料评估能力覆盖,并提供基准与提示策略对照。
教育 / 学习科学 / 教育技术 · arXiv
物理作业辅导系统:强调分步反馈/支架,而非直接给完整答案。
教育 / 学习科学 / 教育技术 · arXiv
用“LLM 学生模拟”估计题目难度:适用于数据不足场景,但需要校准。
CSS / AI 与社会 · arXiv
整理用户识别/反馈“迎合型”行为的可观测信号,可用于信任与安全评估。
全部列表(AI 工具 / 模型更新)(0 条)