我设计以评估为先(evaluation-first)的 AI 系统,用于研究、可核验分析与 AI-native 媒体生产。
LLM / MM-LLM 评估 多智能体工作流 计算传播 AI-native 媒体流水线 可靠性优先的测量
当前重点
Agentic Engineering (AE+X)
我把 AI 系统理解为一种必须被持续测量、审计和改进的工作流,而不只是演示效果。我的核心问题是:怎样让多智能体系统在真实研究与生产场景中交付可靠结果。
- LLM 辅助质性编码、校准与误差分析。
- 高风险 AI 场景中的 grounded generation 与证据可追溯性。
- 覆盖脚本、视觉、打包到发布的代码优先媒体流水线。
我实际在做什么
- 为人类/LLM 混合工作流搭建评估 harness、数据集与 QA 回路。
- 构建面向可复现性而非仅面向 demo 的 RAG 与工具调用 agent 系统。
- 把原型开发、文档化与负责任 AI 实践连接进教学与工作室式训练中。
代表性工作
LLM 可靠性
面向复杂质性编码的评估体系
我关注如何为 LLM 辅助编码任务建立可操作的测量协议,重点在置信度、多样性、校准与分层纠错。
Grounded AI
健康指导中的可核验证据链
我近期的工作检验 patient-facing LLM 输出中的“引用”是否真的能形成可追踪、可审计、与证据相对应的链条。
传播研究
媒体、健康与社会影响
除 AI 系统研究外,我也持续发表数字媒体、框架建构与传播效果相关工作,覆盖家庭、健康与区域媒体情境。
从哪里开始看
研究
查看项目管线、预印本、在投工作与传播研究相关的持续更新。
进入研究页 →作品
查看 AI-native 媒体项目、生产工作流和 script-to-publish 的实验。
进入作品页 →每日简报
跟踪模型更新、agent 工具链、产品发布与真正对工作流有价值的技术信号。
阅读简报 →背景
我是赵志龙(Zhilong George Zhao),研究兴趣位于传播与数字媒体领域,并聚焦于AI-native 工作流、大语言模型评估与多智能体系统的交叉。
我目前在华南理工大学新闻与传播学院担任博士后研究人员/助理研究员,并在准备传播与数字媒体方向的教职申请。