图文多模态大模型在儿童 AI 拍学机中的应用

技术领域:图文多模态大模型

作为公司首款消费级产品的核心成员,我主导了轻量级图文多模态模型的算法研发。该模型专注于万物识别任务,可根据输入图片输出主要物体的中英文名称,识别准确率达到 90%,在该任务上超过 GPT-4o 和 Qwen2-VL 等主流模型。

“云天天书”大语言模型

技术领域:大语言模型

参与百亿级大语言模型的预训练、监督微调、价值对齐、数据处理与评测工作。自研模型曾在 C-Eval 和 CMMLU 等多个榜单取得第一,并落地于政策问答、公文写作和文档智阅等应用。

无损 LLM 推理加速:SPACE 与 BiTA

技术领域:高效大模型推理

研发了 SPACE 和 BiTA 等推理加速方法,在保证输出一致性的前提下实现 2 倍以上加速,效果优于 Medusa、LookAhead 等方法,达到业界领先水平。

12345 热线智能助手

技术领域:自然语言处理

为政府热线坐席开发智能助手,支持对话摘要、工单标题生成、命名实体识别、事项多级分类、知识库检索和语法纠错,整体提升客服效率 60% 以上。

基于深度学习的移动电话用户电池充电时间预测

技术领域:时间序列预测

基于数百万用户充电行为数据,将个性化充电时间预测建模为序列学习问题,设计深度学习模型和新的损失函数,效果优于 XGBoost 等传统方法,并已应用于华为手机。