数据要素×AI数据专家(教育)

深圳思特顺打造的AI数据专家应用借助大模型自然语言通用能力、知识库、模型微调等技术,从大数据平台中快速提取、分析数据,并可以报告、报表、图表等形式直观呈现。

摘要

深圳思特顺打造的AI数据专家应用借助大模型自然语言通用能力、知识库、模型微调等技术,从大数据平台中快速提取、分析数据,并可以报告、报表、图表等形式直观呈现。处室用户通过对话方式即可获取、分析、解读大数据平台中沉淀的数据资源,激活数据要素潜能,利用数据服务自身业务,为精准化、科学化的教育治理,提供高效支持。

一、实施背景

在教育治理领域,大数据平台的建设让数据逐渐丰富,如何更便捷、更充分、更智能地使用这些数据对业务进行赋能成为了新的课题。

在此背景下,思特顺基于大语言模型LLM人工智能技术,采用大语言模型、专项训练的高质量指标大模型等,并结合Agentic-RAG、语义索引、DIN-SQL等技术框架,实现了基于自然语言对指标数据的智能查询,并通过大模型的理解与生成能力,进行数据分析与挖掘。同时,也支持基于本地文档向量库、业务数据库的精准问答能力,具备多轮对话问题补全能力与引文排序过滤策略,显著减缓了大模型的幻觉问题、提升了大模型回答的可解释性。

二、实施目标

搭建融合AI智能体、知识库、RAG技术及微调模型的AI数据处理体系,赋能数据检索与分析挖掘场景。借助自然语言交互,大幅缩短数据检索与分析沟通耗时,实现行业知识与数据融合,以可视化方式呈现关键信息。

同时降低处室业务人员技术使用门槛,提升教育治理场景中复杂的用数需要,提升用户数据分析能力。

三、建设内容

1.语料数据治理:模型的准确度依赖高质量的数据资源,在本项目中依托教育局数据中台(历史数据)、新建指标平台(动态数据),治理教育领域指标1500+(涵盖教学质量、学生发展、资源配置等维度);对结构化数据(指标数值)、半结构化数据(报表/日志)、少量非结构化数据(政策文件)数据进行治理形成高质量语料。

2.数据模型建设:涵盖数据预览、业务类型配置、字段类型配置、行级权限规则、数据模型授权、数据类型配置、数据模型管理、公共维度配置、计量单位等功能,确保数据的一致性和可用性。

3.大模型底座搭建:整个智能体系统的基石,提供了核心的技术支持和能力。提供了包括统一的模型管理及连接器、指标专项分析模型、qwen系列、deepseek等。

4.业务知识库构建:包括文档知识库、业务概念库、问答样例库,用于存储和管理专业知识和常见问题解答。

5.提供统一向量服务:提供向量检索、相似度阈值、全文检索、召回知识片段、混合检索、检索预览等服务,增强信息检索的效率和准确性。

6.支持统一会话服务:专注于用户交互和对话管理,确保智能体能够与用户进行自然流畅的沟通。

7.支持多轮对话:包括会话意图识别、多轮改写、猜你想问、指令墙、指令引用、指令搜索等功能,支持复杂的对话场景。

8.支持会话管理:涵盖会话创建、会话历史记录、结果评价、提问收藏、内容复制等,保障对话的连贯性和用户体验。

9.支持智能体场景应用搭建:教职工类、学生类、学校类、监测类(学前教育、义务教育)、高校类、决策类等AI问数分析助手。

四、实施效果

1.提升教育治理决策效率缩短数据查询时间:传统人工数据查询平均耗时30分钟以上,该平台实现秒级响应(<5秒),效率提升99%,大幅减少业务人员在数据检索上的时间成本,让其能将更多精力投入到教育业务优化中。

2.加快决策报告生成:决策支持报告生成时间从平均1天压缩至10分钟,重大会议数据准备效率提升90%,使领导层能快速获取数据支持,及时做出教育政策调整和资源调配决策,提升教育治理的及时性和灵活性。

3.降低教育管理成本,减少培训支出:非技术人员通过自然语言提问即可完成复杂数据查询,培训成本下降70%以上。无需投入大量资源对业务人员进行专业数据分析技能培训,降低了教育管理的人力成本和时间成本。

4.节省人力投入:平台的智能分析、自动生成报告等功能,减少了对专业数据工程师的依赖,降低了沟通成本和人力投入,使技术人员能专注于更复杂的技术研发和平台优化工作。

5.优化教学管理:帮助学校和教育部门更好地掌握教学动态,如教师职称分布、学生成绩变化等,为教学管理优化提供方向,提升教学质量和学生培养效果,增强社会对教育系统的满意度。

6.推动教育数字化转型沉淀教育数据价值:平台对海量教育数据进行整合、分析和挖掘,将数据转化为有价值的知识和决策依据,推动教育领域从经验驱动向数据驱动转型,提升教育治理的科学性和精准性。

完成单位:深圳思特顺科技有限公司

完成人:范寿明

THEEND

最新评论

更多
暂无评论