摘要
为深入贯彻国家“教育数字化战略行动”和“人工智能+教育”融合发展战略,广州市工贸技师学院依托其作为国家级重点技工院校和广东省高技能人才培养示范单位的坚实基础,启动“虚拟数字人应用中心建设项目”。项目聚焦AIGC(生成式人工智能)与虚拟数字人技术在职业教育场景中的深度应用,构建以AIGC虚拟数字人采集制作与教育赋能平台为核心、数字人大模型引擎一体机为算力底座、多类型交互终端为服务触点的智能化教育新生态。通过该平台,学院可实现数字人形象与声音的自助克隆、智能课件自动生成、多模态交互问答、数据大屏智能播报、AI心理辅导、就业指导等六大典型应用场景,全面赋能教学、管理与服务,打造全国技工教育数字化转型的标杆示范。
一、项目背景
当前,人工智能技术正以前所未有的速度重塑教育形态。虚拟数字人作为AI技术集成的重要载体,已从娱乐、营销领域快速向教育纵深渗透。广州市工贸技师学院作为人社部认定的“数字技能国家级高技能人才培训基地”,长期致力于人工智能教育的校企协同与实践创新,其技术成果获上级主管部门高度认可。然而,传统教学仍面临互动性不足、服务响应滞后、个性化支持有限等挑战。
为此,学院决定建设“虚拟数字人应用中心”,旨在利用AI数字人技术,破解教学可视化难、互动智能化弱、服务覆盖不全等痛点,构建覆盖“招生—教学—实训—就业—文化”全链条的智能服务体系,推动教育模式从“静态灌输”向“沉浸交互”跃升,为新时代高素质技能人才培养提供技术支撑与场景创新。
二、建设目标
本项目以“技术赋能教育、服务学生成长、引领职教创新”为核心目标,具体包括:
- 实现高保真数字人快速生成:支持5分钟视频克隆形象、5秒音频克隆声音,相似度超95%,口唇同步精度达90%以上,支持粤语等方言精准匹配;
- 构建教育专属知识体系:建立覆盖职教课程体系的知识图谱与文档库,确保数字人回答的专业性与权威性;
- 打造多场景智能服务矩阵:覆盖AI招生、心理咨询、教学助教、就业指导、文化创作、展厅联动等六大核心场景;
- 确保数据安全与本地可控:所有AI模型(包括大语言模型、ASR、TTS)均实现本地化部署,杜绝数据外泄风险;
- 支持多终端自适应输出:兼容交互大屏、全息设备、网页、小程序等多种终端,适配教室、展厅、线上等多元环境。
三、建设内容
(一)核心软件平台:AIGC虚拟数字人采集制作与教育赋能平台
本项目的核心在于构建一个功能完备、安全可控、教育垂直深度适配的软件平台,具体包括以下模块:
1.数字人克隆系统
平台支持用户自助上传视频或音频素材,一键完成数字人形象与声音的高精度克隆。
- 形象克隆:支持1080p/25fps以上视频输入,24小时内完成训练;可精准还原微表情、肢体动作(预设≥5种),支持4种基础情绪与10种复合情绪表达。
- 声音克隆:仅需5秒纯净音频即可生成高相似度TTS模型,1小时样本可实现99%口音复现,语速误差控制在±5字/分钟内。
- 通用资源库:内置30+标准2D数字人形象与30+声音素材,涵盖不同年龄、性别、职业装束及中英文、方言等语种,满足多样化教学需求。
2.多模态交互管理平台
平台提供极简操作流程,用户仅需4步(选形象、设背景、配声音、定人设)、2分钟内即可创建交互数字人。
- 多模态交互:支持语音对话、触控点击、TTS播报、大屏文字同步等多种交互方式;
- 智能唤醒与打断:支持自定义唤醒词(最多10个),识别准确率>95%,响应时间<300ms;支持语音打断,响应<200ms;
- 人设与知识库联动:单账号可创建50个人设、50个知识库,每个数字人可关联5个知识库,实现角色专业化配置。
3.知识库构建与管理
平台支持三类知识库,全面支撑教育内容供给:
- 文档知识库:支持上传PDF、PPT、Word、Excel、网页等10余种格式,自动切分、向量化存储,检索准确率≥95%;
- QA知识库:支持手动编辑、批量导入、图谱展示,便于构建结构化问答对;
- 推荐知识库:可在交互中主动推荐教学PPT、图书资料、视频链接等,增强教学引导性。
此外,平台支持调用大模型自动生成问答对,并允许人工校正,持续优化知识体系。
4.本地化大模型与语音引擎
为保障数据安全与响应效率,平台实现全栈本地化部署:
- 大语言模型:支持部署DeepSeek、文心一言、智谱等开源大模型,可自主上传教学资料进行微调,构建教育垂直领域专属模型;
- ASR语音识别:本地部署支持普通话、粤语、英语等多语种,识别准确率>95%,支持流式处理与自动标点恢复;
- TTS语音合成:支持情感化语音输出(如兴奋、严肃)、语速调节、多语言混合播报,音质接近真人。
5.应用场景预置与扩展
平台预置六大教育场景模板:
- AI招生宣传:7×24小时解答政策、专业、校园生活问题;
- AI心理咨询:集成情绪识别算法与心理学知识库,提供初步疏导;
- AI教学助教:辅助课堂互动、答疑、课件讲解;
- AI就业指导:提供简历优化、面试模拟、岗位匹配服务;
- AI文化创作:支持生成“青榄回甘”等主题宣传短片,融合数字人与3D视频;
- AI展厅联动:实现数字人与大屏数据、3D模型的实时讲解与语音控制。
6.口播视频智能制作
教师可上传讲义文档,平台自动生成数字人讲解视频:
- 支持选择人物、声音、背景(含AI绘画生成)、贴图、PPT嵌入;
- 支持多轨道编辑、字幕插入、停顿设置、多音字标注;
- 输出1080P高清MP4视频,适配9:16与16:9比例,一键用于教学或宣传。
(二)算力与硬件支撑
为支撑上述软件平台高效运行,项目同步部署以下基础设施:
- 数字人大模型引擎一体机:配备高性能多核CPU、大容量DDR5内存、多块高显存GPU,满足大模型训练与高并发推理需求;
- 虚拟数字人应用交互一体机(6台):包括普通型、端侧部署型、移动跟随型,均集成C位捕捉模块(八麦阵列+双目摄像头),支持5–8米精准拾音与人脸识别;
- 全息交互一体机(1台):支持数字人悬浮显示,集成AI灯光、窗帘、物联网控制接口,打造沉浸式交互空间;
- 虚拟数字人采集制作间设备:含专业4K 120p相机、24-70mm镜头、绿幕/白幕、隔音棉、提词器、监听耳机等,确保高质量素材采集;
- 照片打印设备:支持AI证件照生成与打印;
- 大模型显卡、机房气体灭火系统等配套设备,保障系统稳定与安全。
四、实施效果
项目建成后,将实现以下显著成效:
(一)教学服务智能化跃升
- 教师可将课件制作时间缩短80%以上,专注教学设计与创新;
- 数字人助教实现“随问随答”,解决课堂答疑延迟问题,提升学习流畅度;
- 本地知识库确保专业问答准确率,强化“理论+实训”一体化教学。
(二)学生体验全面优化
- 7×24小时智能服务覆盖入学到就业全周期;
- AI心理咨询提供无压力倾诉渠道,弥补专业人力不足;
- 就业指导数字人提供个性化简历与面试训练,提升求职竞争力。
(三)校园文化科技感增强
- “青榄回甘”等AI短片结合无框全息投影,打造特色文化名片;
- 展厅数字人可自动跟随讲解,提升参观互动性与科技感。
(四)安全可控与可持续发展
- 全系统本地化部署,确保教育数据不出校;
- 学院可自主更新知识库、微调模型,实现平台持续进化;
- 提供三年质保与快速响应机制,保障长期稳定运行。
五、结语
广州市工贸技师学院“虚拟数字人应用中心建设项目”不仅是技术设备的集成,更是教育理念与服务模式的系统性革新。通过构建以AIGC虚拟数字人采集制作与教育赋能平台为核心的智能教育新基座,项目将有力推动学院从传统教学向“数据驱动、智能交互、个性服务”的数字化教育范式转型,为全国技工院校提供可复制、可推广的“AI+职教”融合样板,助力高素质技能人才高质量培养。



完成单位:广州中长康达信息技术有限公司
完成人:方恩源、胡易、廖娇龙、李磊峰