课程解读
课程亮点
系统掌握Python深度学习与大模型核心技术,从理论到实战构建AI应用全链路能力。本课程系统讲解Python深度学习核心技术,从神经网络基础、卷积神经网络、目标检测、循环神经网络到Transformer大模型,结合大量代码实践与真实项目案例,帮助学员掌握从模型构建、训练优化到大模型私有化部署、微调与RAG知识库建设的全链路实战能力,覆盖计算机视觉、自然语言处理、多模态应用等多个前沿方向。
适用对象
本课程主要面向人工智能算法工程师、深度学习研发人员、数据科学家及高校相关专业师生,特别适合希望系统提升深度学习理论与实战能力,掌握大模型部署、微调与RAG技术的中高级开发人员。
相关事宜
2026年共举办2期课程
北京2026年5月29日~31日
上海2026年9月17日~19日
研修费用:4600元/人 (含培训、工作餐、资料、证书)
工程师高培报名热线:
微信致电均可,欢迎来询!
课程大纲
第1节 Python深度学习基础:深度学习在图像处理、文本分类中的应用场景;深度学习和神经网络基础;函数、损失函数与优化算法;反向传播算法;深度神经网络模型(BP神经网络、卷积神经网络CNN、循环神经网络RNN);动手实践:构建简单的神经网络——使用Python和TensorFlow/PyTorch构建和训练神经网络模型,数据预处理与模型评估。
第2节 卷积神经网络原理及其应用:AlexNet、VGGNet、GoogleLeNet;Inception-V3/V4;ResNet、DenseNet;使用迁移学习实现蒙古文识别;获取中间隐层的特征及可视化;隐层特征的意义和使用;迁移学习的trick(学习率、衰减、模型预训练方式);代码和案例实践:数字图片分类,卷积核与特征提取,以图搜图,海量蒙古文识别,隐特征可视化及其应用。
第3节 目标检测:视频关键帧处理;卷积的位置不变性与图像定位的关系;物体检测与定位(RCNN、Fast-RCNN、Faster-RCNN、MaskRCNN);YOLO、SSD;UNet及其与残差网络的结合;FaceNet与特征;EfficientNet、EfficientDet;视频帧的目标定位;时空卷积网络;SlowFast;代码和案例实践:人脸检测,OCR字体定位和识别,睿客识云,气象识别,视频分类的trick,政务大厅视频监控的真实系统。
第4节 循环神经网络及其应用:数据预处理与序列填充;数据集划分(训练集、验证集、测试集);使用PyTorch和TensorFlow构建RNN模型(自定义RNN层、堆叠RNN层);损失函数与评估指标的选择;GRU(门控循环单元);双向RNN(Bi-RNN);序列到序列(Seq2Seq)模型;注意力机制(Attention Mechanism);机器翻译、语音识别等应用场景。
第5节 自注意力Self-Attention和Transformer模型:编码器、解码器;自注意力机制详解;Transformer(Mask Multi-Head Attention、位置编码);特定于任务的输入转换;无监督预训练与有监督Fine-tuning;BERT思路理解;GPT基本思想;基于Transformer模型的分类任务;数据不平衡与领域适应性;模型选择与调优;代码和案例实践:基本问答系统的代码实现,深入阅读理解的代码实现,段落相关性代码实现,高考作文神器,作文生成。
第6节 本地大模型私有化部署实操:1、Deepseek-R1蒸馏版的部署实操(模型获取:通过HuggingFace官方仓库申请权限,下载deepseek-r1-7B/8B/32B/70B的safetensors格式权重;推理服务启动:关键参数trust_remote_code、max_model_len等讲解,多种启动服务方式对比;服务验证:代码调用与服务API参数设置);2、Deepseek-R1 671B满血版的部署流程(模型获取:HuggingFace/Modelscope/github的参数下载;硬件配置说明:16张A100(700G显存)、2T硬盘空间;对标模型的比较:QwQ系列与阿里32B模型对比);3、Llama-3-8B快速部署(量化加速:FP8特点及Deepseek量化章节解读;REST API调用:深度学习系统部署的常用方式及AI算法部署框架)。
第7节 使用蒸馏大模型完成微调、数据准备过程、模型训练代码实践:1、Deepseek-R1领域数据微调(数据准备:JSONL格式,含instruction/input/output,数据源包括财报、券商研报、金融问答对等,关键处理使用SentencePiece重组专业术语tokenization;QLoRA训练配置:微调常用方法,多种LoRA方式对比;启动训练:显存优化与GPU并行);2、探讨适合微调的业务场景(阐述项目中RAG模式和LoRA模式的选择,分析微调方案的优势与不适合微调的场景);3、UI缺陷检测-多模态微调实践(多模态数据融合原理,基于预训练模型进行多模态微调操作,从数据标注到模型部署的完整流程,缺陷检测效果评估,大型软件项目中的UI缺陷检测)。
第8节 知识库建设与自定义知识问答RAG:1、私有数据的文档生成系统全流程实操——架构设计(数据层:Wind API实时获取宏观指标+PDF解析模块;推理层:Deepseek-R1作为生成核心,Mistral-8x7B进行事实核查;评估层:Rouge-L评估内容一致性,FinBERT检测财务数据矛盾);以部署拓扑理清整体脉络(常规分析、复杂计算、数据采集、向量数据库、路由决策、Deepseek-R1/Mistral-8x7B、合规审查、PDF输出);2、基于知识库的问答系统实操——关键技术点(RAG增强:使用LlamaIndex构建行业知识图谱,FAISS向量库实现百万级文档秒级检索;记忆管理:缓存近轮次的对话摘要,采用CoT提示工程技术;风控拦截:关键词过滤如“保证收益”“”等违规表述,置信度阈值设定softmax概率<0.7时触发人工接管)。
主讲专家
业内
深度学习与人工智能领域具备深厚的学术积淀与行业影响力。
经验丰富
完成50多个深度学习实践项目,广泛应用于多个领域,具备丰富的跨行业项目落地经验与技术培训能力。