人工智能-Python深度学习进阶与应用技术：工程

课程解读

课程亮点

系统掌握Python深度学习与大模型核心技术，从理论到实战构建AI应用全链路能力。本课程系统讲解Python深度学习核心技术，从神经网络基础、卷积神经网络、目标检测、循环神经网络到Transformer大模型，结合大量代码实践与真实项目案例，帮助学员掌握从模型构建、训练优化到大模型私有化部署、微调与RAG知识库建设的全链路实战能力，覆盖计算机视觉、自然语言处理、多模态应用等多个前沿方向。

适用对象

本课程主要面向人工智能算法工程师、深度学习研发人员、数据科学家及高校相关专业师生，特别适合希望系统提升深度学习理论与实战能力，掌握大模型部署、微调与RAG技术的中高级开发人员。

相关事宜

2026年共举办2期课程

北京2026年5月29日~31日

上海2026年9月17日~19日

研修费用：4600元/人 (含培训、工作餐、资料、证书)

工程师高培报名热线：

微信致电均可，欢迎来询！

课程大纲

第1节 Python深度学习基础：深度学习在图像处理、文本分类中的应用场景；深度学习和神经网络基础；函数、损失函数与优化算法；反向传播算法；深度神经网络模型（BP神经网络、卷积神经网络CNN、循环神经网络RNN）；动手实践：构建简单的神经网络——使用Python和TensorFlow/PyTorch构建和训练神经网络模型，数据预处理与模型评估。

第2节卷积神经网络原理及其应用：AlexNet、VGGNet、GoogleLeNet；Inception-V3/V4；ResNet、DenseNet；使用迁移学习实现蒙古文识别；获取中间隐层的特征及可视化；隐层特征的意义和使用；迁移学习的trick（学习率、衰减、模型预训练方式）；代码和案例实践：数字图片分类，卷积核与特征提取，以图搜图，海量蒙古文识别，隐特征可视化及其应用。

第3节目标检测：视频关键帧处理；卷积的位置不变性与图像定位的关系；物体检测与定位（RCNN、Fast-RCNN、Faster-RCNN、MaskRCNN）；YOLO、SSD；UNet及其与残差网络的结合；FaceNet与特征；EfficientNet、EfficientDet；视频帧的目标定位；时空卷积网络；SlowFast；代码和案例实践：人脸检测，OCR字体定位和识别，睿客识云，气象识别，视频分类的trick，政务大厅视频监控的真实系统。

第4节循环神经网络及其应用：数据预处理与序列填充；数据集划分（训练集、验证集、测试集）；使用PyTorch和TensorFlow构建RNN模型（自定义RNN层、堆叠RNN层）；损失函数与评估指标的选择；GRU（门控循环单元）；双向RNN（Bi-RNN）；序列到序列（Seq2Seq）模型；注意力机制（Attention Mechanism）；机器翻译、语音识别等应用场景。

第5节自注意力Self-Attention和Transformer模型：编码器、解码器；自注意力机制详解；Transformer（Mask Multi-Head Attention、位置编码）；特定于任务的输入转换；无监督预训练与有监督Fine-tuning；BERT思路理解；GPT基本思想；基于Transformer模型的分类任务；数据不平衡与领域适应性；模型选择与调优；代码和案例实践：基本问答系统的代码实现，深入阅读理解的代码实现，段落相关性代码实现，高考作文神器，作文生成。

第6节本地大模型私有化部署实操：1、Deepseek-R1蒸馏版的部署实操（模型获取：通过HuggingFace官方仓库申请权限，下载deepseek-r1-7B/8B/32B/70B的safetensors格式权重；推理服务启动：关键参数trust_remote_code、max_model_len等讲解，多种启动服务方式对比；服务验证：代码调用与服务API参数设置）；2、Deepseek-R1 671B满血版的部署流程（模型获取：HuggingFace/Modelscope/github的参数下载；硬件配置说明：16张A100（700G显存）、2T硬盘空间；对标模型的比较：QwQ系列与阿里32B模型对比）；3、Llama-3-8B快速部署（量化加速：FP8特点及Deepseek量化章节解读；REST API调用：深度学习系统部署的常用方式及AI算法部署框架）。

第7节使用蒸馏大模型完成微调、数据准备过程、模型训练代码实践：1、Deepseek-R1领域数据微调（数据准备：JSONL格式，含instruction/input/output，数据源包括财报、券商研报、金融问答对等，关键处理使用SentencePiece重组专业术语tokenization；QLoRA训练配置：微调常用方法，多种LoRA方式对比；启动训练：显存优化与GPU并行）；2、探讨适合微调的业务场景（阐述项目中RAG模式和LoRA模式的选择，分析微调方案的优势与不适合微调的场景）；3、UI缺陷检测-多模态微调实践（多模态数据融合原理，基于预训练模型进行多模态微调操作，从数据标注到模型部署的完整流程，缺陷检测效果评估，大型软件项目中的UI缺陷检测）。

第8节知识库建设与自定义知识问答RAG：1、私有数据的文档生成系统全流程实操——架构设计（数据层：Wind API实时获取宏观指标+PDF解析模块；推理层：Deepseek-R1作为生成核心，Mistral-8x7B进行事实核查；评估层：Rouge-L评估内容一致性，FinBERT检测财务数据矛盾）；以部署拓扑理清整体脉络（常规分析、复杂计算、数据采集、向量数据库、路由决策、Deepseek-R1/Mistral-8x7B、合规审查、PDF输出）；2、基于知识库的问答系统实操——关键技术点（RAG增强：使用LlamaIndex构建行业知识图谱，FAISS向量库实现百万级文档秒级检索；记忆管理：缓存近轮次的对话摘要，采用CoT提示工程技术；风控拦截：关键词过滤如“保证收益”“”等违规表述，置信度阈值设定softmax概率<0.7时触发人工接管）。

主讲专家

业内

深度学习与人工智能领域具备深厚的学术积淀与行业影响力。

经验丰富

人工智能-Python深度学习进阶与应用技术：工程师高培解读