从零开启AI之旅6天
大模型开发入门
动⼿搭建聊天机器⼈,快速⼊⻔⼤模型开发
知识点细分: 本地部署大模型(Ollama);可视化聊天机器人(ChatBox);Python核心语法;Python调用大模型API;搭建聊天机器人
仅需3.5个月即可完成从入门到就业
专科及以上学历、应届生、转行者均可,
完全零基础也无限制
聚焦低门槛、高需求岗位,无需深入
学习复杂的算法,只教企业需要的技能
阶段一大模型开发入门
动⼿搭建聊天机器⼈,快速⼊⻔⼤模型开发
知识点细分: 本地部署大模型(Ollama);可视化聊天机器人(ChatBox);Python核心语法;Python调用大模型API;搭建聊天机器人
阶段二大模型智能体平台开发
金融行业动态风向评估:基于Zero-shot零样本学习能力,通过DeepSeek/QWen/ChatGLM模型对金融领域数据进行分类、信息抽取、文本匹配,更好的解决业务问题
知识点细分:
1. 什么是Prompt Engineering
2. Prompt Engineering的原理以及实际应用的优化技巧
3. 如何利用Prompt Engineering完成实际金融业务
基于Coze搭建智能体,快速从0到1搭建工作流和应用程序
知识点细分:案例讲2练3;1. 案例:智能问答助手;2. 案例:旅游规划小精灵;3. 案例:智能助教;4. 案例:智能面试官;5. 案例:口语练习专家
基于Coze工作流,为黑马程序员AI学科学生临近毕业时面试相关的问题进行提效。结合LLM、ASR、TTS、RAG等技术,为面试中常见的效率痛点赋能,代替部分人工,缓解教师压力
知识点细分:
实现如下功能:
1.
简历修改:基于OCR插件、prompt、数据库查询,实现简历中各类常见问题的召回和修改建议。
以及进阶功能:违禁词过滤、业务背景重复率统计等。辅助学生编写更好的简历
2.
面试录音分析:基于多模态大模型实现ASR,基于prompt实现面试官、应试者角色划分,最终实现文字提取、摘要以及建议,提面试高录音分析的效率
3.
面试题生成:基于黑马面试宝典使用RAG技术结合学生的简历,结合简历上的技能点、业务背景、毕业时间、专业等信息,生成个性化的面试题题库
4.
模拟面试:基于简历和面试题生成流水线等功能,基于邢老师音色克隆面试官音色,结合ASR模型、TTS模型等技术,实现实时语音面试
项目基于Ollama私有化部署DeepSeek R1:8b模型;基于Docker结合Dify大模型应用开发平台构建可视化聊天界面
知识点细分:
1. 大模型私有化部署:Ollama、DeepSeek/QWen
2. 聊天机器人搭建:基于Dify搭建可视化聊天机器人
3. RAG构建:基于Dify搭建本地知识库
4. Agent智能体构建:基于Dify搭建Agent智能体
阶段三大模型语言进阶
AI掘金头条是一款基于个性化推荐的科技资讯阅读产品,包含用户端(提供移动Web、支持阅读、关注、评论及智能客服功能)、自媒体端(供自媒体作者编辑发布文章并查看运营数据)以及MIS管理后台(用于用户管理、文章审核及评论管理)等
知识点细分:
1. 项目搭建:项目初始化、配置数据库与配置模块化
2. 用户模块:获取用户信息,修改头像
3.
头条模块:获取用户频道,获取所有频道,修改用户频道
4.
文章模块:获取文章详情,用户关注列表,发布评分与评论列表及回复评论
阶段四大模型RAG开发
构建一个端到端、可水平扩展的检索增强生成(RAG)系统,支持对异构简历(PDF/DOCX/JPG/PNG)进行自动解析、结构化、语义索引与多轮对话式推荐。系统以向量数据库为核心存储,以 LLM 为推理中枢,以 Agent 框架为调度单元,面向企业 HR 及猎头平台提供秒级、可追溯、可解释的候选人推荐服务
知识点细分:
1. 文档智能
2. 向量化与索引
3. 检索增强生成
4. 智能代理
5. 配置与 DevOps
阶段五大模型智能体高级开发
1. Pytorch安装;2. Pytorch构建神经网络;3. Pytorch案例实战
1. 机器学习基础(术语、建模流程、核心框架、评估指标、分类回归聚类基础及案例);2. 深度学习基础(神经网络基础、Pytorch框架加强);3. 词向量(Word Embedding)
1. Function Call的原理;2. MCP和Function Call的区别;3. SSE、AGUI、MCP、A2A协议;4. 基于LangGraph智能体开发;5. 大模型评估
扫智通Agent项目是一个面向消费者(toC)的智能客服系统,旨在为用户提供全周期的扫地机器人相关服务并根据用户使用习惯生成使用报告,为用户提供使用优化建议。该系统基于RAG技术及ReAct框架构建,能够同时处理用户购买前后的咨询问题以及已购买用户的使用报告生成与优化建议需求。通过一个统一的Agent界面,为用户提供高效、准确且个性化的支持,提升用户体验与满意度
知识点细分:
1.数据来源:扫地机器人的产品手册及相关知识库(基础与技术类、产品功能类、智能交互类、维护与保养类、选购指南类、使用技巧类、配件与耗材类、安全与隐私类、特殊场景类等问题)
2.基于ReAct框架实现的Agent,包括推理(Reasoning)模块以及行动(Acting)模块
3.使用RAG工具实现本地知识库构建。(文档读取模块、向量数据库模块、RAG工具调用模块)
4.使用大模型Deepseek v3结合Prompt
Engineering实现用户使用报告的生成
5.构建三位一体评估体系,针对检索内容(Precision、Recall、mrr)、生成内容(ROUGE-1、ROUGE-L、BERTScore、Faithfulness)、总性能(平均延时、QPS)
6.构建日志打印模块,重点监控工具的运行情况。(控制台日志+生产环境日志)
7.基于Flask的模型部署(服务端+客户端)、基于Streamlit的前端服务
SmartVoyage 是一个智能旅行助手系统,使用 A2A (Agent-to-Agent) 协议构建多代理协作框架,支持用户查询天气和票务信息。系统包括 LLM 路由服务器(意图识别)、天气代理服务器(查询天气数据库)、票务代理服务器(查询票务数据库)、MCP 工具服务器(数据库接口)、数据采集脚本和 Streamlit 前端客户端。用户输入查询(如“北京天气”或“北京到上海火车票”),系统通过 LLM 路由到合适代理,代理生成 SQL 查询 MCP 数据库,返回结果显示在界面
知识点细分:
1. LLM 路由服务器(意图识别)
2. 天气代理服务器(查询天气数据库)
3. 票务代理服务器(查询票务数据库)
4. MCP 工具服务器(数据库接口)
5. 数据采集脚本
6. Streamlit 前端客户端
阶段六大模型综合应用
“草本通” 项目致力于解决中医药知识难以理解、碎片化严重、检索效率低 等问题,打造一个可理解、可对话、可传播、可拓展 的智能知识服务平台。系统融合多种AI技术,支持从数据采集到语义问答、图谱构建、再到内容生成与平台发布的完整AI闭环
知识点细分:
1.
利用爬虫自动采集中药、方剂、功效、症状、疾病等原始文本
2. 使用大语言模型(DeepSeek)+ LangChain
进行实体与关系抽取
3. 构建 Neo4j 图数据库与 Faiss
向量检索双引擎,实现结构化查询与语义匹配
4. 基于 LangGraph
搭建多智能体协同系统,管理复杂问答流程
5. 提供基于 Streamlit 的网页端交互式问答界面
6.
自动生成小红书风格图文内容,并实现一键发布,实现从“知识获取”到“内容传播”的闭环
基于IT职业教育行业答疑大模型抽取RAG解决方案,通过项目学习完成企业及RAG系统完整流程搭建与测试及优化。从智能查询路由设计、数据处理与多源集成、模型微调到后端服务与前端开发完成全栈RAG系统构建
知识点细分:
1.智能问答系统架构:FAQ 系统与 RAG
系统的区别与应用场景
2.数据库技术:MySQL 表查询;Redis
键值存储与缓存机制;Milvus
向量数据库的架构与索引类型
3.检索算法:BM25 算法原理;密集向量 &
稀疏向量混合检索;重排序的作用
4.query的意图识别+改写:BERT
分类器的训练与推理;LLM的调用与提示设计;查询分类与动态检索策略的实现逻辑
5.企业级开发实践:模块化代码设计与代码复用;配置文件(config.ini)与环境变量管理;日志系统设计与错误处理
大型ToC企业中的客服团队往往是人力外包,对公司业务细节的了解程度不够,需要和产研团队多次沟通才能完成一次工单的处理,效率低下。 同时,随着AI的发展,工单的处理也可以基于大模型+RAG+funcation call能力进行提效,部分工单自动处理,从而节省部分客服人力资源。 本系统结合大模型能力,融合多种AI技术(RAG+多Agent+MCP)等,完成工单的判定、处理、建议等全流程流转闭环
知识点细分:
1. 项目冷启动阶段,基于大模型 +
NLP算法,完成工单数据的清洗和工单、业务知识库的搭建(ElasticSearch),工单会进行脱敏
2.
消费工单的Kafka消息队列数据,并基于规则过滤出来需要处理的工单
3.
实现query改写,提高检索内容的准确性,对ES进行检索时采用上下文+向量混合检索的方式,结合重排序模型实现查询内容的准确性
4.
实现意图识别和槽位填充,基于用户的query基于MCP协议执行funcation
call,在上下文中补充用户的实时数据作为上下文信息
5. 实现知识库实时迭代,
实现知识库数据实时更新,保证内容是最新的
6. Docker镜像的构建和生产环境docker-compose模式部署
Flask/FastAPI/Gradio;Docker安装与部署;接口文档;模型部署实战
Agent常见架构剖析
DeepSeek大模型架构剖析
大模型Agent开发常见面试题
大模型RAG开发常见面试题
常用数据结构常见面试题
阶段七大模型核心原理剖析
1. Transformer架构
2. 大模型Transformer架构的注意力机制
3.
大模型Transformer架构(encoder、decoder、encoder+decoder)
4. 大模型Transformer文本翻译实战
1. 迁移学习的预训练模型和微调阶段
2. NLP中的常用预训练模型(BERT、GPT-1、GPT-2)
3. Hugging Face预训练模型仓库
4. Huggingface
Transformers库使用(提供了NLP领域预训练语言模型结构模型和调用框架)
5. Bert文本分类案例
阶段八大模型微调
1.主流大模型原理及架构(GPT系列、GLM、QWen、DeeepSeek)
2.大模型微调策略(PET、P-Tuning、LoRA
基于Qwen/DeepSeek+LoRA微调实现微博文本信息抽取+文本分类的多任务,通过一个大模型同时解决多种任务开发和应用,项目基于LLM进行混合任务开发应用的实现, 利用Qwen/DeepSeek大模型进行P-Tuning微调的方式,基于Flask框架实现API接口开发和应用
知识点细分:
1. 理解信息抽取任务以及文本分类的业务意义及应用场景
2. 数据预处理:修改数据格式适配大模型训练、数据张量的转换等
3.Qwen/DeepSeek模型解析,LoRA方法讲解、P-Tuning方法解析
4. 基于Qwen/DeepSeek+LoRA方法实现模型的训练和评估
5. 基于Qwen/DeepSeek+P-Tuning方法实现模型的训练和评估
6. 基于Flask框架开发API接口,实现模型线上应用
项目以QWen模型为核心,借助DeepSpeed框架实现训练过程的加速优化。同时采用了GPTQ和QLoRA技术对模型进行量化处理,旨在进一步提升模型的推理速度。最终,通过Vllm平台完成了模型的部署,实现了对文本中关键信息的自动化抽取,完成信息抽取的任务
知识点细分:
1. 数据集处理、模型构建、模型训练、模型预测
2. 大模型并行计算:deepspeed,数据并行、流水线并行、模型并行
3. 大模型量化:训练量化方法QLora,训练后量化方法GPTQ
4. 模型部署和推理优化框架:vLLM和oLLAMA
聚焦RAG开发、Agent智能体、国产模型微调三大黄金赛道
企业级大模型RAG应用核心解决方案,更好解决模型幻觉问题
掌握企业级大模型智能体解决方案,更好让大模型为业务赋能
掌握机器学习与深度学习核心算法,能够解决基础人工智能问题
课程充分融入DeepSeek,无缝对接企业大模型开发
使用技术、流程、工具、评估方法(如RAG的三位一体评估体系)都紧贴企业实践
聊天机器人搭建
(私有化部署)
AI掘金头条
(Python Web项目)
Coze/Dify项目案例
扫智通客服
(ReAct框架)
旅行规划
(A2A多Agent协作)
物流知识问答机器人
人力资源简历推荐系统
中医药知识图谱系统
职业教育RAG问答系统
多场景工单系统
(强化RAG+Agent)
微博信息抽取
文本摘要
简历优化、面试分析、工单自动处理、行业知识问答(如医疗、物流、旅游、人力等)
结合RAG防幻觉、ReAct/A2A多智能体协作、混合检索(BM25+向量)、实时日志监控
建立工程化思维,独立完成复杂系统,掌握解决企业级需求能力
使用技术、流程、工具、评估方法(如RAG的三位一体评估体系)都紧贴企业实践
北京化工大学工学硕士,多家互联网公司首席信息官,算法专家,具备多年机器学习,深度学习等人工智能相关算法的研发经验。熟悉Python、Java等常用开发语言,对PyTorch,Tensorflow, PaddlePaddle等深度学习框架熟练使用,在自然语言处理应用方面具备多年的企业实践经验。
硕士,擅长人工智能领域技术,多年模式识别和数据挖掘开发经验,主导研发多项国家和省级科研项目,负责企业级信贷风控模型和智能医疗数据平台开发,专注ML/DL/PR/KG领域相关算法的应用,曾任职美团搜索部负责NER及Bert搜索排序优化对Hadoop、SparkTensorflow和PyTorch等大数据、人工智能技术有多年企业实践经验。
毕业于哈尔滨工程大学,擅长GIS行业工程实战,在图像分割、检测、追踪等方面有多年从业经历,参与多项国家级/部委级重大项目,具备丰富的工程落地经验。
毕业于北京航空航天大学,聚焦自然语言处理算法和大模型方向,曾在多家知名互联网企业担任高级算法工程师和算法团队负责人,参与或主导多个核心算法项目的工业化落地,深谙工业界对算法工程师的核心诉求。在大模型引发AI范式变革之际,致力于以工业标准重塑教学,将多年算法能力和工程经验惠及更多的学员,希望大家都能学到真本领,进入自己心仪的企业。
硕士,曾就职于多家上市公司,并担任高级算法工程师、算法专家。研究领域包括NLP、目标检测、视频跟踪、大语言模型、多模态、模型推理加速等。
985高校计算机专业,资深算法工程师,在央企以及互联网公司从事多年算法开发及管理工作,在数据挖掘、自然语言处理、对话机器人领域有着深刻理解。。擅长课程:数据挖掘、数据分析与可视化、自然语言处理、信息抽取、对话机器人、大模型。
多年互联网一线大厂经验,在字节跳动、滴滴出行等一线互联网公司核心业务部门深耕技术多年,专注大数据和人工智能领域,具备扎实的技术能力和前沿的技术视野,技术栈丰富,擅长大数据开发、数据挖掘、深度学习、NLP、大模型等技术,擅长对技术活学活用和解决复杂问题,具备丰富的大型项目实战经验。
本课程旨在培养具备企业级大型模型应用开发能力的工程师(目标岗位:大型模型应用工程师。从事的岗位:将具备应聘大型模型应用、AI智能体开发工程师、RAG开发工程师等相关岗位的核心技能。
课程适学人群为:零基础学生。它包含 6天的“大模型开发入门”基础班 ,会教Python核心语法、基础API调用和本地模型部署。
课程为线下全日制脱产班。课程时长约70天学习日,不含休息日。总服务天数约106天。
课程主要聚焦于主流大模型的应用开发,重点实践平台包括:DeepSeek-R1, QWen, ChatGLM ;教学重点在于如何使用这些模型的API和本地部署(Ollama),以及在其基础上开发应用(Agent, RAG);课程侧重于 应用层的开发技能和工程实践 (如Prompt工程、Agent框架、RAG构建、部署、项目流程)。
项目采用小组协作(如3-5人)的方式进行 ,模拟真实工作环境。课程配备讲师和助教全程进行技术辅导、答疑和项目评审。
大模型应用开发(特别是Agent、RAG方向)是AI领域最热门的就业方向之一 ,人才需求缺口大。合格的初级工程师起薪通常具有竞争力(远高于普通开发岗位),有经验或能力突出者薪酬潜力更大。
核心技术阶段
深度合作共建课程
模型应用实战项目
模型开发实战项目
进阶中高级工程师
能力画像:掌握大模型私有化部署及人工智能Python语言,从零搭建聊天机器人,开启AI实战第一步。
胜任岗位:大模型初级开发工程师
能力画像:掌握人工智能Python语言高阶语法,掌握数据处理方法及数据统计分析方法,为数据建模奠定技术基础,掌握机器学习与深度学习核心算法,能够解决基础人工智能问题
胜任岗位:数据分析师、机器学习工程师、深度学习工程师
能力画像:通过文本处理、分析和建模,实现NER、文本分类、文本摘要、聊天机器人等功能
胜任岗位:NLP算法工程师、知识图谱工程师、机器学习工程师、语音识别工程师
能力画像:设计、实现与优化垂直领域大模型
胜任岗位:大模型开发工程师、Prompt工程师、大模型算法专家、大模型训练/推理开发工程师
能力画像:通过图像和视频分析、物体识别等技术,实现机器视觉相关任务
胜任岗位:CV算法工程师、目标检测工程师、图像处理工程师、深度学习工程师
课程大纲
基础班
1. 大模型开发入门
高手班
1. 大模型语言进阶 2. 数据处理与统计分析 3. 机器学习基础 4. 数据挖掘项目实战 5. 深度学习基础 6. NLP自然语言处理基础 7. 自然语言处理项目1 8. 大模型RAG开发项目 9. 大模型Agent开发项目 10. 大模型微调开发项目 11. 大模型核心专题 12. 自然语言处理项目2 13. 自然语言处理实战 14. 面试加强课 15. 图像分析基础 16. 多模态大模型项目
AI大模型开发V6.5版本
课时:8天 技术点:60项 测验:1次 学习方式:线下面授
1.基于Ollama的私有化大模型入门| 2.基于Ollama+LobeChat可视化聊天机器人| 3.Python调用本地大模型API| 4.基于Python调用基于Ollama部署本地大模型API实现聊天机器人
1. 聊天机器人的项目介绍与搭建零基础入门AI大模型开发的开始,包含了以下技术点:
01-项目介绍:AI大模型搭建聊天机器人需求分析、AI大模型搭建聊天机器人步骤和流程| 02-环境搭建:AI大模型搭建聊天机器人必备语言和工具、项目环境搭建
2. 基于ollama+ChatBox实现chatBot掌握私有化大模型部署,包含了以下技术点:
01-Linux基础:Linux核心命令| 02-虚拟机VMware基础:虚拟机配置、网络、VMware| 03-Ollama安装、命令、基于Ollama本地部署|DeepSeek和QWen大模型等
3. 大模型编程语言基础_Python编程掌握大模型必备的Python语言,包含了以下技术点:
01-Python基础语法:变量、标识符和关键字、输入和输出、数据类型转换、PEP8编码规范、比较/关系运算符、if判断语句语法格式、三目运算符、while语句语法格式、while 循环嵌套、break 和 continue、while 循环案例、for循环| 02-Python数据处理:字符串定义语法格式、字符串遍历、下标和切片、字符串常见操作、列表语法格式、列表的遍历、列表常见操作、列表嵌套、列表推导式、元组语法格式、元组操作、字典语法格式、字典常见操作、字典的遍历| 03-函数:函数概念和作用、函数定义、调用、函数的参数、函数的返回值、函数的注释、函数的嵌套调用、可变和不可变类型、局部变量、全局变量、组包和拆包、引用| 04-文件读写:文件的打开与关闭、文件的读写|、文件目录操作及案例、os模块文件与目录相关操作| 05-异常处理:异常概念、异常捕获、异常的传递| 06-模块和包:模块介绍、模块的导入、包的概念、包的导入、模块中的__all__ 、模块中__name__
4. Python调用Ollama部署QWen/DeepSeek大模型API实现聊天机器人能够实现Python调用本地部署大模型,包含了以下技术点:
01-streamlit框架的安装、基于streamlit完成聊天机器人界面设计| 02-基于Python调用本地私有大模型API实现聊天机器人
课时:7天 技术点:8项 测验:1次 学习方式:线下面授
1.初步建立面向对象的编程思维| 2.掌握类和对象的基本使用方式| 3.掌握网络编程技术,能够实现网络通讯| 4.知道通讯协议原理| 5.掌握开发中的多任务编程实现方式| 6.知道多进程多线程的原理|
1. 面向对象从逐步建立起面向对象编程思想,再到会使用对象,到创建对象,再到真正理解为什么封装对象,包含了以下技术点:
01_面向对象介绍| 02_类的定义和对象的创建| 03_添加和获取对象属性| 04_self 参数| 05_init方法| 06_继承| 07_子类方法重写| 08_类属性和实例属性| 09_类方法、实例方法、静态方法|
2. 网络编程主要学习通讯协议,以及Python实现TCP、HTTP通讯,包含了以下技术点:
01_IP地址的介绍| 02_端口和端口号的介绍| 03_TCP的介绍| 04_Socket的介绍| 05_TCP网络应用的开发流程| 06_基于TCP通信程序开发|
3. 多任务编程主要学习Python中多线程、多进程,包含了以下技术点:
01_多任务介绍| 02_多进程的使用| 03_多线程的使用| 04_线程同步|
4. 高级语法主要学习Python的高级语法,包含以下技术点:
01_闭包| 02_装饰器| 03_正则
5. Python数据结构主要学习主要查找算法、排序算法、关键数据结构
01_时间复杂度| 02_线性表| 03_链表| 04_常用数据结构 05_二分查找| 06_冒泡、选择、插入、快排
课时:7天 技术点:105项 测验:1次 学习方式:线下面授
1.掌握 Linux 常用命令,为数据开发后续学习打下的良好基础| 2.掌握 MySQL 数据库的使用| 3.掌握 SQL 语法| 4.掌握使用 Python 操作数据库| 5.掌握 Pandas 案例| 6.知道常见绘图库使用| 7.掌握 Pandas 数据 ETL| 8.掌握 Pandas 数据分析项目流程|
1. Linux掌握Linux操作系统常用命令和权限管理,包含以下技术点:
01_Linux命令使用| 02_Linux命令选项的使用| 03_远程登录| 04_Linux权限管理| 05_vi编辑器使用
2. MySQL与SQL零基础小白通过MySQL数据库,掌握核心必备SQL,包含以下技术点:
01_数据库概念和作用| 02_MySQL数据类型| 03_数据完整性和约束| 04_数据库、表基本操作命令| 05_表数据操作命令| 06_where子句| 07_分组聚合| 08_连接查询| 09_外键的使用| 10_PyMySQL
3. Numpy矩阵运算库Numpy矩阵运算库技术,包含以下技术点:
01_Numpy运算优势,数组的属性,数组的形状| 02_Numpy实现数组基本操| 03_Numpy实现数组运算,矩阵乘法
4. Pandas数据清洗Pandas数据清洗技术,包含以下技术点:
1.数据组合:01_Pandas数据组合_concat连接;02_Pandas数据组合_merge数据;03_Pandas数据组合_join| 2.缺失值处理:01_缺失值处理介绍;02_缺失值处理_缺失值数量统计;03_缺失值处理;04_缺失值处理_删除缺失值;05_缺失值处理_填充缺失值| 3.Pandas数据类型| 4.apply函数:01_Series和DataFrame的apply方法;02_apply使用案例
5. Pandas数据整理Pandas数据处理技术,包含以下技术点:
1.数据分组: 01_单变量分组聚合; 02_通过调用agg进行聚合; 03_分组后transform; 04_transform练习| 2.Pandas透视表: 01_透视表概述&绘员存量增量分析; 02_绘员增量等级分布; 03_增量等级占比分析&整体等级分布; 04_线上线下增量分析| 3.datetime数据类型: 01_日期时间类型介绍; 02_提取日期分组案例; 03_股票数据处理; 04_datarange函数; 05_综合案例
6. Pandas数据可视化Pandas数据可视化技术,包含以下技术点:
1.Matplotlib可视化| 2.Pandas可视化| 3.Seaborn可视化|
7. Pandas数据分析项目利用所学的Python Pandas,以及可视化技术,完成数据处理项目实战
RFM客户分群案例: 01_RFM概念介绍| 02_RFM项目_数据加载和数据处理| 03_RFM项目_RFM计算| 04_RFM项目_RFM可视化| 05_RFM项目_业务解读和小结|
课时:7天 技术点:80项 测验:1次 学习方式:线下面授
1.掌握机器学习算法基本原理| 2.掌握使用机器学习模型训练的基本流程| 3.掌握 Sklearn 等常用机器学习相关开源库的使用| 4.熟练使用机器学习相关算法进行预测分析|
1. 机器学习该部分主要学习机器学习基础理论,包含以下技术点:
01_人工智能概述| 02_机器学习开发流程和用到的数据介绍| 03_特征工程介绍和小结| 04_机器学习算法分类| 05_机器学习模型评估| 06_数据分析与机器学习
2. K近邻算法该部分主要学习机器学习KNN算法及实战,包含以下技术点:
01_K近邻算法基本原理| 02_K近邻算法进行分类预测| 03_sklearn实现knn| 04_训练集测试集划分| 05_分类算法的评估| 06_归一化和标准化| 07_超参数搜索| 08_K近邻算法总结
3. 线性回归该部分主要学习机器学习线性回归算法及实战,包含以下技术点:
01_线性回归简介| 02_线性回归API使用初步| 03_导数回顾| 04_线性回归的损失函数和优化方法| 05_梯度下降推导| 06_波士顿房价预测案例| 07_欠拟合和过拟合| 08_模型的保存和加载| 09_线性回归应用-回归分析
4. 逻辑回归该部分主要学习机器学习逻辑回归算法及实战,包含以下技术点:
01_逻辑回归简介| 02_逻辑回归API应用案例| 03_分类算法评价方法| 04_逻辑回归应用_分类分析
5. 聚类算法该部分主要学习机器学习聚类算法及实战,包含以下技术点:
01_聚类算法的概念| 02_聚类算法API的使用| 03_聚类算法实现原理| 04_聚类算法的评估| 05_聚类算法案例
6. 决策树该部分主要学习机器学习决策树算法及实战,包含以下技术点:
01_决策树算法简介| 02_决策树分类原理| 03_特征工程-特征提取| 04_决策树算法api| 05_决策树案例
7. 集成学习该部分主要学习机器学习集成算法算法及实战,包含以下技术点:
01_集成学习算法简介| 02_Bagging和随机森林| 03_随机森林案例| 04_Boosting介绍| 05_GBDT介绍| 06_XGBOOST
8. 数据挖掘案例数据挖掘案例部分,包含以下技术点:
01_数据探索性分析| 02_特征工程| 03_模型训练与特征优化| 04_模型部署上线
课时:2天技术点:20项测验:0次学习方式:线下面授
1.数据挖掘项目:时间序列预测、电力负荷预测项目背景、对电力负荷预测任务进行机器学习建模、了解项目优化方向| 2.解决方案:时间序列数据分析方案、时间序列数据特征工程解决方案、时间序列数据模型选择与模型训练方案、时间序列数据不同场景下的预测方案| 3.模型优化:从特征工程、算法选择、预测(推理)速度、扩展性角度介绍时序预测任务还可以进一步优化的方向 | 实战案例:人才流失建模实战 |数据分析解决方案、特征工程解决方案、机器学习模型调参解决方案、模型融合解决方案
南方电网电力负荷预测项目,是实现电力供需的平衡,有效整合可再生能源,满足日益增长的电力需求,同时降低碳排放并确保电网稳定运行非常重要的一个任务。该项目根据脱敏后的时间戳,历史电力负荷数据,充分提取时间特征,滑动时间窗口内电力负荷特征,历史电力负荷特征,构建机器学习模型,对未来一个时间步的电力负荷进行预测。
1.时间序列数据分析方案| 2.时间序列数据特征工程解决方案| 3.时间序列数据模型选择与模型训练方案| 4.时间序列数据不同场景下的预测方案
1.时间序列预测介绍,了解什么是时间序列预测,有哪些应用,有几种分类场景以及时间序列预测有哪些算法| 2.电力负荷预测项目背景介绍,电力负荷预测的重要性与价值分析| 3.对电力负荷预测任务进行机器学习建模,涉及数据分析,特征工程,XGBoost模型训练与调优,模型评价,模型保存,模型预测等功能实现| 4.了解项目优化方向,包括从特征工程、算法选择、预测(推理)速度、扩展性角度介绍时序预测任务还可以进一步优化的方向
课时:7天 技术点:70项 测验:1次 学习方式:线下面授
1.Pytorch 工具处理神经网络涉及的关键点| 2.掌握神经网络基础知识| 3.掌握反向传播原理| 4.了解深度学习正则化与算法优化| 5.掌握卷积神经网络(CNN)| 6.掌握循环神经网络(RNN)|
1. 神经网络基础该部分主要学习神经网络基础,包含以下技术点:
01_神经网络基础:神经网络的构成、激活函数、损失函数、优化方法及正则化|02_反向传播原理:梯度下降算法、链式法则、反向传播算法、改善反向传播算法性能的迭代法|03_深度学习正则化与算法优化:L1、L2、DroupOut、BN、SGD、RMSProp、Adagrad、Adam;04_实现多层神经网络案例|
2. 深度学习多框架对比该部分主要学习深度学习多框架对比,包含以下技术点:
01_Pytorch| 02_Tensorflow| 03_MxNet| 04_PaddlePaddle|
3. Pytorch框架该部分主要学习Pytorch深度学习框架,包含以下技术点:
01_Pytorch介绍|02_张量概念|03_张量运算|04_反向传播|05_梯度,自动梯度|06_参数更新|07_数据加载器|08_迭代数据集|
课时:10天 技术点:100项 测验:1次 学习方式:线下面授
1.掌握NLP领域前沿的技术解决方案| 2.了解NLP应用场景| 3.掌握NLP相关知识的原理和实现| 4.掌握传统序列模型的基本原理和使用| 5.掌握非序列模型解决文本问题的原理和方案| 6.能够使用Pytorch搭建神经网络| 7.构建基本的语言翻译系统模型| 8.构建基本的文本生成系统模型| 9.构建基本的文本分类器模型| 10.使用FastText进行快速的文本分类
1. NLP入门该部分主要学习NLP基础,包含以下技术点:
01_NLP简介|02_NLU简介|03_文本生成简介|04_机器翻译简介|05_智能客服介绍|06_机器人写作介绍|07_作文打分介绍
2. 文本预处理该部分主要学习文本预处理技术,包含以下技术点:
01_文本处理的基本方|02_文本张量表示方法|03_文本语料的数据分析,文本特征处理,数据增强方法|04_分词,词性标注,命名实体识别|05_one-hot编码,Word2vec,Word Embedding|06_标签数量分布,句子长度分布,词频统计与关键词词云
3. RNN及变体该部分主要学习RNN、LSTM、GRU等技术,包含以下技术点:
01_传统RNN,LSTM,Bi-LSTM,GRU,Bi-GRU|02_新闻分类案例,机器翻译案例|03_seq2seq,遗忘门,输入门,细胞状态,输出门,更新门,重置门
4. Transfomer原理该部分主要学习Transform技术,包含以下技术点:
01_输入部分,输出部分,编码器部分,解码器部分,线性层|02_softmax层,注意力机制,多头注意力机制|03_前馈全连接层,规范化层,子层连接结构,语言模型|04_wikiText-2数据集,模型超参数|05_模型的训练,模型验证
5. 迁移学习该部分主要学习迁移学习,包含以下技术点:
01_fasttext工具,进行文本分类|02_CBOW模式,skip-gram模式,预训练模型|03_微调,微调脚本,训练词向量|04_模型调优|05_n-gram特征|06_CoLA 数据集,SST-2 数据集,MRPC 数据集|07_BERT,GPT,GPT-2,08_pytorch.hub
课时:7天技术点:80项测验:0次学习方式:线下面授
1. 基于大规模业务留存数据构建快速文本分类系统| 2. 基于推荐系统内部分频道投递的需求,快速搭建短文本精准分类投递的模型| 3. 基于随机森林和FastText搭建快速基线模型, 验证业务通道的能力| 4. 基于BERT的迁移学习优化模型搭建的能力| 5. 实现神经网络量化的优化与测试| 6. 实现神经网络剪枝的优化与测试| 7. 实现神经网络知识蒸馏的优化与测试| 8. 更多主流预训练模型的优化与深度模型剖析| 9. BERT模型在生成式任务和工程优化上的深入扩展 |
蜂窝头条投满分项目是结合今日头条真实场景下的海量数据, 快速搭建随机森林和FastText的基线模型, 以验证商业化落地的可行性. 更多聚焦在深度学习的优化方法上, 搭建基于BERT的初版微调模型, 应用量化,剪枝,预训练模型微调,知识蒸馏等多种手段,反复迭代,反复优化模型的离线效果,在线效果。
1.海量文本快速分类基线模型解决方案| 2.基于预训练模型优化的解决方案| 3.模型量化优化的解决方案| 4.模型剪枝优化的解决方案| 5.模型知识蒸馏优化的解决方案| 6.主流迁移学习模型微调优化的解决方案
1. 项目背景介绍, 项目快速实现基于随机森林的基线模型1.0, 和基于FastText的基线模型2.0| 2. 迁移学习优化, 实现基于BERT的迁移学习模型搭建和训练, 并对比模型关键指标的提升| 3. 模型的量化, 实现对大型预训练模型的量化, 并对比原始模型与量化模型的差异| 4. 模型的剪枝, 实现对模型的剪枝的操作, 包含主流的对特定网络模块的剪枝, 多参数模块的剪枝, 全局剪枝, 用户自定义剪枝, 包含处理细节和理论知识| 5. 迁移学习微调, 包含BERT模型微调| 6. 模型的知识蒸馏, 详细解析知识蒸馏的原理和意义, 并实现知识蒸馏模型的搭建, 对比知识蒸馏后的新模型的优异表现, 并做详细的对比测试
课时:8天学习方式:线下面授
基于物流大模型RAG项目
基于教育领域EduRAG项目
项目基于LangChain+ChatGLM-6B实现电商物流 本地知识库问答机器人搭建,让模型根据本地信 息进行准确回答,解决大模型的“幻觉”问题, 实现精准问答。通过项目皆在掌握LangChain工 具的基本使用方式,理解向量知识库以及实现知 识库的技术原理,快速构建检索增强生成 (RAG)系统
进入项目体验1.了解LangChain基本概念、明确LangChain主要组件的作用、了解LangChain常见的使用场景 2.掌握基于LangChain+ChatGLM-6B模型实现本地知识库的问答实现原理+过程 3.RAG 系统开发与优化:掌握从数据分片到答案生成的 RAG 全流程,熟练应用 HyDE、子查询等检索增强策略提升系统性能。
1.LangChain工具使用介绍解决方案| 2.ChatGLM-6B模型集成到问答系统中的解决方案| 3.向量知识库的构建和检索的解决方案| 4.搭建RAG系统的解决方案
1.项目介绍:理解什么是RAG系统| 2.项目流程梳理(从本地知识库搭建,到知识检索,模型生成答案等流程介绍)| 3.数据预处理:本地文档知识分割,向量,存储| 4.LangChain框架的详解讲解:6大组件应用原理和实现方法| 5.基于本地大模型ChatGLM-6B封装到LangChain框架中| 6.实现LangChain+ChatGLM-6B模型的知识问答系统搭建
EduRAG 是一个企业级智能问答系统,专为教育场景设计,整合了基于 MySQL 的快速 FAQ 检索和基于 RAG(Retrieval-Augmented Generation)的复杂问题处理能力。系统通过结合 MySQL 数据库的高效查询和 Milvus 向量数据库的语义检索,实现了从常见问题到专业咨询的全方位问答支持。系统支持多来源过滤(如 AI、Java、测试、运维、大数据),并通过 Redis 缓存优化性能,使用 LLM 提供高质量答案生成。
1.大模型应用实践:能够集成 LLM(如 OllamaLLM)并设计高效 Prompt,解决知识问答中的业务定制化需求。 2.智能查询路由设计:实现规则、相似度和 LLM 三层路由,精准分发查询并优化复杂意图识别效率。 3.后端服务与前端开发:使用 FastAPI 开发高并发 API 并通过 Gradio 构建交互界面,满足企业级服务与用户体验要求。 4.数据处理与多源集成:熟练处理结构化与非结构化数据,结合 MySQL 和向量搜索打造高效知识检索系统。 5.企业级问题解决能力:通过日志调试和高并发设计,具备定制化开发与性能优化的实战技能,适配智能客服等场景。
1.数据获取与预处理| 2.非结构化文本实体识别(NER)| 3.非结构化文本多样化关系抽取| 4.知识融合与实体消歧| 5.Neo4j图数据库存储与查询优化| 6.医疗问答系统| 7.工程化部署
1.智能搜索优化 —— 利用语义理解与实体关联提升搜索准确性(图谱智能搜索)| 2.医疗诊断与研发 —— 构建医疗知识图谱,支持疾病诊断及药物研发| 3.高效知识存储与查询 —— 基于 Neo4j 存储与查询 SPO 三元组数据| 4.智能问答系统 —— 结合 NLU 与知识图谱实现精准问答| 5.异构数据整合 —— 通过实体抽取融合多源数据构建一致知识图谱
课时:6天学习方式:线下面授
基于Dify+RagFlow的Agent智能体搭建
基于CrewAI智能体搭建
项目基于Ollama私有化部署DeepSeek R1:8b模型,基于Docker结合Dify大模型应用开发平台构建可视化聊天界面,并搭建人工智能技术答疑场景的RAG系统,通过集成DeepSeek构建专属AI助手,解决模型幻觉问题。项目实现了AI大模型从私有化部署、聊天机器人搭建、RAG系统到Agent智能体构建。
1.掌握智能体核心原理、机制、概念及主流大模型剖析。 2.掌握Dify大模型应用开发平台使用,掌握基于Dify构建RAG系统
1.大模型私有化部署方案| 2.Dify搭建聊天机器人| 3.搭建本地知识库解决方案| 4.大模型智能体解决方案
1、大模型私有化部署:Ollama、DeepSeek/QWen| 2、聊天机器人搭建:基于Dify搭建可视化聊天机器人| 3、RAG构建:基于Dify搭建本地知识库| 4、Agent智能体构建:基于Dify+RagFlow搭建Agent智能体
本项目深入探索大模型AI Agent的开发与应用,包括大模型Function Call函数调用的原理和实现,涵盖实时天气查询、订机票和数据库查询操作的实际案例;详细分析GPTs和Assistant API的原理及其应用方式,开发学习答疑聊天机器人和水果收银助手;并研究AI Agent的原理及其与传统软件的区别,基于CrewAI框架开发自动写信并发送邮件的AI Agent。通过这些内容,将全面掌握大模型AI Agent的开发技术及其在实际场景中的应用。
1.通过创建具备查询实时天气及查询航班功能的聊天机器人,了解Function Call概念及原理,掌握Function Call开发应用 2.了解AI Agent和传统软件的区别和联系,掌握基于CrewAI框架,实现多个AI Agent协同工作,并完成自动写书信以及发送邮件的项目案例 3.了解GPTs、Coze平台、Assistant API,掌握基于Coze平台打造个人学习助手,掌握基于Assistant API开发个人助手
1.基于Function Call实现实时查询天气的解决方案| 2.基于Function Call实现订机票的解决方案| 3.基于Function Call实现数据库查询的解决方案| 4.基于GPTs实现学习答疑助手的解决方案| 5.基于Assistant API实现水果收银助手的解决方案| 6.基于CrewAI实现自动写信并发送邮件的AI Agent的解决方案
1.大模型Function Call函数调用功能的原理和实现方式| 2.开发Function Call实现大模型:实时查询天气、订机票、数据库查询等功能| 4.解析GPTs和Assistant API的原理及应用方式| 5.基于GPTs store和Assistant API开发实用的聊天机器人应用| 6.拆解AI Agent的原理及对比与传统软件的区别| 7.基于CrewAI框架开发自动写信并发送邮件的AI Agent
课时:2天学习方式:线下面授
基于FFT的全量微调项目
基于P-Tuning的提示词微调
基于LoRA的PEFT微调
该项目基于GPT-2模型构建了一个医疗问诊对话系统,旨在为用户提供初步的医疗咨询服务。通过自然语言对话,系统能够了解用户的症状,提供可能的疾病建议和健康管理指导,帮助用户进行自我照顾,并在必要时建议就医。该项目不仅提升了医疗服务的便捷性,还减轻了医疗机构的负担,具有广泛的应用前景和实用价值。
进入项目体验了解医疗问诊机器人的开发背景及企业中聊天机器人的应用场景,掌握基于GPT2模型搭建医疗问诊机器人的实现过程
1.GPT2模型基础原理及架构分析解决方案| 2.GPT2模型输入输出工作机制解决方案| 3.数据清洗方法解决方案| 4.GPT2模型微调评估解决方案| 5.Flask框架API开发解决方案
1.项目介绍:理解聊天机器人的意义及实际应用场景| 2.项目实现流程介绍(数据预处理+模型训练+模型评估+上线)| 3.项目环境配置以及开发框架的选择| 4.解析GPT2模型架构及原理| 5.实现医疗数据的预处理,适配GPT2模型训练| 6.基于GPT2模型实现问答模型的微调训练| 7.基于Flask框架开发API接口,实现模型线上应用
项目旨在基于BERT+P-Tuning和PET两种方式,构建一个新零售行业的评价决策系统。系统通过对客户评价文本进行准确分类,基于深度分析结果生成针对不同业务场景的决策建议,帮助企业改进产品和服务质量,从而提升客户满意度。
了解企业面向超大规模模型的Prompt-Tuning方法类型,理解Prefix-Tuning、Adapter-Tuning、LoRA三种大模型参数微调方法的原理
1.BERT模型基础原理及架构分析解决方案 2.PET以及P—Tuning微调方法原理及应用机制解决方案 3.数据格式转换、适配模型训练的解决方案 4.BERT模型微调评估解决方案 5.Flask框架API开发解决方案
1. 项目意义:新零售行业背景和需求 2.BERT模型介绍:架构、预训练任务、应用场景 3.P-Tuning方法的原理:定义、作用、优点 4.PET方法的原理:定义、作用、优点 5.模型训练调优:数据清洗、参数选择、模型训练 6.模型性能评估:构建评估指标(Precision、Recall)评估方法(混淆矩阵)
基于QWen/DeepSeek+LoRA微调实现微博文本信息抽取+文本分类的多任务,通过一个大模型同时解决多种任务开发和应用,项目基于LLM进行混合任务开发应用的实现,利用QWen/DeepSeek大模型进行P-Tuning微调的方式,基于Flask框架实现API接口开发和应用。
1、掌握基于BERT+PET及BERT+P-Tuning方式实现文本分类 2、通过金融行业动态方向评估项目掌握利用Few-shot、Zero-shot方式基于ChatGLM-6B实现文本分类、信息抽取、文本匹配任务
1.联合任务数据预处理适配模型训练的解决方案| 2.实现QWen/DeepSeek+LoRA训练的解决方案| 3.实现QWen/DeepSeek+P-Tuning训练的解决方案| 4.基于Flask框架实现模型API接口开发的解决方案|
1.项目介绍:理解信息抽取任务以及文本分类的业务意义及应用场景| 2.项目流程介绍(完整的实现整个任务的逻辑框架)| 3.数据预处理:修改数据格式适配大模型训练、数据张量的转换等| 4.QWen/DeepSeek模型解析,LoRA方法讲解、P-Tuning方法解析| 5.基于QWen/DeepSeek+LoRA方法实现模型的训练和评估| 6.基于QWen/DeepSeek+P-Tuning方法实现模型的训练和评估| 7.基于Flask框架开发API接口,实现模型线上应用
课时:2天学习方式:线下面授
企业级大模型平台开发
大模型蒸馏解决方案
利用计算机视觉技术,上传照片,选择不同的服装进行试穿,使得用户无需到实体店,就能够在线上体验不同的风格,更方便地进行购物决策。该项目利用人体数据、服装图像和文本提示,扩 散模型Diffusion Model在人体数据和服装图像的控制因子下,分别处理文本提示,最后进行信息的融合,实现逼真的试衣效果。
进入项目体验1.大模型优化加速原理及落地应用扩展 2.企业级大模型平台开发
1.虚拟试衣的常见解决方案| 2.阿里PAI平台使用的解决方案| 3.PAI—DSW环境搭建的解决方案| 4.虚拟试衣实践的解决方案
1.虚拟试衣简介:背景,应用场景,优势,方法| 2.阿里PAI平台:介绍,平台意义,产品结构,PAI的架构,PAI的注册与开通| 3.PAI-DSW环境搭建:DSW介绍,产品特点,环境搭建方法| 4.虚拟试衣实践:Diffusers,加速器accelerate,下载SD模型,Lora微调,模型部署,推理验证
项目目标是将已知的某个大规模语言模型的特性或领域知识,迁移到一个小规模语言模型上。通过自动化构建和清洗语料集、高效的训练和部署方式,快速高效地完成蒸馏任务。
1.大模型蒸馏专题应用 2.主流大模型核心原理、论文剖析
1.0基础建立语料集解决方案| 2.LLaMA-Factory实施硬标签蒸馏解决方案| 3.vllm高效部署解决方案+业务场景扩展
1、使用公开底座的大模型,全自动化地建立和清洗语料集| 2、通过蒸馏的方式,迁移大模型地特性或领域知识| 3、高效部署大模型服务
课时:8天技术点:80项测验:0次学习方式:线下面授
1.图谱全流程管理:掌握从数据获取到图谱构建的全生命周期| 2.图谱理论与应用:熟悉知识图谱定义、类型及多领域应用| 3.Neo4j 技术:精通图数据库的存储与查询优化| 4.深度学习 NER:掌握 CRF、BERT、BiLSTM+CRF 等实体识别方法| 5.多样化关系抽取:熟练运用规则、Pipeline 与 Casrel 模型提取关系| 6.知识融合与消歧:掌握实体消歧和关系对齐技术| 7.医疗问答开发:实现意图识别与对话管理的智能问答系统| 8.NLP 语义处理 :精通自然语言理解(NLU)与生成(NLG)| 9.模型工程化:掌握数据预处理与模型训练全流程| 10.垂直领域图谱:构建医疗、商业等领域的定制知识图谱|
医疗知识图谱项目是一款基于知识图谱的多功能问答机器人项目, 主要解决当前NLP领域中大规模知识图谱构建的问题和图谱落地的问题.知识图谱的构建主要分为知识构建和知识存储两大子系统.知识构建部分将重点完成命名实体识别和关系抽取的模型搭建与优化,深入解析并实现Casrel模型实现文本自动关系抽取的实现.并深入解析实体对齐和实体消歧的NLP难题解决方案, 深度结合工业界流行的解决方案. 最终呈现一个基于知识图谱的问答机器人。
1.数据获取与预处理|2.非结构化文本实体识别(NER)|3.非结构化文本多样化关系抽取|4.知识融合与实体消歧|5.Neo4j图数据库存储与查询优化|6.医疗问答系统|7.工程化部署|
1.智能搜索优化 —— 利用语义理解与实体关联提升搜索准确性(图谱智能搜索)| 2.医疗诊断与研发 —— 构建医疗知识图谱,支持疾病诊断及药物研发| 3.高效知识存储与查询 —— 基于 Neo4j 存储与查询 SPO 三元组数据| 4.智能问答系统 —— 结合 NLU 与知识图谱实现精准问答| 5.异构数据整合 —— 通过实体抽取融合多源数据构建一致知识图谱
课时:2天技术点:20项测验:0次学习方式:线下面授
1.NER命名实体识别任务实战| 2.关系抽取任务实战
实战项目旨在通过新闻报道数据,完成命名实体识别(NER)任务,抽取人物、地点和组织三种实体。项目从数据收集到模型部署,涵盖了完整的NLP任务流程。学生通过分工协作,使用Doccano进行数据标注,采用BIO格式预处理数据,基于BERT+BiLSTM+CRF模型训练NER系统,并开发预测函数与API接口,最终通过Web界面展示结果并完成答辩汇报。
1.数据标注与审核:收集新闻报道数据;使用标注工具完成人物、地点、组织标注| 2.数据预处理:BIO标签预处理| 3.BERT+BiLSTM+CRF模型:BERT:提取上下文语义特征;BiLSTM:捕捉长距离依赖关系。CRF:优化标签序列,解决非法标签问题| 4.预测函数与API封装:加载训练好的模型,处理输入文本,输出BIO标签并解析实体
1.命名实体识别(NER)与BIO标注:NER识别实体,BIO标注将文本转为序列标签| 2.BERT+BiLSTM+CRF模型原理:BERT提取语义,BiLSTM捕获依赖,CRF优化序列| 3.数据预处理与模型训练:BIO格式预处理,CRF损失训练,F1评估模型| 4.API封装与Web部署:Flask构建API,HTML+JS实现前后端交互| 5.团队协作与项目管理:Git版本控制,Trello任务管理,团队分工协作| 6.模型评估与优化:F1分数评估,超参数调优与数据增强优化
课时:3天 技术点:40项 测验:0次 学习方式:线下面授
1.熟悉模型部署常用方法| 2.掌握核心的机器学习和深度学习算法,应对工作中多应用场景落地| 3.掌握NLP项目核心流程和常见模型| 4.可胜任NLP、大模型算法工程师常见工作任务,并持续优化与迭代算法
1. 服务化框架实战该模块主要介绍服务化框架内容,相关内容如下:
01-Flask作用与流程、Flask入门Hello World、Flask表单使用、Flask服务交付(json)| 02-基于Flask的中文垃圾邮件分类服务封装实战
2. 模型容器化部署实战该部分主要学习模型容器化部署的相关内容:
01-Gradio简介、Gradio安装及基本用法、Gradio基本参数(Interface+Blocks)、Gradio应用分享| 02-【案例】基于Gradio的文本分类服务封装案例实战| 03-【案例】基于Gradio的图像分类服务封装案例实战| 04-Docker介绍安装、Docker快速入手、Docker镜像操作、Docker容器操作| 05-Docker手动构建镜像、Docker自动构建镜像、Docker镜像推送| 06-【案例】中文垃圾邮件分类项目Docker部署实战
3. 自然语言处理核心项目串讲该部分主要学习NLP面试核心的相关知识:
01-Pandas数据处理与统计分析回顾| 02-机器学习回顾+面试高频题讲解| 03-深度学习回顾+面试高频题讲解
4. 大模型核心项目串讲及简历优化该部分主要介绍大模型核心项目及高频面试题的内容:
01-大模型高频面试题讲解| 02-大模型应用框架(推理框架+应用框架)| 03-项目简历优化及面试话术
课时:5天 技术点:100项 测验:1次 学习方式:线下面授
1.熟悉深度学习主要及前沿网络模型的架构原理及在实际业务场景中的应用|2.掌握深度学习在计算机视觉中的应用,包括但不限于分割检测识别等等 3.掌握实际工作中深度学习的具体流程,数据及标注处理,建模训练,及模型部署应用等|4.可胜任深度学习算法工程师,图像与计算机视觉算法工程师等,并持续优化与迭代算法
1. 图像与视觉处理介绍该模块主要介绍计算机视觉的定义,发展历史及应用场景
01_计算机视觉定义、计算机视觉发展历史|02_计算机视觉技术和应用场景、计算机视觉知识树和几大任务
2. 图像分析该部分主要学习图像分析的相关内容:
01_图像的表示方法;| 02_图像的几何变换;| 03_颜色变换;| 04_mixup;| 05_copypaste|
3. 图像分类该部分主要学习图像分类的相关知识:
01_分类的思想;| 02_经典网络结构;AlexNet;| 03_InceptionNet;| 04_ResNet;| 05_模型微调策略|
4. 图像分割该部分主要介绍图像分割的内容:
01_分割思想| 02_Unet;| 03_FCN Net;| 04_MaskRCNN|
课时:5天技术点:40项测验:0次学习方式:线下面授
1.知道AIGC是什么,理解AIGC的产品形态| 2.知道图像生成的常用方式| 3.理解GAN ,VAE,Diffusion的思想| 4.掌握Stable Diffusion的网络结构| 5.理解文图匹配的clip模型| 6.理解Unet网络和采样算法的作用| 7.知道VAE解码器的作用| 8.知道dreambooth和LoRA的模型训练方式| 9.能够搭建图像生成的小程序
基于Stable Diffusion的图像生成项目是一种基于深度学习的图像生成方法,旨在生成高质量、逼真的图像。该项目利用稳定扩散过程,通过逐渐模糊和清晰化图像来实现图像生成的过程。这种方法在图像生成领域具有广泛的应用,包括艺术创作、虚拟场景生成、数据增强等。
图像生成的常见解决方案| 文图匹配的解决方案| 扩散模型噪声去除的解决方案| 潜在空间扩散模型的解决方案| 扩散模型训练的解决方案| 小程序搭建的解决方案
1.AIGC的详解:AIGC简介,类型,应用场景,产品形态| 2.图像生成算法:GAN; VAE ;Diffusion; DALLe; imagen| 3.StableDiffusion的详解:Diffusion,latent diffusion ;satble diffusion| 4.stablediffusion实践: 模型构建,模型训练,lora,dreambooth,图像生成效果| 5.图像生成小程序搭建: 基于stablediffusion构建图像生成的小程序
课程名称:主要针对:主要使用开发工具:
课程名称
AI大模型开发就业班
课程推出时间
2025.04.25
课程版本号
6.5
主要使用开发工具
Python、Sklearn、Pytorch、Tensorflow、TensorBoard、HuggingFace、ModelScope、LangChain、LlamaFactory、通义百炼/PAI平台、deepseek等
课程介绍
人工智能开发V6.5课程体系升级,紧跟大模型时代热点,以企业需求为导向,专为培养和打造高级AI大模型应用与开发工程师;通过高含金量课程重磅推出,以业务为核心驱动项目开发。学生在掌握机器学习和深度学习基础上,能够解决企业级数据挖掘、NLP自然语言处理、大模型开发实际问题,通过理论和真实项目相结合,让学生能够掌握AI大模型开发核心技术和应用场景。并推出「六项目制」项目教学,通过六个不同类型和开发深度的项目,使学员能够全面面对大部分企业人工智能应用场景。
构建大型项目库,多行业多领域人工智能项目课程,主流行业全覆盖,其中项目课程包括了多行业10个场景的项目课程,让学生达到大厂的项目经验要求。
课程消化吸收方面:V6.5在V5.0版本基础上迭代更新,加大了大模型开发比例,同时注重专业课的消化吸收,降低学习难度,提升就业质量。
全新升级四大课程优势,助力IT职业教育行业变革:
优势1:热门岗位全覆盖,匹配企业岗位需求,拓宽职业选择,实现阶段目标;优势2:与大厂合作,共建大模型课程,助力掌握前沿技术,增强就业竞争力;优势3:定制垂直领域大模型,专项领域赋能,打造就业薪资高,就业速度快的AI大模型人才;优势4:大模型模块开发完整图谱,课程涵盖大模型提示词工程、RAG、Agent智能体、大模型微调与蒸馏全栈大模型核心技术。
1
新增大模型RAG系统开发的基于职业教育领域的EduRAG大模型项目,覆盖企业构建RAG所有优化场景
1
新增大模型Coze低代码平台构建Agent与RAG,完成企业快速搭建智能体需求
1
新增大模型Dify+RagFlow灵活构建定制化的Agent与知识库,完成企业各种多样化智能体搭建需求
1
新增大模型蒸馏理论基础与实战项目,以企业实际需求为导向讲授大模型蒸馏的细节
1
新增DeepSeek大模型原理、优化、微调、部署及智能体应用,全方面融入DeepSeek
1
新增企业级大模型平台项目,增加讯飞星火Maas平台、阿里PAI平台、百炼平台,快速搭建大模型应用
1
新增LlamaFactory大模型框架,可通过命令快速搭建大模型微调、蒸馏等应用场景
1
新增知识图谱项目新增KBQA智能问答模块,扩展知识图谱使用场景
1
新增基于Qwen/DeepSeek通义大模型的头条新闻分类项目,融入vllm、Deepseed等大模型部署和加速框架
1
优化部分底座大模型,更新为了行业领先大模型,比如QWen、DeepSeek
1
优化机器学习不常用数据挖掘算法,诸如SVM和朴素贝叶斯
1
优化知识图谱中项目架构,优化了NER、关系抽取的核心模型
1
优化基于Streamlit+LangChain搭建智能聊天机器人
1
优化大模型阶段优化为大模型微调、大模型智能体、大模型RAG、大模型前沿技术专题模块
1
新增就业实战冲刺阶段面试核心技能梳理升级,增加大模型核心面试题
1
友情提示更多学习视频+资料+源码,请在线咨询。
课程名称
人工智能AI进阶班/AI大模型开发
课程推出时间
2024.06.06
课程版本号
5.0
主要使用开发工具
PyCharm、DataGrip、Jupyter NoteBook
课程介绍
人工智能开发V5.0课程体系升级以企业需求为导向,专为培养和打造高级人工智能工程师、高含金量课程重磅推出,以业务为核心驱动项目开发,课程包括机器学习和深度学习框架Scikit-Learn和Pytorch,能够解决企业级数据挖掘、NLP自然语言处理、大模型开发与CV计算机视觉实际问题,通过理论和真实项目相结合,让学生能够掌握人工智能核心技术和应用场景。并推出「六项目制」项目教学,通过六个不同类型和开发深度的项目,使学员能够全面面对大部分企业人工智能应用场景。大型项目库,多行业多领域人工智能项目课程,主流行业全覆盖,其中项目课程包括了多行业13个场景的项目课程,让学生达到大厂的项目经验要求。课程消化吸收方面:V5.0在V4.0版本基础上迭代更新,加大了大模型开发比例,同时注重专业课的消化吸收,降低学习难度,提升就业质量。
全新升级四大课程优势,助力IT职业教育行业变革:
优势1:热门岗位全覆盖,匹配企业岗位需求,拓宽职业选择,实现阶段目标;优势2:与大厂合作,共建大模型课程,助力掌握前沿技术,增强就业竞争力;优势3:定制垂直领域大模型,专项领域赋能,打造就业薪资高,就业速度快的AI大模型人才;优势4:覆盖NLP,CV完整解决方案和技术栈,解决多业务场景问题。
1
更新Pytorch2.3.0
1
新增星火语音大模型
1
新增基于讯飞大模型定制平台的财经新闻情感分析项目
1
新增多风格英译汉翻译机项目
1
新增虚拟试衣项目
1
新增基于StableDiffusion的图像生成项目
1
新增大模型AI Agent开发应用
1
新增新零售行业评价决策系统
1
新增大模型搭建医疗问诊机器人
1
新增物流信息咨询智能问答项目
1
新增微博文本信息抽取项目
1
新增泛娱数据关系抽取项目
1
新增多模态技术及项目
1
友情提示更多学习视频+资料+源码,请加QQ:2632311208。
课程名称
人工智能AI进阶班
课程推出时间
2023.02.24
课程版本号
4.0
主要使用开发工具
Linux+PyCharm+Scikit-Learn+Pytorch+Neo4j+Docker
主要培养目标
以数据挖掘和NLP自然语言处理为核心方向,培养企业应用型高精尖AI人才
课程介绍
人工智能开发V4.0课程体系升级以企业需求为导向,专为培养和打造高级人工智能工程师、高含金量课程重磅推出,以业务为核心驱动项目开发,课程包括机器学习和深度学习框架Scikit-Learn和Pytorch,能够解决企业级数据挖掘、NLP自然语言处理与CV计算机视觉实际问题,通过理论和真实项目相结合,让学生能够掌握人工智能核心技术和应用场景。并推出「六项目制」项目教学,通过六个不同类型和开发深度的项目,使学员能够全面面对大部分企业人工智能应用场景。大型项目库,多行业多领域人工智能项目课程,主流行业全覆盖,其中项目课程包括了多行业13个场景的项目课程,让学生达到大厂的项目经验要求。课程消化吸收方面:V4.0在V3.0版本基础上迭代更新,注重专业课的消化吸收,降低学习难度,提升就业质量。
1
优化Python系统编程,针对人工智能必须的Python高阶知识体系重构课程,增加基础数据结构内容
1
新增机器学习部分[数据挖掘项目实战],以多场景业务为背景,通过SQL和Pandas完成数据处理与统计分析,夯实使用机器学习解决数据挖掘问题能力。
1
新增NLP方向[知识图谱项目],基于知识图谱的多功能问答机器人项目, 主要解决当前NLP领域中大规模知识图谱构建的问题和图谱落地的问题.知识图谱的构建主要分为知识构建和知识存储两大子系统. 包括知识构建, 知识存储, 知识表达, 路由分发, 结果融合等实现.最终呈现一个基于知识图谱的问答机器人。
新增[知识抽取项目],该项目针对于泛娱乐场景下复杂业务关系进行实体抽取,帮助企业构建知识图谱。
1
优化NLP方向[NLP基础课程]:修改文本数据增强方法,解决原始谷歌接口被限制调用的问题;优化Seq2Seq英译法案例,修改原始代码bug,提升模型的准确率;新增FastText模型架构介绍;加深FastText模型处理分类的问题的原理理解;新增Word2Vec训练两种优化策略,加速模型快速收敛。
1
优化计算机视觉CV基础:图像分类的经典网络,开山之作ALexNet,VGGNet,GoogLenNet,ResNeT,ResNetV2,VGGRep,SeNet,轻量型网络:mobileNet,shuffleNet,EfficientNet,模型微调,数据增强,cutmix,copypaste,mosaic,目标检测任务,IOU,Map,正负样本设计,smoothL1损失,RCNN系列网络架构:RCNN,FastRCNN,FasterRCNN,MaskRCNN,FPN结构,ROIpooling设计,anchor思想,RoiAlign设计,训练策略;yolo系列网络V1-V8:DarkNet,yolo-FPN特征融合,passthrough融合方法,多尺度训练,IOU系列损失,DIOU,CIOU,SIOU等,输出端的解耦,REP-PAN结构,E-ELAN结构,预测阶段的BN设计,SPP和SPPF结构
1
优化智慧交通项目:目标跟踪方法,运动模型的设计,DBT和DFT初始化方法,JIT的加速方法,yoloV7目标检测,REP的使用,检测辅助端的使用,E-ELAN的使用,backbone的实现,head结构的实现,数据分析,数据预处理,数据增强,模型训练,预测与评估,车辆检测,kalman的使用,预测和更新阶段,KM算法的匹配,匈牙利算法,IOU匹配,级联匹配,ReId特征提取,欧式距离,余弦距离,马氏距离计算,目标状态更新,Deepsort算法目标跟踪,代价矩阵的设计,虚拟线圈的设计,线圈位置的获取,双线圈检测车流量支持mac电脑的m1芯片和m2芯片的学习
课程名称
人工智能AI进阶班
课程推出时间
2022.01.20
课程版本号
3.0
主要培养目标
以机器学习和深度学习技术,培养企业应用型高精尖AI人才
主要使用开发工具
Linux+PyCharm+DataSpell+Pytorch+Tensorflow+Neo4j+Docer+k8s
课程介绍
人工智能V3.0课程体系升级以企业需求为导向,专为培养和打造高级人工智能工程师、高含金量课程重磅推出,以业务为核心驱动项目开发,课程包括机器学习和深度学习框架Pytorch和TensorFlow,能够解决企业级数据挖掘、NLP自然语言处理与CV计算机视觉实际问题,通过理论和真实项目相结合,让学生能够掌握人工智能核心技术和应用场景。并推出「六项目制」项目教学,通过六个不同类型和开发深度的项目,使学员能够全面面对大部分企业人工智能应用场景。大型项目库,多行业多领域人工智能项目课程,主流行业全覆盖,其中项目课程天数占比为100天,包括了多行业13个场景的项目课程,让学生达到大厂的项目经验要求。课程消化吸收方面:V3.0在V2.0版本基础上迭代更新,注重专业课的消化吸收,降低学习难度,提升就业质量。
1
优化优化Python系统编程,针对人工智能必须的Python高阶知识体系重构课程
1
新增[数据处理与统计分析阶段],以Linux为基础,通过SQL和Pandas完成数据处理与统计分析,为人工智能数据处理奠定技术基础。
1
优化优化机器学习算法,每个算法都兼具使用场景,数学推导过程及参数调优
1
新增[机器学习与多场景],增加多场景案例实战,包括用户画像,电商运营建模等多场景案例实战
1
新增数据挖掘方向[百京金融风控]项目,从反欺诈、信用风险策略、评分卡模型构建等热点知识,使得学员具备中高级金融风控分析师能力。
1
新增数据挖掘方向[万米推荐系统]项目,从多数据源采集、多路召回、基于机器学习算法粗排算法与基于深度学习精排,解决了在大数据场景下如何实现完整推荐系统,使得学员可以具备企业级推荐项目开发能力。
1
优化深度学习基础课由TensorFlow切换为Pytorch,面向零基础同学更加友好
1
优化NLP基础课程Transform基础和Attention注意力机制在原理之后增加英译汉的案例,加强学生对基础算法原理的理解
1
优化NLP基础课程迁移学习API版本变化问题,优化传统序列模型算法原理
1
新增NLP方向[蜂窝头条文本分类优化]项目,增强学生NLP算法优化方面技能
1
新增NLP方向[知识图谱]项目,通过本体建模,知识抽取,知识融合,知识推理,知识存储与知识应用方面,学生可以掌握完整知识图谱构建流程。
1
新增[面试加强课]通过巩固机器学习与深度学习基础算法,加强核心算法掌握,增加数据结构基础算法、动态规划算法、贪心算法等面试高频算法题,加强多行业人工智能案例理解与剖析
1
删除Ubuntu环境搭建开发环境
课程名称
人工智能AI进阶班
课程推出时间
2021.02.01
课程版本号
2.0
主要针对
python3 & python2
主要使用开发工具
linux+PyCharm+Pytorch+Tensorflow+OpenCV+neo4j+Docer+k8s
课程介绍
AI理论方面: 通过新的开发的文本摘要项目、传智大脑项目, 提升学员复杂模型训练和优化的能力。
AI工程化方面: 新增的算法工程化讲座, 直接面向一线公司实际开发场景和需求, 比如服务日志, A/B测试, Git提交, Docker, K8S部署等, 让学员亲临公司场景, 求职后更好的无缝衔接进企业级开发。
AI新热点和趋势: 通过增加量化、剪枝、知识蒸馏、迁移学习等一线优化技术, 让学生有更多处理问题的武器和思路;增加知识图谱热点、mmlab框架热点、YOLO1~5算法系列,能更好的匹配业界需求。
课程消化吸收方面:V2.0在V.1.x版本基础上迭代更新,注重专业课的消化吸收,降低学习难度,提升就业速度、就业质量。
1
新增NLP方向【文本摘要项目】:自动完成文本信息的主题提取,中心思想提取,可以类比京东,当当网的商品自动宣传文案;快速的将主要信息展示给用户, 广泛应用于财经, 体育, 电商, 医疗, 法律等领域。基于seq2seq + attention的优化模型,基于PGN + attention + coverage的优化模型,基于PGN + beam-search的优化模型,文本的ROUGE评估方案和代码实现:weight-tying的优化策略、scheduled sampling的优化策略。
1
新增AI基础设置类项目【传智大脑】,目前提供AI前端功能展示、AI后端模型部署、AI在线服务、AI模型训练功能等系统功能。AI开发服务提供了信息中心网咨辅助系统,文本分类系统、考试中心试卷自动批阅系统、CV统计全国开班人数等系统;综合NLP、CV和未来技术热点。
1
新增CV方向【人流量统计项目】:以特定商场、客服场景对人流量进行分析和统计。掌握mmlab框架、核心模块MMDetection;resnet骨架网络特征提取,SSD网络和Cascade R-CNN网络目标检测;利用剪枝,压缩和蒸馏等方法减小模型规模;完成前后端部署(Flask + Gunicorn)、模型部署(ONNX-runtime技术)。
1
优化NLP方向【AI在线医生项目】: 两个离线模型 (命名实体审核模型, 命名实体识别模型)的优化,提升准确率, 召回率,F1的效果。 一个在线模型 (句子主题相关模型)的优化, 重在量化, 压缩, 知识蒸馏, 提升处理速度并展示对比测试实验。
1
新增知识图谱热点案例:知识图谱编程、深化neo4j中的cypher代码, 相关案例。
1
新增计算机视觉目标检测热点算法YoLov1~v5 V1~V5模型的网络架构、输入输出、训练样本构建,损失函数设计;模型间的改进方法;多尺度检测方法、先验框设计;数据增强方法、多种网络架构及设计不同模型的方法。
1
优化计算机视觉专业课:RCNN系列网络进阶课程:FasterRCNN目标检测的思想,anchor(锚框)设计与实现,掌握RPN网络是如何进行候选区域的生成的,掌握ROIPooling的使用方法掌握fasterRCNN的训练方法,掌握RCNN网络的预测方法。
1
新增AI算法工程化专题:10个子案例展示算法工程化中的实际工程问题, 企业真实开发中的问题和解决方案。研发, 测试环境的异同, 服务日志的介绍和实现, A/B测试,模型服务风险监控,在线服务重要指标,Git提交与代码规范化,正式环境部署(Docker, K8S),,数据分析与反馈。
课程名称
人工智能AI进阶班
课程推出时间
2020.6.1
课程版本号
1.5
主要针对版本
python3 & python2
主要使用开发工具
linux+PyCharm+Pytorch+Tensorflow
课程介绍
以周为单位迭代更新课程,包括机器学习、自然语言处理NLP、计算机视觉、AI算法强化等课程。同时为了更好的满足人工智能学员更快速的适应市场要求,推出了自然语言处理NLP案例库、计算机视觉CV案例库、面试强化题等等。同时也增加职业拓展课,学生学习完AI课程以后,可在职学习:推荐系统、爬虫、泛人工智能数据分析。
1
新增计算机视觉CV案例库
1
新增自然语言处理案例库
1
新增AI企业面试题
1
新增算法强化课程
1
新增计算机视觉强化课
课程名称
人工智能AI进阶班
课程推出时间
2019.12.21
课程版本号
1.0
主要针对版本
Python3 & Python2
主要使用开发工具
linux+PyCharm+Pytorch+Tensorflow
课程介绍
人工智能赋能实体产业的规模以每年40%的速度递增,人工智能人才在计算机视觉CV、自然语言处理NLP、数据科学的推荐广告搜索的需求越来越明确。传智教育研究院经过2年潜心研发,萃取百余位同行经验,推出全新的人工智能1.0课程。全新的人工智能课程体系具有以下优势:
1)六个月高级软件工程师培训课程。精准定位、因材施教,人工智能和Python开发分成两个不同的班型进行授课。
2)理论+实践培养AI专精型人才。如何培养人才达到企业的用人标准?传智教育提出了课程研发标准:1、AI理论方面,培养学员AI算法研究能力:AI算法实用性、先进性、可拓展性;2、AI实践方面,培养学员利用AI理论解决企业业务流的能力。
3)多领域多行业项目,全生态任性就业。设计多领域多行业项目有:智能交通项目(CV)、 实时人脸检测项目(CV)、在线AI医生项目(NLP)、智能文本分类项目(NLP)、泛娱乐推荐项目(CV+推荐)、CT图像肺结节自动检测项目(CV)、小智同学-聊天机器人(NLP)、场景识别项目(CV)、在线图片识别-商品检测项目(CV)、黑马头条推荐系统(推荐+数据科学)。
4)AI职业全技能(NLP、CV、数据科学-推荐广告搜索),涵盖8大主流就业岗位。视觉处理工程师(CV)、自然语言处理工程师(NLP)、推荐系统工程师、机器学习工程师、深度学习工程师、数据分析工程师、数据挖掘工程师、知识图谱工程师。
5)课程设置科学合理,适合AI技术初学者。
6)技术大牛倾力研发,专职沉淀AI新技术。
1
新增机器学习进阶课程
1
新增计算机视觉项目:实时人脸检测项目、智能交通项目
1
新增自然语言处理NLP项目:在线AI医生项目、智能文本分类项目
1
新增算法强化课程:进化学习、分布式机器学习、数据结构强化
教师录取率<3%,从源头把控师资,带你过关斩将掌握每一个知识点
用数据驱动教学,贯通教/学/练/测/评,为每一位学员私人定制学习计划和就业服务
学前入学多维测评
学前目标导向式学习
学中随堂诊断纠错
学中阶段效果测评
学后在线作业试题库
学后问答社区查漏补缺
保障BI报表数据呈现
就业面试指导就业分析
就业流程
全信息化处理
学员能力
雷达图分析
定制个性化
就业服务
技术面试题
讲解
就业指导课
面试项目分析
HR面试攻略
模拟企业
真实面试
专业简历指导
面试复盘辅导
风险预警
企业黑名单提醒
老学员毕业后即可加入传智汇精英社区,持续助力学员职场发展
传智教育旗下IT互联网精英社区,以汇聚互联网前沿技术为核心,以传递、分享为己任,联合经纬创投、创新工场、京东人工智能、华为等众多关注互联网的知名机构及企业、行业大咖,共同研究中国互联网深度融合、跨界渗透、整合汇聚、相互促进的信息化资源共享平台。
行业沙龙
高端人脉
职场资源
技术研习
9970元/月平均薪资
15900元/月最高薪资
100%就业率
58人月薪过万
*学员就业信息统计数据为数据库中实时调取的真实相关数据,非广告宣传