中培伟业企业IT内训课程
您现在的位置:首页 > 企业内训 > 人工智能 > Python+计算机图像(视觉)处理

Python+计算机图像(视觉)处理

2022-04-27 09:06:36 | 来源:中培企业IT培训网
一、培训简述
课程中通过细致讲解,使学员掌握该技术的本质。具体收益包括:
1.掌握OpenCV的使用;
2.理解卷积神经网络;
3.掌握Tensorflow的使用;
4.掌握keras的使用;
5.通过各个应用场景的实际经典项目案例,深入解读计算机视觉技术的应用。

二、培训特色
本次培训从实战的角度对计算机视觉技术进行了全面的剖析,并结合实际案例分析和探讨计算机视觉技术的应用场景,给计算机视觉技术相关从业人员以指导和启迪。

三、培训时长
共计3天,每天6课时

四、培训大纲
日程 培训模块 培训内容
第一天
上午
OpenCV使用   1.安装opencv
  2.图像处理基础
  3.图像运算和转换
  4.图像平滑处理
  5.图像梯度
  6.图像边缘检测
  7.图像金字塔
  8.人脸检测和识别
第一天
下午
卷积神经网络介绍   1.CNN架构
  2.卷积计算
  3.卷积的步长
  4.池化
  5.Padding
  6.MNIST网络结构介绍
第二天
上午
Tensorflow使用   1.深度学习框架介绍
  2.Tensorflow安装
  3.Tensorlfow基础知识
  4.Tensorflow线性回归
  5.Tensorflow非线性回归
  6.Mnist数据集合Softmax讲解
  7.使用BP神经网络搭建手写数字识别
  8.交叉熵(cross-entropy)讲解和使用
  9.过拟合,正则化,Dropout
  10.各种优化器Optimizer
  11.改进手写数字识别网络
  12.卷积神经网络CNN的介绍
  13.使用CNN解决手写数字识别
第二天
下午
keras使用   1.实现线性回归
  2.实现非线性回归
  3.MNIST数据集以及Softmax介绍
  4.MNIST分类程序
  5.交叉熵的应用
  6.Dropout应用
  7.正则化应用
  8.优化器介绍及应用
  9.CNN应用于手写数字识别
  10.cifar-10图片分类
  11.模型的保存和载入
  12.绘制网络结构
第三天
上午
图像识别项目   1.介绍Google图像识别模型Inception-v3
  2.使用Inception-v3做图像识别
猫狗分类项目   1.图像数据预处理
  2.猫狗分类-简单CNN
  3.猫狗分类-VGG16-bottleneck
  4.猫狗分类-VGG16-Finetune
验证码识别项目 1.多任务学习介绍
  2.验证码识别项目
第三天
下午
目标检测项目   1.目标检测任务介绍
  2.RCNN/Fast-RCNN/Faster-RCNN算法介绍
  3.YOLO算法介绍
  4.SSD算法介绍
  5.目标检测项目实战
目标分割项目   1.目标分割任务介绍
  2.全卷积网络
  3.双线性上采样
  4.特征金字塔
  5.Mask RCNN算法介绍
  6.目标分割项目实战
图像风格迁移项目 1.图像风格迁移介绍
  2.图像风格迁移项目实战
GAN项目 1.生成式对抗网络GAN介绍
  2.生成式对抗网络GAN项目实战
 
(注:大纲还可根据需求进行调整)

覃棅丰
创业公司技术负责人。机器学习,深度学习领域多年一线开发研究经验,精通算法原理与编程实践。曾使用Tensorflow,Caffe,Keras等深度学习框架完成过多项图像,语音,nlp,搜索相关的人工智能实际项目,研发经验丰富。拥有两项国家专利,同时具有多年授课培训经验,讲课通熟易懂,代码风格简洁清晰。
 
人工智能相关工作经历:
上海希格斯网络科技有限公司  数据挖掘工程师   
1.负责深度学习NLP算法的研究和实现。
2.负责搜索引擎的实现和优化。
 
上海索洛信息技术有限公司     高级算法工程师   
1.负责深度学习图像算法的研究和实现。
2.负责深度学习语音算法的研究和实现。
 
人工智能相关项目经验:
人岗匹配项目 负责算法实现   
● 收集了10万份JD。
● 基于Tensorflow平台使用LSTM+Attention算法。
● 使用JD训练职位推荐模型。训练好的模型可用于分析简历描述,并根据简历描述推荐一个或多个适合的职位。
 
项目关键词提取项目  负责算法实现   
● 收集了10万份项目描述,并标记好项目中的关键词。
● 基于Tensorflow平台使用seq2seq模型。
● 从简历的项目描述中提取出该项目中的重点词汇。可用于优化简历项目搜索结果。
 
人才搜索引擎项目  负责搜索引擎的实现和优化
● 搭建简历搜索引擎服务。
● 完成学校名,专业,公司,行业等模块的搜索策略
● 完成搜索结果高亮服务。
● 修改搜索bug优化搜索算法。
 
宠物脸识别项目  负责数据处理,算法实现    
● 收集了5万张狗/猫的照片,并标记好它们脸部的区域。
● 在Linux下基于Caffe平台使用Faster-rcnn实现狗/猫脸检测算法。
● 推出了一款在线小游戏,用户上传自己家狗/猫的照片,服务器接收到照片之后用训练好的模型检测照片中狗/猫的脸,并把狗/猫的脸框出来,给它们的长相打一上个分数,再把处理后的照片反馈给用户。 
 
宠物品种识别项目 负责数据处理,算法实现  
● 收集了19种猫和27种狗的照片,共3万多张,并做好分类标签。
● 基于Caffe平台使用AlexNet,GoogleNet以及自己设计的网络实现宠物品种分类算法。
● 推出了一款在线小游戏,用户上传自己家狗/猫的照片,服务器接收到照片之后用训练好的模型检测照片中狗/猫的品种,不同宠物的品种会对应不同明星的脸,再把与宠物品种相似的明星脸反馈给用户。 
 
宠物叫声情感分类项目  负责数据处理,算法实现
● 收集了1万6千条狗叫声,分成8个类别。
● 基于Tensorflow平台使用CNN,LSTM实现狗叫声情感分类算法。
● 将训练好的模型放到嵌入式设备中,实时判断当前场景是否有狗叫声,有狗叫声的话是属于什么分类。