技术标签: 机器学习 计算机视觉 图像处理 深度学习 目标检测 人工智能
作者简介: CSDN、阿里云人工智能领域博客专家,新星计划计算机视觉导师,百度飞桨PPDE,专注大数据与AI知识分享。公众号:GoAI的学习小屋 ,免费分享书籍、简历、导图等,更有交流群分享宝藏资料,关注公众号回复“加群”或️链接 加群。
AI学习星球推荐: GoAI的学习社区 知识星球是一个致力于提供《机器学习 | 深度学习 | CV | NLP | 大模型 | 多模态 | AIGC 》各个最新AI方向综述、论文等成体系的学习资料,配有全面而有深度的专栏内容,包括不限于 前沿论文解读、资料共享、行业最新动态以、实践教程、求职相关(简历撰写技巧、面经资料与心得)多方面综合学习平台,强烈推荐AI小白及AI爱好者学习,性价比非常高!加入星球️点击链接
说明:本系列深度学习资料集合包含机器学习、深度学习等各系列教程,主要以计算机视觉资料为主,包括图像识别、分类、检测、分割等,内容参考Github及网络资源,仅供个人学习。侵权联系删除!
深度学习定义:一般是指通过训练多层网络结构对未知数据进行分类或回归
深度学习分类:
有监督学习方法——深度前馈网络、卷积神经网络、循环神经网络等;
无监督学习方法——深度信念网、深度玻尔兹曼机,深度自编码器等。
图像分类(物体识别):整幅图像的分类或识别
物体检测:检测图像中物体的位置进而识别物体
图像分割:对图像中的特定物体按边缘进行分割
图像回归:预测图像中物体组成部分的坐标
语音识别:将语音识别为文字
声纹识别:识别是哪个人的声音
语音合成:根据文字合成特定人的语音
语言模型:根据之前词预测下一个单词。
情感分析:分析文本体现的情感(正负向、正负中或多态度类型)。
神经机器翻译:基于统计语言模型的多语种互译。
神经自动摘要:根据文本自动生成摘要。
机器阅读理解:通过阅读文本回答问题、完成选择题或完型填空。
自然语言推理:根据一句话(前提)推理出另一句话(结论)。
图像描述:根据图像给出图像的描述句子
可视问答:根据图像或视频回答问题
图像生成:根据文本描述生成图像
视频生成:根据故事自动生成视频
手写机器学习笔记 github
机器学习算法公式推导以及numpy实现 github
人工智能相关术语 link
周志华《机器学习》手推笔记 github
机器学习算法 基于西瓜书以及《统计学习方法》 github
机器学习与深度学习基础概念介绍 link
怎样写一个深度学习框架 link
深度学习算法地图 link
卷积神经网络的感受野 link
「深」为什么重要,以及还有什么深的网络 link
深度学习入门之激活层及其选择的建议 link
深度学习如何优化神经网络结构|架构 link
深度学习“科学炼丹”手册 link
深度学习训练tricks整理 数据增强等技巧 link
pytorch图卷积库 github
AI模型序列化总结 github
AiLearning 传统机器学习的讲解、分析和代码github
CNN真的需要下采样(上采样)吗? link
构建深度神经网络,我有20条「不成熟」的小建议 link
feature map 相加和拼接的不同 link
你有哪些deep learning(rnn、cnn)调参的经验? link
目标检测的综述 link
常见的模型算法评估指标 link
GAN万字长文综述 link
神经网络压缩综述 link
细粒度图像分析综述 link
人脸识别损失函数综述 link
OCR papernote github
图像分割综述 link
图像内容鉴黄算法综述 link
AI技术三大应用领域:智能医疗、自动驾驶、智慧营销产业发展现状分析 link
深度学习模型在各大公司实际生产环境的应用讲解文章 github
AlexNet
ImageNet Classification with Deep Convolutional Neural Networks
中文版
中英文对照
VGG
Very Deep Convolutional Networks for Large-Scale Image Recognition
中文版
中英文对照
ResNet
Deep Residual Learning for Image Recognition
中文版
中英文对照
GoogLeNet
Going Deeper With Convolutions
中文版
中英文对照
BN-GoogLeNet
Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift
中文版
中英文对照
Inception-v3
Rethinking the Inception Architecture for Computer Vision
中文版
中英文对照
轻量级卷积神经网络的设计技巧 link
MixNet-Pytorch github
ShuffleNet 官方开源github
为什么MobileNet及其变体如此之快 github
dabnn 二值网络 github
神经网络量化简介 github
手机端高性能卷积神经网络推理引擎概览 github
学习参考(强推):link
损失函数技术总结 link
根据标签分布来选择损失函数 link
深度学习多目标优化的多个loss应该如何权衡 link
归一化方法总结 link
Kaggle图像分割比赛中的损失函数及keras实现 link
11个重要的机器学习模型评估指标 link
IQA-optimization 图像质量的损失函数 github
regression-losses-pytorch github
分类回归损失函数汇总 link
Learned Perceptual Image Patch Similarity (LPIPS) metric github
超分损失函数小结 link
DataGene - 识别数据集之间的相似度 github
FAT:一种快速的Triplet Loss近似方法,学习更鲁棒的特征表示,并进行有噪声标签的提纯 link github
用于医学图像分割的损失函数 link
目标检测回归损失函数简介:SmoothL1/IoU/GIoU/DIoU/CIoU Loss [link]
CNN模型合集 link
分类实现合集 pytorch github
让CNN有了平移不变性 link
lottery-ticket-hypothesis github
pytorch_image_classification github
deeplearning-modelsgithub
EfficientNets-PyTorch 2019 github
ML_GCN PyTorch implementation of Multi-Label Image Recognition with Graph Convolutional Networks, CVPR 2019 github
pytorch_highway_networks github
推崇的CNN架构 link
图卷积网络Numpy实现 link
PeleeNet-基于手机系统的实时网络 link
TResNet: High Performance GPU-Dedicated Architecture github
ResNeSt 李沐团队提出最强ResNet改进版,多项任务达到SOTA github
SCNet - PyTorch官方实现CVPR 2020论文“使用自校准卷积改进卷积网络” github
SimCLR 对比学习得到一个好的视觉预训练模型 link
SimCLR框架的理解和代码实现以及代码讲解 link
RepVGG 2021 link
github nightly torch_stable pytorch_lightning
opencv基础教程csdn
OpenCV中文官方文档 link
facechanging 变脸 github
AI美颜系列 CSDN
图像处理算法 博客园
图像的模糊检测方法 link
图像保边滤波算法集锦系列 github
只(挚)爱图像处理 link
Photoshop 算法原理 link
图像处理初学者设计的 100 个问题 github
YOLO
You Only Look Once: Unified, Real-Time Object Detection
中文版
中英文对照
YOLO9000
YOLO9000: Better, Faster, Stronger
中文版
中英文对照
Deformable-ConvNets
Deformable Convolutional Networks
中文版
中英文对照
Faster R-CNN
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
中文版
中英文对照
R-FCN
R-FCN: Object Detection via Region-based Fully Convolutional Networks
中文版
中英文对照
目标检测之Neck选择 link
详解目标检测中边界框的回归策略 link
目标检测中的特征冲突与不对齐问题 link
小目标检测学习汇总 link
在物体检测中搞定小目标 link
在目标检测中如何解决小目标的问题? link
目标检测中Anchor的本质分析 github
利用YOLOv3结合行人重识别模型,实现行人的检测识别,查找特定行人 github
CBNet:一种用于目标检测的复合骨干网络体系结构 2019 github
单级目标检测:YOLO与SSD,我选SSD!!! link
【SSD算法】史上最全代码解析-核心篇 github
MXNet的一个开源项目gluoncv里的yolov3代码,写了一份中文注解 github
faster-rcnn pytorch github
Why anchor link
Double-Head RCNN 通过增加多个head提升准确率github
对YOLOv3做模型剪枝 pytorch 2019 github
simpledet NAS-FPN 2019 mxnetgithub
PoolNet pytorch 2019 github
2018云从人头技术 冠军方案分享 github
目标检测进化史 link
ThunderNet: 轻量级实时检测网络
mmdetection github
Rapid satellite imagery object detection 2018 github
Yolo系列检测器的pytorch实现 github
awesome-object-detection github
deep_learning_object_detection github
RFCN_CoupleNet pytorch github
Yolo-v2 pytorch github
RFBNet pytorch github
CFENet pytorch github
BiSeNet pytorch github
kaggle 大白鲸目标检测 github
R-FCN+ResNet-50用自己的数据集训练模型 link
trident net + refinedet 目标检测 github
基于SSD框架在建筑工地上检测安全帽的佩戴并识别安全帽的相应颜色 link
基于 Mask R-CNN 的街景广告检测与模糊 tensorflow github
yolov3通道和图层修剪 github
YOLOv3+ASFF(自适应空间特征融合)组合,性能优于CornerNet和CenterNet等 github
使用通道修剪的Stronger-Yolo的Pytorch实现 github
Gaussian YOLOv3的PyTorch实现 github
PyTorch实现的EfficientDet(可扩展且高效的对象检测) github
Kaggle RSNA肺炎检测挑战赛中第一名解决方案的代码 github
天池大赛项目:天池新品实验室 - 淘宝直播商品识别 github
只用一页jupyter notebook完成Faster RCNN github
Pytorch版本中的Faster RCNN模型,已在ResGen 101的Visual Genome上进行了预训练 github
Faster-Rcnn:Two-Stage目标检测模型在Pytorch当中的实现 github
Scale-equalizing Pyramid Convolution for object detection github link
End-to-End Object Detection with Transformers 2020 github
yolov5 github
YOLOv3使用笔记——Kmeans聚类计算anchor boxes link
YOLO v4训练自己的数据集 link
深入浅出Yolo系列之Yolov3&Yolov4&Yolov5核心基础知识完整讲解 link
深入浅出Yolo系列之Yolov5核心基础知识完整讲解 link
You Only Look Twice: Rapid Multi-Scale Object Detection In Satellite Imagery 卫星图片多尺寸物体检测 link github
目标检测和感受野的总结和想法 link
目标检测算法anchor聚类实现(coco+voc)
小目标检测学习 link
BBAVectors:一种Anchor Free的旋转物体检测方法 link
Repulsion Loss 遮挡场景下的目标检测 link
mmdetection-mini github
1.8M超轻量目标检测模型NanoDet link
基于密度图的航空物体检测 link
Image-Level 弱监督图像语义分割汇总简析 link
CRNN
An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition
中文版
中英文对照
CTPN
Detecting Text in Natural Image with Connectionist Text Proposal Network
中文版
中英文对照
数学公式识别:基于编码-解码模型 link
MaskTextSpotter - 端到端可训练神经网络,用于发现任意形状文本的一个PyTorch实现 github
Text_Segmentation_Image_Inpainting 文件检测并修复 github
手写公式识别 :基于深度学习的端到端方法 github
基于MXNet的CTPN 身份证 github
深度学习实践文档检测 link
PyTorch实现的DenseBox多任务学习目标检测/关键点定位 github
增值税发票识别系统(OCR System of Invoice) link
文字相似度函数 pytorch github
深度学习与OCR论文合集 link
CCPD 车牌端对端识别及其250k的数据集 github
aster.pytorch github
Seq2Seq+Attention 中文OCR文字识别 pytorch github
A research project for text detection and recognition using PyTorch 1.2 github
AttentionOCR 2019 ocr检测和识别冠军 github
ABCNet - 利用自适应贝塞尔曲线网络实现的实时场景文本识别 github
运用unet实现对文档表格的自动检测,表格重建 github
条形图检测和坐标识别 github
超轻量级中文ocr,支持竖排文字识别, 支持ncnn推理 , psenet(8.5M) + crnn(6.3M) + anglenet(1.5M) 总模型仅17M github windows
通过Transformer实现的识别场景文本 github
pytorch_ctpn github
chinese_ocr CTPN + DenseNet + CTC github
一个基于CTPN+CRNN的OCR项目 github
更轻量的中文OCR github
汉字字符特征提取工具,可以提取出字符中的字音(声母、韵母、声调)、字形(偏旁、部首)、四角编码等特征,同时可作为tensor输入到模型 github
TextGenerator - OCR/文字检测/字体识别数据生成工具 github
《深度实践OCR:基于深度学习的文字识别》 随书代码 github
Table-OCR github
支持40+种语言和本地运行,这个OCR库轻松搞定光学字符识别 github
MaskTextSpotterV3端到端文本识别模型 github
手写及场景文字分析与识别的一些新尝试 link
PyTorch OCR模型的安卓端部署 link
基于Transformer文本识别模型的网络架构 link
车牌识别 模型部署翻车记:pytorch转onnx踩坑实录 link
古籍文档图像二值化:基于背景估计和能量最小化的方法 link
金山OCR识别框架KSAI-Toolkits [github](kingsoft-wps/KSAI-Toolkits (github.com))
Lightweight Image Super-Resolution with Information Multi-distillation Network (ACM MM 2019) github
图像超分:RealSR link
Open MMLab Image and Video Super-Resolution Toolbox, , including SRResNet, SRGAN, ESRGAN, EDVR, etc. MMSR:基于PyTorch的图像/视频超分辨率工具箱 github
FALSR 2019 小米 github
FixRes github
noise2noise-pytorch github
Pytorch实现多帧超分辨率(MFSR)网络HighRes-net github
去模糊GAN DeblurGANv2 github
High-Quality Self-Supervised Deep Image Denoising 2019 github
ABPN pytorch 2019 github
super-resolution github
超分辨率损失函数 link
使用具有批量重新归一化的深度CNN进行图像去噪 tensorflow 2019 github
Dandere2x github
Waifu2x-Extension-GUI github
generative_inpainting fillv2 github
srmd ncnn vulkan 通用图片超分放大工具 github
PyTorch实现“通过超高分辨率实现无损图像压缩” github
图像去模糊系列算法 link
MMSR 是基于PyTorch的开源图像和视频超分辨率工具箱,包括SRResNet,SRGAN,ESRGAN等 github
去雨网络(PReNet) github
2020年超越RCAN,图像超分又一峰 link
Software and pre-trained models for automatic photo quality enhancement using Deep Convolutional Networks github link
Deep Unfolding Network for Image Super-Resolution (CVPR, 2020) (PyTorch) github link
Generating RGB photos from RAW image files with PyNET (PyTorch) github
ZSSR link
2020超分辨算法CFSRCNN
如何恢复降采样后的高清图片?可逆图像缩放搞定 github
SRGAN
Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network
中文版
中英文对照
ESRGAN
ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks
中文版
中英文对照
arcmargin loss
triplet loss
quadruplet loss
eml loss
npairs loss
度量学习中关于排序损失函数的综述 link
在应用中使用度量学习的最简单方法,具有模块化、灵活和可扩展,采用PyTorch编写 link
注:本资料集合包含机器学习、深度学习等各系列教程,深度学习方向主要计算机视觉资料为主,内容参考Github及网络资源,后续会补充,仅供个人学习,侵权联系删除!
文章浏览阅读2.9k次,点赞8次,收藏14次。测试主要做什么?这完全都体现在测试流程中,同时测试流程是面试问题中出现频率最高的,这不仅是因为测试流程很重要,而是在面试过程中这短短的半小时到一个小时的时间,通过测试流程就可以判断出应聘者是否合适,故在测试流程中包含了测试工作的核心内容,例如需求分析,测试用例的设计,测试执行,缺陷等重要的过程。..._测试过程管理中包含哪些过程
文章浏览阅读870次,点赞16次,收藏19次。1.背景介绍政府数字化政务是指政府利用数字技术、互联网、大数据、人工智能等新技术手段,对政府政务进行数字化改革,提高政府工作效率,提升政府服务质量的过程。随着人工智能(AI)和机器学习(ML)技术的快速发展,政府数字化政务中的人工智能与机器学习应用也逐渐成为政府改革的重要内容。政府数字化政务的人工智能与机器学习应用涉及多个领域,包括政策决策、政府服务、公共安全、社会治理等。在这些领域,人工...
文章浏览阅读219次,点赞2次,收藏4次。系统主要的用户为用户、管理员,他们的具体权限如下:用户:用户登录后可以对管理员上传的学习视频进行学习。用户可以选择题型进行练习。用户选择小程序提供的考研科目进行相关训练。用户可以进行水平测试,并且查看相关成绩用户可以进行错题集的整理管理员:管理员登录后可管理个人基本信息管理员登录后可管理个人基本信息管理员可以上传、发布考研的相关例题及其分析,并对题型进行管理管理员可以进行查看、搜索考研题目及错题情况。_mysql刷题软件
文章浏览阅读1.4k次。myelipse里有UML1和UML2两种方式,UML2功能更强大,但是两者生成过程差别不大1.建立Test工程,如下图,uml包存放uml类图package com.zz.domain;public class User {private int id;private String name;public int getId() {return id;}public void setId(int..._根据以下java代码画出类图
文章浏览阅读174次。需求:一个topic包含很多个表信息,需要自动根据json字符串中的字段来写入到hive不同的表对应的路径中。发送到Kafka中的数据原本最外层原本没有pkDay和project,只有data和name。因为担心data里面会空值,所以根同事商量,让他们在最外层添加了project和pkDay字段。pkDay字段用于表的自动分区,proejct和name合起来用于自动拼接hive表的名称为 ..._flume拦截器自定义开发 kafka
文章浏览阅读380次。原标题:Java Spring中同时访问多种不同数据库 多样的工作要求,可以使用不同的工作方法,只要能获得结果,就不会徒劳。开发企业应用时我们常常遇到要同时访问多种不同数据库的问题,有时是必须把数据归档到某种数据仓库中,有时是要把数据变更推送到第三方数据库中。使用Spring框架时,使用单一数据库是非常容易的,但如果要同时访问多个数据库的话事件就变得复杂多了。本文以在Spring框架下开发一个Sp..._根据输入的不同连接不同的数据库
文章浏览阅读3.6k次,点赞9次,收藏25次。本案例描述了晶振屏蔽以及开关电源变压器屏蔽对系统稳定工作的影响, 硬件设计时应考虑。_eft电路图
文章浏览阅读1.1k次。对于物料价格的更改,可以采取不同的手段:首先,我们来介绍MR21的方式。 需要说明的是,如果要对某一产品进行价格修改,必须满足的前提条件是: ■ 1、必须对价格生效的物料期间与对应会计期间进行开启; ■ 2、该产品在该物料期间未发生物料移动。执行MR21,例如更改物料1180051689的价格为20000元,系统提示“对于物料1180051689 存在一个当前或未来标准价格”,这是因为已经对该..._mr21 对于物料 zba89121 存在一个当前或未来标准价格
文章浏览阅读7.4k次,点赞3次,收藏13次。[文章导读]联想启天M420是一款商用台式电脑,预装的是win10系统,用户还是喜欢win7系统,该台式机采用的intel 8代i5 8500CPU,在安装安装win7时有很多问题,在安装win7时要在BIOS中“关闭安全启动”和“开启兼容模式”,并且安装过程中usb不能使用,要采用联想win7新机型安装,且默认采用的uefi+gpt模式,要改成legacy+mbr引导,那么联想启天M420台式电..._启天m420刷bios
文章浏览阅读2.7k次,点赞2次,收藏9次。一,为什么要冗余数据互联网数据量很大的业务场景,往往数据库需要进行水平切分来降低单库数据量。水平切分会有一个patition key,通过patition key的查询能..._保证冗余性
文章浏览阅读88次。是时候闭环Java应用了 原创 2016-08-16 张开涛 你曾经因为部署/上线而痛苦吗?你曾经因为要去运维那改配置而烦恼吗?在我接触过的一些部署/上线方式中,曾碰到过以下一些问题:1、程序代码和依赖都是人工上传到服务器,不是通过工具进行部署和发布;2、目录结构没有规范,jar启动时通过-classpath任意指定;3、fat jar,把程序代码、配置文件和依赖jar都打包到一个jar中,改配置..._那么需要把上面的defaultjavatyperesolver类打包到插件中
文章浏览阅读909次。1.得下载一个番茄插件,按alt+g才可以有函数跳转功能。2.不安装番茄插件,按F12也可以有跳转功能。3.进公司的VS工程是D:\sync\build\win路径,.sln才是打开工程的方式,一个是VS2005打开的,一个是VS2013打开的。4.公司库里的线程接口,在CmThreadManager.h 里,这个里面是我们的线程库,可以直接拿来用。CreateUserTaskThre..._番茄助手颜色