Skip to content
forked from Ewenwan/MVision

机器人视觉 无人驾驶 视觉SLAM ORB LSD SVO DSO 深度学习目标检测yolov3 行为检测 opencv PCL 双目视觉

Notifications You must be signed in to change notification settings

wujixiu/MVision

Repository files navigation

MVision Machine Vision 机器视觉

学习无人驾驶车,你所必须知道的

强化学习从入门到放弃的资料

台大 机器学习深度学习课程

斯坦福CS231计算机视觉2017

2018 MIT 6.S094 麻省理工深度学习和自动驾驶课程 中文

MIT 深度学习和自动驾驶课程 英文

DeepTraffic

SegFuse: Dynamic Driving Scene Segmentation

DeepTesla - End-to-End Steering Model

公司

视觉领域的部分国内公司

初创公司:

图普科技

Face++

Linkface

Minieye

知图Cogtu

商汤科技Sensetime

亮风台Hiscene

掌赢科技

格灵深瞳DeepPG

凌感科技usens

图森TuSimple

中科视拓Seetatech(山世光)

第四范式

上市公司:

百度DL实验室

腾讯优图

阿里高德

暴风魔镜

搜狗

乐视tv

奇虎360

京东实验室

阿里巴巴

联想研究院

华为研究院

知名外企:

佳能信息

索尼研究院

富士通研发中心

微软研究院

英特尔研究院

三星研究院

0 计算摄影 摄影几何

计算摄影方面的部分课程讲义 相机内部图像处理流程 pdf

相机 = 光测量装置(Camera = light-measuring device)
    照明光源(Illumination source)(辐射(radiance)) --> 
    场景元素(Scene Element)   --->
    成像系统(Imaging System)  --->
    内部图像平面(Internal Image Plane) --->
    输出(数字)图像(Output (digital) image) 
图像 = 辐射能量测量(Image = radiant-energy measurement)  


现代摄影流水线 Modern photography pipeline 
场景辐射 ---> 相机前端(镜头过滤器 镜头Lens 快门Shutter 孔径) ---> 
相机内部(ccd响应response(RAW) CCD插值Demosaicing (原)) ---> 
相机后端处理(直方图均衡Hist equalization、空间扭曲Spatial warping)---> 输出



透过棱镜的白光  “White light” through a prism  ------> 折射光(Refracted light)----> 光谱 Spectral  
我们的眼睛有三个受体(锥细胞),它们对可见光作出反应并产生颜色感。

CSC320S: Introduction to Visual Computing 视觉计算导论

Facebook surround 360 《全景图拼接》

    输入:17张raw图像,包括14张side images、2张top images、1张bottom image
    输出:3D立体360度全景图像  

博客笔记

深度摄影风格转换 Deep Photo Style Transfer

图像形变 Image warping

参考

色彩增强/转换 Color transfer

参考

图像修补 Image repair

参考

图像去噪 Image denoise

参考

图像去模糊 Image deblur

参考

图像滤波 Image filter

参考

超分辨率 Super-resolution

参考

1 三维重建 3D Modeling

参考

相机矫正 Camera calibration

参考

非刚体重建 Non-rigid modeling 

参考

三维重构 3D modeling

参考 视觉SLAM

Self-augmented Convolutional Neural Networks

运动估计 motion estimation

面部变形 face morphing 

三维重建方面的视觉人物

2 匹配/跟踪 Matching & Tracking

参考

2.a 特征提取 Feature extraction

参考

2.b 特征匹配 Feature matching

参考

2.c 时空匹配 Space-time matching

参考

2.d 区域匹配 Region matching

参考

2.e 轮廓匹配 Contour matching

参考

2.f 立体匹配 Stereo matching

参考

双目视觉自动驾 场景物体跟踪paper

kitti双目数据集解决方案

将深度神经网络用于将2D电影转换为3D电影的转换

神经网络 双目匹配

中山大学张弛博士

MeshStereo: A Global Stereo Model with Mesh Alignment Regularization for View Interpolation
1、讨论了立体视觉匹配(Stereo Matching)问题的定义及其与人眼感知深度的关系;
2、对Matching Cost Volume进行了可视化分析,以期望达到听者对其的直观且本质的理解;
3、讨论了立体视觉匹配问题中的四个经典方法(
    Graph Cut,Adaptive Support Weight Aggregation, 
    Semi-Global Matching, 
    以及 PatchMatch Stereo);
4、讨论了MeshStereo的试图统一disparity求解以及网格生成两个步骤的motivation,
    以及formulate这样一个unified model会遇到的困难;
5、讨论了MeshStereo引入splitting probability的解决方案及其优化过程。

Webinar最后展示了MeshStereo在深度估计以及新视角渲染两个任务中的结果。

Stereo Matching Using Tree Filtering non-local算法在双目立体匹配上的应用

2.g 深度匹配 depth matching

深度匹配 depth matching

2.h 姿态跟踪 Pose tracking

参考

2.i 物体跟踪 Object tracking

参考

2.j 群体分析 Crowd analysis

参考 群体运动度量

2.k 光流场跟踪 Optical flow

参考

3 语义/实例分割&解析 Segmentation & Parsing

参考

3.a 视频分割 Video segmentation

参考

3.b 人体解析 Person parsing

参考

person parsing

3.c 场景解析 Scene parsing

scene parsing 参考

3.d 边缘检测 Edge detection

参考 边缘检测

3.e 图像物体分割 Image object segmentation

参考

3.f 视频物体分割 Video object segmentation

参考 object segmentation

3.g 交互式分割 Interactive segmentation

参考

3.h 共分割 Co-segmentation

参考

3.i 背景差 Background subtraction

参考

3.j 图像分割方面 Image segmentation

参考

4 识别/检测 Recognition & Detection

参考

4.a 其他识别 Other recognition

参考

4.b 图像检索 Image retrieval

参考

4.c 显著检测 Saliency detection

参考

4.d 通用物体检测 Object proposal

参考

4.e 行为识别 Action recognition

参考

4.f 物体识别 Object recognition

参考

4.g 行人检测 Human detection

参考

4.h 人脸解析 Face Parsing

参考

4.i 纹理分析 Texture Analysis

纹理分析 Texture Analysis 相关人物

5 机器学习 Maching Learning

参考

5.a 生成对抗网络 GAN Generative Adversarial Networks

参考

5.b 深度学习 Deep learning

参考 深度学习方面的部分课程讲义

CNN Models 卷积网络模型

Deep Learning Libraries 深度学习软件库

深度学习方面的部分视觉人物

5.c 能量优化 Energy optimization

参考

5.d 模型设计 Model design

参考

5.e 空间降维 Dimention reduction

参考

5.f 聚类 Clustering

参考

5.g 分类器 Classifier

参考

6 开源库 Open library

参考

7 数据集 Public dataset

参考

7.a 其他方面 Other datasets

参考 人脸检测Face tracking and recognition database

人脸检测Caltech 10,000 Web Faces

人脸检测Helen dataset

深度图 RGB-D dataset

视频分割 2010 ECCV Efficient Hierarchical Graph Based Video Segmentation

手势跟踪 Hand dataset

手势跟踪2

车辆检测 2002 ECCV Learning a sparse representation for object detection

7.b 人体检测 dataset on human annotation

参考 Caltech Pedestrian Detection Benchmark

Ethz bleibe

RGB-D People Dataset

TUD Campus 382

PSU HUB Dataset

Pedestrian parsing

Human Eva

7.c 物体识别 dataset on object recognition

参考

e-Lab Video Data Set

Image Net

Places2 Database

Microsoft CoCo: Common Objects in Context

PASCAL VOC MIT’s Place2

7.d 显著检测方面 dataset on saliency detection

参考

视觉显著性检测技术发展情况

2012 ECCV Salient Objects Dataset (SOD)

2012 ECCV Neil D. B. Bruce Eye Tracking Data

2012 ECCV DOVES:A database of visual eye movements

2012 ECCV MSRA:Salient Object Database

2012 ECCV NUS: Predicting Saliency Beyond Pixels

2012 ECCV saliency benchmark

2010 ECCV The DUT-OMRON Image Dataset

2010 ECCV An eye fixation database for saliency detection in images

7.e 行为识别 dataset on action recognition

参考

UCF ChaoticInvariants datasetsActions

Hollywood Human Actions dataset data

Weizmann: Actionsas Space-Time Shapes

KTH

UMD

HMDB: A Large Video Database for Human Motion Recognition

Collective Activity Dataset

MSR Action Recognition Datasets and Codes

Visual Event Recognition in Videos

7.f 物体分割 dataset on object segmentation

参考 microsoft MSRC-V2

2010 CVPR iCoseg: Interactive cosegmentation by touch

2010 CVPR Caltech-UCSD Birds 200

2010 CVPR Flower Datasets

2009 ICCV An efficient algorithm for co-segmentation

2008 CVPR Unsupervised Learning of Probabilistic Object Models (POMs) for Object Classification, Segmentation and Recognition

2008 CVPR Caltech101

2004 ECCV The Weizmann Horse Database

7.g 场景解析 dataset on scene parsing

参考

ImageNet

ADE 20k

Cityscapes

COCO

Lab, Koch

uiuc, D hoiem

mit, cbcl

mit LabelMeVideo

2013 BMVC Hierarchical Scene Annotation

2010 ECCV SuperParsing: Scalable Nonparametric Image Parsing with Superpixels

2009 CVPR Nonparametric Scene Parsing: Label Transfer via Dense Scene Alignment

2009 Scene Understanding Datasets

2008 IJCV 6D-Vision

2008 IJCV The Daimler Urban Segmentation Dataset

2008 ECCV Motion-based Segmentation and Recognition Dataset)/CamVid/

2008 York Urban Dataset

2008 IJCV LabelMe

8 会议 期刊 

CVPR Computer vision and Pattern Reconition 计算机视觉和模式识别

ECCV European Conference on Computer Vision 欧洲计算机视觉国际会议

ICCV IEEE International Conference on Computer Vision 国际计算机视觉大会

其他

其他

AR&VR

参考

About

机器人视觉 无人驾驶 视觉SLAM ORB LSD SVO DSO 深度学习目标检测yolov3 行为检测 opencv PCL 双目视觉

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • C++ 43.8%
  • Makefile 23.8%
  • Python 23.5%
  • CMake 4.6%
  • C 3.9%
  • Shell 0.2%
  • Cuda 0.2%