计算机视觉预训模型一览表

2020-07-17 13:28:01

本项目是一个更快、更快的R-CNN实现,旨在加速训练更快的R-CNN目标检测模型。

Deep Video Analytics是一个从视频和图像中索引和提取信息的平台。

该软件实现了卷积递归神经网络(CRNN),它是CNN、RNN和CTC Lost的组合,用于基于图像的序列识别任务,如场景文本识别和OCR。

序列标注模型广泛应用于命名实体识别(NER)、词性标注(POS)和分词等自然语言处理任务中。

这是更快的RCNN的PyTorch实现。该项目主要基于py-FAST-RCNN和TFFRCNN。有关R-CNN的详细信息,请参阅任少青、何开明、Ross Girshick、孙健的论文FASTER R-CNN:用区域建议网络进行实时目标检测。

这段代码允许使用Facebook AI Research和PyTorch的一些Detectron模型进行对象检测。

本文探讨了利用对象中的极值点(最左、最右、最上、最下)作为输入,对图像和视频进行精确的对象分割。

该存储库包括非官方实现、用于图像字幕的自我临界序列训练,以及用于图像字幕和视觉问题回答的自下而上和自上而下的注意。

CVPR2019中通过视频传播和标签松弛改进语义分割的PyTorch实现。