CoCoOp给文本编码器带来了可变的prompt,而Maple给视觉编码器也带来了可变的prompt,不觉得这很酷吗,我觉得这真是太酷了,满足了我对CLIP最终形态的想象。 最近有点忙,闲下来会再修订…
阅读CoCoOp之前,对CLIP的源码没有过多熟悉,所以本篇也是边读边学,尽可能的让本篇代码解读层次递进的包含Transformer,CLIP,以及CoCoOp的主要代码实现,说明关联的原理。若有不清…
前言 最近投入进了FAS的怀抱,但是对这个新领域知之甚少,所以本文将作为该任务类型的梳理,对其任务常用的动机和提出方法进行汇总梳理,确保能够熟悉该任务,在面对该领域新的模型时不至于一头雾水。 本文将基…
前言 本文将整理SA-FAS[1]官方代码实现中的数据预处理部分,以便用于在其他项目当中(如GAC-FAS),按照相同的数据格式进行测试。 预先准备 文件 预处理代码在项目中是./preprocess…
BN 整体结构 前向传播 特点 BN在第一步和第二步中对输入的特征进行求均值和求标准差,后将其标准化,具体公式参考上图2-3部分。[2] 批次标准化最重要的内容是第三步是引入了两个可学习的参数,分别是…
前言 MMDetection在安装流程上,如果只是复制粘贴官方的文档,恐怕最终大概率是没法安装成功的( 而我上云以后,次次仓促复制粘贴,更是带来了大量不必要的麻烦,有时候还是需要因地适宜的修改些内容。…
前言 有一天晚上突发奇想,想到能不能自己做出来一个超便宜超简单的自动驾驶方案? 然后这篇文章就出来了.... 总之,在经过一晚上的敲定过后,大概是有了些眉目,最后决定做一个双目的自动驾驶方案,开发板是…