Few-shot

Few-shot

本质上是让你大模型在上下文窗口上进行学习,给出一些示例,让大模型根据这些事例来进行推理。

示例的数量可多可少。它的目标是让机器自己学会学习。

Meta learning

few-shot是一种meta learning

meta learning是学习进行学习的方式。

其中没见过的物体是Query,旁边的提示为support set。

拿图片举例子

如果只靠1个数据进行学习,那么被称作one-short learning。一般新出现的图片不会在训练集中出现。

  • k-way:support set有k个类别
  • n-shot:每个类有n个采样

如果要做few-shot分类,那么few-shot的准确率会受类别影响和样本影响。下图是预测准确率

同样的shot越多准确率越高。

few-shot的目标是学习函数sim。可以这样训练

从很大的数据集上进行训练,sim函数可以判断俩个图片的相似度有多高。

然后判断输入图片和support set中的图片相似度有多高。找到最高相似的分数的样本。

zero-shot

而zero-shot learning的目标能够泛化到未见过的任务,通常通过共享特征空间或者语言表征来实现。如下。

它是一种基于属性的学习方法。即便在目标中没有看到类别。模型也会根据类型推断。

很多few-shot都是基于embdding方法进行学习。

Last modification:October 4, 2024
如果觉得我的文章对你有用,请随意赞赏