生成式AI入门与AWS实战
上QQ阅读APP看书,第一时间看更新

2.5.4 上下文学习出错

值得注意的是,你可以“欺骗”模型令其暂时学习错误的答案。例如,可以提供3个上下文中的提示-补全对示例,将一个正面的客户评价表示为负向情感,将一个负面的客户评价表示为正向情感。

示例2-4~示例2-6展示了一个带有错误情感的少样本上下文提示。

示例2-4 指令

Classify the sentiment of the review using the format shown in the context.

示例2-5 上下文

Wrigley Field is a fun stadium to watch a baseball game on a day with a clear blue 
sky.
Sentiment: NEGATIVE
 
The hungry seagulls during the 9th inning of a home Cubs game are very aggressive 
and annoying.
Sentiment: POSITIVE
 
Murphy's is my favorite bar in Chicago on a Friday afternoon right before the start 
of a Cubs game.
Sentiment: NEGATIVE

示例2-6 输入数据和输出指示符

Harry Caray was the best Cubs sports announcer of all time!
Sentiment:

补全:

NEGATIVE

在这个示例中,使用该提示-补全对向模型发起推理请求,很可能会得到与事实相反的情感倾向判断结果。这是上下文学习的一个独特但有趣的性质,仔细核查你的上下文提示-补全对是非常有价值的。