1.1 生成式AI用例和任务
与深度学习类似,生成式AI是一种通用技术,可以满足多个行业和客户群体的多种用途。目前已有多种类型的多模态生成式AI任务,这里列出了常见的任务及相关用例。
文本摘要
生成一段较短的文本,同时保留主要思想。示例包括将新闻文章、法律文件或财务报告摘要为更少的字数或段落,以便更快地阅读。通常在客户支持中使用摘要功能,以快速地概述客户与客服代表之间的互动。
重写
修改文本措辞以适应不同的受众、正式程度或语气。例如,可以将正式的法律文件转换为使用较少法律术语的不那么正式的文件,以吸引非法律专业的受众。
信息提取
从文档中提取诸如姓名、地址、事件、数据或数字等信息。例如,将电子邮件转换为ERP系统(如SAP)中的采购订单。
问答(Question Answering,QA)和视觉问答(Visual Question Answering,VQA)
直接针对一组文档、图像、视频或音频提出问题。例如,可以设置一个面向员工的内部聊天机器人,用于回答有关人力资源和福利的问题。
有害内容检测
作为问答任务的扩展,你可以询问生成式模型一组文本、图像、视频或音频中是否包含有害内容。
分类和内容审查
为给定的内容(如文档、图像、视频或音频剪辑)分配一个类别。例如,删除电子邮件中的垃圾邮件、过滤不适当的图像及为基于文本的客户服务记录添加标签等。
对话式界面
通过提供类似聊天界面的方式处理多轮对话,以完成相应任务。例如自助的客户支持服务或用于心理健康治疗的聊天机器人等。
翻译
语言翻译是生成式AI最早的用例之一。例如,假设本书的出版商想出版德语翻译版本,以帮助扩大图书的影响力。或者,你希望将基于Python的示例转换为基于Java的,以便用于现有的Java的应用程序。
源代码生成
根据自然语言代码注释或者手绘草图生成源代码,如图1-1所示。在这里,这个基于HTML和JavaScript的网页是基于餐巾纸背面涂鸦的UI草图生成的。
推理
通过问题推理来发现潜在的新解决方案、权衡或隐藏的细节。例如,假设一位CFO(Chief Financial Off icer,首席财务官)向投资者提供基于音频的季度财务报告及更详细的书面报告。通过对这些不同媒介格式的信息进行推理,模型可能会发现一些关于公司经营状况的结论,而这些结论在原始的音频或文本中并未直接提及。
图1-1 根据涂鸦的UI草图生成网页
掩蔽个人身份识别信息
可以使用生成式模型从给定的文本语料库中掩蔽个人身份识别信息(Personally Identif iable Information,PII)。对于许多需要处理敏感数据并希望从工作流中删除PII数据的用例,这非常有用。
个性化营销和广告
根据用户个人资料特征生成个性化的产品描述、视频或广告。假设一个电子商务网站希望根据登录用户的年龄或家庭情况为每个产品生成个性化描述。还可以为老年人、儿童家长或儿童生成个性化的产品图像,以更好地适配和吸引不同特征的用户,如图1-2所示。
图1-2 个性化营销示例
在这个示例中,每个用户会看到同一产品的独特和高度个性化的图像与描述。这最终可能会带来更多的产品点击和更高的销售额。
在这些生成式的用例和任务中,模型创建的内容已接近于人类对语言的理解,这确实令人惊叹。这是由一种叫作Transformer的神经网络架构来实现的,我们会在第3章中学习Transformer。
在1.2节中,我们将学习如何通过模型中心访问基础模型。