前言
阅读完本书,读者将了解当今产业界和学术界常用的生成式AI用例和任务。首先,你将深入了解如何构建这些前沿的生成式模型,并获得实践经验,以帮助你选择是重用现有的生成式模型还是从头开始构建一个新模型。然后,你将学习如何将这些生成式模型适配到特定领域的数据集、任务和用例中,以支持商业应用。
本书为人工智能和机器学习爱好者、数据科学家和数据工程师提供了学习生成式AI模型训练、微调以及部署到生产环境的技术基础和实践。我们假设你已经熟悉Python和深度学习的基本组件,如神经网络、前向传播、激活函数、梯度和反向传播,以便理解本书介绍的概念。
如果你对Python和深度学习框架(如TensorFlow或PyTorch)有基本的了解,就足以理解本书中的代码示例。熟悉AWS对于学习这些概念并不是必需的,但对于了解某些特定于AWS的示例很有用。
在本书中,首先,你将深入探索生成式AI项目生命周期,并学习提示工程、少样本上下文学习、生成式模型预训练、领域自适应、模型评估、参数高效微调(Parameter-Efficient Fine-Tuning,PEFT)和基于人类反馈的强化学习(Reinforcement Learning from Human Feedback,RLHF)等主题。
其次,你将动手实践流行的大语言模型,如Llama 2和Falcon,以及包括Stable Diffusion和IDEFICS在内的多模态模型。你可以通过Hugging Face模型中心、Amazon SageMaker JumpStart或Amazon Bedrock托管的生成式AI服务访问这些基础模型。
然后,你还将学习如何实现基于上下文的检索增强生成(Retrieval-Augmented Generation,RAG)[1]和基于agent的推理工作流[2]。你将探索应用程序框架和库,包括LangChain、ReAct[3]和程序辅助语言(Program-Aided-Language,PAL)。你可以利用这些框架和库来访问自己的定制数据源和API,或与外部数据源(如网络搜索和合作伙伴数据系统)进行集成。
[1] Patrick Lewis et al., “Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks”, arXiv, 2021.
[2] Jason Wei et al., “Chain-of-Thought Prompting Elicits Reasoning in Large Language Models” , arXiv, 2022.
[3] Shunyu Yao et al., “ReAct: Synergizing Reasoning and Acting in Language Models”, arXiv, 2023.
最后,你还将在多模态(如文本、图像、音频和视频)生成式AI用例中探索与生成式相关的概念、框架和库。
如果你现在还未能完全理解这些概念,不用担心,本书将深入探讨每一个主题。有了这些知识和实践经验,你就可以开始构建前沿的生成式AI应用程序,这些应用程序有助于更好地服务客户、超越竞争对手并增加收入。