AIGC基础、应用与展望(人工智能通识 微课版)

面向人工智能通识课程的“AIGC”新形态精品教材。理论深度较浅,适合入门学习,融合前沿技术,创新教材形态,配套丰富资源,支持读者使用与体验AIGC大模型【重点好书】。
分享 推荐 0 收藏 19 阅读 429
贾小林 , 朱勇 , 李晓黎 (主编) 陈华容 , 刘敏贤 , 敬会 (副主编) 978-7-115-66578-2

关于本书的内容有任何问题,请联系 人邮社 王宣

1.面向通识教育,构建知识体系
2.理论深度较浅,适合入门学习
3.紧跟时代发展,融合前沿技术
4.创新教材形态,助力读者自学

特别说明

【使用与体验AIGC大模型】:
本书从众多AIGC大模型中选择了具有代表性的大模型进行解读,使读者能够轻松理解其工作原理,内容涵盖代码生成、图像生成、语音生成和视频生成等诸多应用领域。在此基础上,本书还将带领读者一起【试用各种类型的AIGC大模型】,使读者能够【直观体验AIGC大模型】落地应用的效果。

【本书特色】:
1.面向通识教育,构建知识体系
本书从最基础的 AI 概念入手,沿着 AI 基础概念、机器学习基础、深度学习基础、AIGC背后的基础技术、AIGC 大模型的学习路线逐层递进,读者不需要学习其他基础课程,即可读懂书中的内容。AI 是以计算机科学为基础,涉及计算机、数学、统计学等知识的交叉学科。书中讲到涉及其他学科的知识时,都会提前介绍,比如第 2 章介绍生成模型时涉及较多统计学的知识,因此 2.1.3 小节讲解了生成模型中用到的统计学概念,为读者学习和理解后面的内容奠定基础。
2.理论深度较浅,适合入门学习
AI 模型的核心技术是算法和模型的网络结构。模型的网络结构是算法的具体实现,而理解深度学习模型(特别是 AIGC 大模型)中的算法需要很多数学知识。为了便于初学者理解深度学习模型的工作原理,本书只简要介绍一些基础算法的数学公式,而在介绍深度学习模型时,通常只介绍其网络结构,不涉及算法的数学公式,因为初学者只要理解模型的工作原理即可,不需要掌握设计 AI 模型的理论与技术。
3.紧跟时代发展,融合前沿技术
AIGC 技术在近几年高速发展,涌现出很多新技术和新的 AIGC 大模型。为了让读者能够紧跟 AIGC 技术发展的潮流,本书不但重点讲解了经典 AIGC 技术——大语言模型的工作原理和具体应用,还介绍了 AIGC 在代码生成、图像生成、语音生成和视频生成等领域的应用。书中讲解的很多 AIGC 大模型都是近年来推出的新模型,涵盖了 AIGC 技术的最新发展趋势。
4.创新教材形态,助力读者自学
编者结合书中重点内容录制了大量微课,为读者开展高效自学提供了便捷路径,并提供丰富的教辅资源,以帮助院校老师快速开展教学。为了便于初学者理解 AIGC 大模型的具体应用,本书还设计了各种体验任务,可与读者共同体验大语言模型和各种多模态 AIGC 大模型的应用效果,使读者在体验丰富、新奇的 AI 技术的同时,加深对基础理论和 AIGC 大模型工作原理的理解,实现理论性、趣味性与实用性相结合。

内容摘要

AI是近年来炙手可热的前沿技术。随着越来越多的AI应用进入人们的视野,AI技术也赢得了国内外社会公众、专家、学者和开发者的广泛关注。
自2022年ChatGPT横空出世以来,AIGC迅速成为极其火爆的AI发展方向。近年来,各种AIGC大模型层出不穷,AIGC大模型生成的内容也日臻完善,并且已经达到可以落地应用的程度,因此可能创造大量的就业机会。
本书概述了AIGC的基础技术,从机器学习、深度学习的基本概念和基础算法,到生成模型、自然语言处理和计算机视觉的相关技术,即使是没有学过AI基础知识的读者,也可以轻松入门。本书还从众多AIGC大模型中选择了具有代表性的大模型进行解读,使读者能够轻松理解其工作原理,内容涵盖代码生成、图像生成、语音生成和视频生成等诸多应用领域。在此基础上,本书还将带领读者一起试用各种类型的AIGC大模型,使读者能够直观体验AIGC大模型落地应用的效果。
本书既可作为高校人工智能通识课程或AIGC相关课程的教材,也可作为相关领域的从业人员入门了解AI的参考用书。

目录

【章名目录】

【第1篇 导论篇】
第1章 AI技术概述
【第2篇 基础篇】
第2章 生成模型
第3章 自然语言处理经典模型
第4章 计算机视觉经典模型
【第3篇 应用篇】
第5章 大语言模型
第6章 代码生成大语言模型
第7章 图像生成大模型
第8章 语音生成大模型
第9章 视频生成大模型
【第4篇 展望篇】
第10章 AIGC时代的机遇、挑战及发展趋势
附录 大语言模型智能体精选与推荐


【详细目录】

【第1篇 导论篇】
第1章 AI技术概述
1.1 AI技术基础 2
1.1.1 AI技术的发展历程 2
1.1.2 AI领域的常用概念 4
1.2 机器学习基础 7
1.2.1 机器学习的三要素 7
1.2.2 机器学习的分类 8
1.2.3 机器学习的工作流程 10
1.2.4 机器学习案例:使用线性回归算法预测房价 11
1.3 深度学习基础 16
1.3.1 深度学习的概念 16
1.3.2 前馈神经网络与反向传播算法 17
1.3.3 深度学习案例:基于LeNet-5模型识别手写数字 17
1.3.4 深度学习的常用基础函数和算法 18
1.3.5 深度学习的基本工作流程 23
1.4 AIGC的发展历史、应用方向及基础技术 25
1.4.1 AIGC的发展历史 25
1.4.2 AIGC的应用方向 26
1.4.3 AIGC的基础技术 28
本章小结 32
习题 32
课程实践 33

【第2篇 基础篇】
第2章 生成模型
2.1 生成模型技术基础 35
2.1.1 生成模型和判别模型 35
2.1.2 生成模型的分类 36
2.1.3 生成模型中用到的统计学概念 37
2.2 深度生成模型 42
2.2.1 GAN模型 42
2.2.2 自回归模型 44
2.2.3 扩散模型 44
2.2.4 VAEs模型 46
2.2.5 标准化流模型 49
本章小结 50
习题 50
课程实践 50

第3章 自然语言处理经典模型
3.1 NLP技术的发展历程和应用现状 52
3.1.1 NLP技术的发展历程 52
3.1.2 NLP技术的应用现状 54
3.2 NLP技术基础 55
3.2.1 文本的数值化表示 56
3.2.2 NLP模型 59
3.2.3 注意力机制 60
3.2.4 语料库 66
3.3 经典NLP深度学习模型 67
3.3.1 RNN模型 67
3.3.2 编码器-解码器架构 69
3.3.3 LSTM模型 69
3.3.4 Transformer架构 70
3.3.5 BERT模型 78
本章小结 80
习题 80
课程实践 81

第4章 计算机视觉经典模型
4.1 CV技术的发展历程和应用现状 82
4.1.1 CV技术的发展历程 82
4.1.2 CV技术的应用现状 84
4.2 CV技术基础 85
4.2.1 图像的表现形式 86
4.2.2 数字图像处理 87
4.3 经典CV模型 89
4.3.1 CNN模型 89
4.3.2 ResNet模型 96
4.3.3 ViT模型 97
本章小结 100
习题 100
课程实践 100

【第3篇 应用篇】
第5章 大语言模型
5.1 大语言模型概述 102
5.1.1 大语言模型的定义 102
5.1.2 大语言模型的工作原理 104
5.1.3 大语言模型落地应用的方法 105
5.2 主流大语言模型简析 105
5.2.1 国外主流大语言模型 105
5.2.2 国内主流大语言模型 107
5.3 GPT系列模型的工作原理 109
5.3.1 GPT-1 109
5.3.2 GPT-2 113
5.3.3 GPT-3 120
5.3.4 GPT-3.5和GPT-4 122
5.4 体验主流大语言模型 123
5.4.1 设计体验任务 123
5.4.2 体验大语言模型的方法 125
5.4.3 体验纯文本任务 127
5.4.4 体验多模态任务 131
本章小结 137
习题 138
课程实践 138

第6章 代码生成大语言模型
6.1 代码生成大语言模型概述 139
6.1.1 什么是代码生成大语言模型 139
6.1.2 代码生成大语言模型的基本工作原理 141
6.2 主流代码生成大语言模型选解 142
6.2.1 GitHub Copilot 142
6.2.2 CodeWhisperer 143
6.2.3 CodeGeeX 143
6.2.4 CodeBERT 146
6.3 体验CodeWhisperer 148
6.3.1 在IDEA中安装AWS Toolkit插件 148
6.3.2 在IDEA中使用CodeWhisperer 149
6.3.3 Amazon Q Chat 150
6.3.4 在开发过程中利用CodeWhisperer的编码建议 152
6.4 体验CodeGeeX 154
6.4.1 在VS Code中安装CodeGeeX插件 154
6.4.2 在VS Code中使用CodeGeeX 155
本章小结 160
习题 160
课程实践 160

第7章 图像生成大模型
7.1 图像生成大模型的工作原理 161
7.1.1 图像嵌入 161
7.1.2 图像生成大模型的基本工作流程 162
7.1.3 条件生成模型 163
7.1.4 建立文图联系的CLIP模型 165
7.2 主流图像生成大模型选解 168
7.2.1 国外的图像生成大模型 168
7.2.2 国内的图像生成大模型 175
7.3 体验图像生成大模型 176
7.3.1 体验图像生成大模型的方法 176
7.3.2 设计体验任务 180
7.3.3 体验生成人物摄影图像 183
7.3.4 体验生成风景植物图像 186
7.3.5 体验生成建筑设计图像 188
7.3.6 体验生成中国风格图像 190
本章小结 192
习题 192
课程实践 192

第8章 语音生成大模型
8.1 语音生成大模型的工作原理 193
8.1.1 TTS技术的发展历史 193
8.1.2 梅尔频谱 194
8.1.3 TTS的工作原理 194
8.2 语音生成大模型选解 195
8.2.1 XTTS模型 195
8.2.2 Mega-TTS模型 196
8.3 体验语音生成大模型 198
本章小结 199
习题 199
课程实践 200

第9章 视频生成大模型
9.1 视频生成大模型的基础技术 201
9.1.1 视频表示 201
9.1.2 条件概率视频生成大模型的概念 201
9.2 主流视频生成大模型选解 202
9.2.1 Sora模型的工作原理 202
9.2.2 MagicVideo-V2模型的工作原理 205
9.3 体验主流视频生成大模型 206
9.3.1 Gen-3模型生成的视频 206
9.3.2 Pika模型生成的视频 207
9.3.3 MagicVideo-V2模型生成的视频 208
本章小结 209
习题 209
课程实践 209

【第4篇 展望篇】
第10章 AIGC时代的机遇、挑战及发展趋势
10.1 AIGC的社会影响 211
10.1.1 AIGC对社会经济的影响 211
10.1.2 AIGC对普通人生活的影响 212
10.2 AIGC时代的机遇和挑战 213
10.2.1 AIGC时代的机遇 213
10.2.2 AIGC时代的挑战 216
10.3 AIGC技术所面临的挑战及发展趋势 221
10.3.1 AIGC技术的伦理问题和所面临的挑战 221
10.3.2 AIGC技术的发展趋势 224
本章小结 227
习题 228
课程实践 228

附录 大语言模型智能体精选与推荐
F.1 文心智能体平台 229
F.2 通义智能体 229
F.3 ChatAI的定制模型 230
F.4 DeepSeek智能体 231

读者评论

赶紧抢沙发哦!

我要评论

作者介绍

贾小林:
教授,博士生导师,毕业于西南交通大学,获工学博士学位;现任计算机科学与技术学院副院长,分工负责本专科教育教学与改革、专业建设与评估、教学研究、本科人才培养团队建设等工作,分管教学科研办公室。四川省普通本科高校教学指导委员会委员,国际电子电器工程师学会(IEEE)高级会员,中国计算机学会(CCF)高级会员,CCF优秀传播大使,四川省海外高层次留学人才,绵阳市“4+3”高端成长型产业领军人才,绵阳市优秀教师,西南科技大学十佳岗位青年、优秀共产党员、优秀教师、教学名师等,入选西南科技大学70周年校庆特辑《龙山薪火-西南科大人之教师篇》;主要从事射频识别(RFID)技术、物联网(IOT)技术、计算机应用技术等领域的研究和教学工作;主持完成国家自然科学基金面上项目、四川省科技支撑计划重大项目、四川省应用基础研究项目、四川省高校成果转化重大培育项目、制造过程测试技术教育部重点实验室重点项目等重要研究课题;研究成果荣获四川省科学技术进步二等奖1项,四川省高等教育教学成果三等奖2项,西南科技大学优秀教学成果一等奖1项。

李晓黎:
软件开发工程师,毕业于吉林大学计算机系;自2006年以来,带领团队一直从事网络管理软件、企业ERP系统和电商平台等的开发与建设工作,具有中国投资银行、国家开发银行、中信银行等多家银行从业经历,参与银行信息化建设、网银平台开发、智能合约设计与开发工作多年,在人工智能、AIGC、Java程序设计、系统软件开发、团队组织管理和系统架构设计等领域积累了丰富的实战经验,主编图书10余本,并被上百所高校选作教材。

相关技术

相关图书

人邮微信
本地服务
人邮微信
教师服务
二维码
读者服务
读者服务
返回顶部
返回顶部