数字人、AI绘图……人工智能生成内容会带来怎样的变革？

【文/观察者网陈思佳】近年来，ChatGPT掀起了一股人工智能（AI）浪潮，生成式人工智能和人工智能生成内容（AIGC）的概念迅速进入社会各界的视野。在AI技术高速发展的当下，AIGC似乎已在不知不觉间渗透进人们的日常生活的方方面面。

7月6日至8日，以“智联世界生成未来”为主题的第六届世界人工智能大会（WAIC）在上海举行，展览涵盖核心技术、智能终端、应用赋能、前沿技术四大板块，包括大模型、芯片、机器人、智能驾驶等领域，参展企业超400家，优秀初创企业超50家，首发首展新品达30余款。

大模型和AIGC无疑是本次大会的焦点，华为、阿里、百度、科大讯飞等多家厂商的30余款大模型亮相世博展览馆，涵盖图片生成、视频生成、数字人等诸多AIGC项目的展台更是吸引大批观众。

但AI技术的迅猛发展也促使人们开始思考，大模型和AIGC具有什么样的前景？它们会给日常生活带来怎样的变革？生成式AI技术又有什么样的潜在发展门槛和风险？对此，在7月7日举行的“聚焦·大模型时代AIGC新浪潮论坛”上，来自多家机构、企业和高校的专家分享了他们的看法。

2023世界人工智能大会

30余款大模型同台竞技

本届WAIC聚焦大模型和AIGC，华为云盘古大模型、科大讯飞星火认知大模型、商汤商量中文语言大模型、阿里云通义千问、百度文心一言等30余款大模型亮相现场，各大厂商推出的产品涵盖算力底座、模型即服务（MaaS）、通用大模型、垂直应用大模型等方方面面。

作为本次大会的“镇馆之宝”之一，华为带来的昇腾AI“大模型超级工厂”覆盖大模型的数据&模型准备、算力准备&模型训练、模型部署上线&集成等阶段全流程。

目前基于昇腾AI原生孵化了业界首个两千亿参数的中文NLP大模型鹏城.盘古、业界首个多模态大模型紫东.太初以及华为云盘古系列在内的20多个国产大模型。同时，昇腾AI也已适配支持了ChatGLM、LLaMA、GPT-3、BLOOM等数十个业界主流开源开放的大模型。

7月7日，华为云CEO张平安还在华为开发者大会2023上宣布，盘古大模型3.0正式发布。据他介绍，该模型是一个完全面向行业的大模型系列，“盘古大模型不作诗，也没有时间作诗，因为它要深入到各行各业中去，让AI赋予各行各业价值。”

商汤科技“日日新SenseNova”大模型体系则覆盖文本生成、图像生成、数字人等多个领域。其中“商量SenseChat”是该体系下的千亿级参数语言大模型，具备领先的语义理解、多轮对话、知识掌握、逻辑推理的综合能力。目前，“商量SenseChat 2.0”已在医疗、金融、移动终端、代码开发等领域为客户提供服务。

作为“模型即服务”的倡导者，阿里云展出的通义大模型允许企业微调、训练模型，打造模型开放平台，提供一站式模型服务。阿里云还展示了其云计算技术体系的三层架构，从下到上分别包括基础设施即服务（IaaS）、平台即服务（PaaS）和模型即服务（MaaS）。

此外，多款应用于垂直领域的大模型也亮相本届WAIC。例如，达观数据发布的“曹植”大模型主要面向金融、政务等行业，具备长文本、垂直化和多语言等特点。蜜度发布的“蜜度文修”大模型则专为校对这一垂直领域打造，在中文拼写勘误、语法纠正等方面的表现优于通用大模型ChatGPT。

图片生成、音乐创作、数字人……AIGC触及生活方方面面

在迅猛发展的大模型的支持下，AIGC技术成为本届WAIC的一大亮点，图像生成、数字人直播、文本生成PPT、自动剪辑等多种生成式AI应用与大模型同步推出，相关展台可谓人山人海。

商汤科技展台展示了“秒画SenseMirage”生成的图像，这是一个包含商汤自研AIGC大模型和便捷的LoRA训练能力，并提供第三方社区开源模型加速推理的创作平台。据介绍，秒画SenseMirage 3.0的自研生成大模型参数提升至70亿量级，具有更强的中文理解能力、更多样化的风格选择。

燧原科技也展示了文生图MaaS平台服务产品“燧原曜图”，基于燧原科技“邃思”系列芯片的算力支持，为用户提供面向AIGC时代的高效易用、安全可靠的文生图服务。通过软硬件一体方案，该产品可以降低大规模AIGC应用的工程难度和算力成本。

网易伏羲推出了自研图片生成模型“丹青”和创意辅助产品“丹青约”，推动将AI技术应用于企业美术资产的生产创作流程中，将上线有灵美术平台。据介绍，“丹青”是基于原生中文语料数据及网易自有高质量图片数据训练，为100%的国产大模型。

金山办公的具备大语言模型能力的人工智能应用WPS AI则已经接入金山办公旗下WPS文字、演示、表格、PDF、智能文档和智能表格等组件。金山办公表示，这是国内协同办公赛道的首个类ChatGPT式应用，未来锚定AIGC、人机交互、知识再利用三个战略方向发展。

在音乐创作方面，腾讯多媒体实验室基于AIGC技术推出XMusic生成式通用作曲框架，支持视频、图片、文字、标签、哼唱等多模态内容作为输入提示词，生成情绪、曲风、节奏可控的音乐。在视频配乐、互动娱乐、辅助创作、音乐教育等众多领域都具有广阔的应用前景。

腾讯还展出了将生成式AI应用于电子游戏、科研、实时翻译等领域的探索。例如，腾讯优图展示的AI探星计划，利用AI技术和腾讯云的算力助力“中国天眼”（FAST），已在较短时间内快速发现数十颗脉冲星。

在智能手机的时代，AI技术也在与移动终端结合。美国高通公司展出了终端侧生成式AI用例演示，在搭载第二代骁龙8移动平台的安卓手机运行超10亿参数的Stable Diffusion模型，实现15秒内20步推理。

“大模型的产生并非一蹴而就”

AI热潮席卷全球，也促使人们开始思考，生成式AI技术会给社会生产带来怎样的变化？AIGC又具备怎样的发展前景？对此，7月7日上午举行的“聚焦·大模型时代AIGC新浪潮论坛”上，来自多家机构、企业和高校的专家分享了他们的观点。

京东探索研究院院长、京东科技智能服务与产品部总裁何晓东表示，生成式AI在今年取得了巨大的进展，可以做到文本生成、代码生成、图片生成、视频生成等，产生了生产力的变革。他认为，大模型带来了AI流行的机遇，从传统的基于某一个场景、某一个应用定制AI模型，进入到一个大的通用的模型可以服务于多个场景。

“一方面模型本身的成本是提高了，因为我们都知道，大模型本身需要大量的算力，需要大量的数据，需要一个很大、很强的综合性团队。在另一方面它的部署成本其实极大地降低了，因为一个模型可以部署到更多的地方。”何晓东说，“这就像我们进入工业时代，虽然工具更昂贵了，但它生产产品的效率反而提升了。”

何晓东表示，希望AIGC能加入更有创作力的领域，比如图像绘画生成等，“京东通过打造一站式的人工智能应用平台言犀平台，集成大量AI从感知到认知到生成的技术，使得我们可以在各个层次组合出各种各样丰富的应用式产品，服务各行各业。各行各业都能从这一次的人工智能技术进展中得到真正的提升。”

京东探索研究院院长、京东科技智能服务与产品部总裁何晓东发表讲话

HiDream.ai创始人、加拿大工程院外籍院士梅涛认为，多模态AIGC主要面临三大挑战：第一是标记化（Tokenization），有没有一种比较好的集合，能够把文本、视觉、语音等信息包含在一起。第二是解码（Decoder），大语言模型中常用的Transformer架构并没有在图像、视频中得到很好的应用。第三是对齐（Alignment），我们能不能做到不同模态之间交叉相关性的对齐。

梅涛指出，目前主流的视觉模型的能力边界基本都在几十亿参数的区间，在图像生成方面，人脸细节、手指细节、物体细节等问题都还没有解决，还有很多工作要做。

“我们想做的一件事就是问问自己，到底我们有没有可能把现在视觉多模态的基础模型，从它现在能力对标GPT-2.0的时代，走向GPT-3.0的时代。当然这也是我们HiDream的一个初心。”梅涛说。

HiDream.ai创始人、加拿大工程院外籍院士梅涛发表讲话

九章云极联合创始人尚明栋则谈及人工智能基础设施的变革。他表示，大模型的产生并非一蹴而就，而是需要完整的基础设施升级，无法依靠单独一个大模型解决更多的问题。他指出，基础设施的构成包括算力、数据和软件等方面。

尚明栋提到，美国初创公司CoreWeave在最近使用3584张H100芯片，仅用时11分钟就完成GPT-3模型的训练，整体开销约2万美元。但在2020年训练GPT-3模型需要450万美元，在2022年依然需要45万美元。“我们看到，随着算力和并行的一些基础软件的演进，我们算力的成本在持续下降。而算力成本下降的速度，我们判断也会快于模型大小增长。所以，以后算力将不会构成大模型计算的一个鸿沟。”

他指出，训练更高质量、更高效的模型，就需要质量更好的数据，“我们也知道，受限于数据的边界，考虑到数据隐私、数据安全等多方面因素，我们很难让它直接在通用的数据中流通。所以我们需要构建垂直领域大模型，结合从算力、数据到基础软件去赋能于千行百业。”

九章云极联合创始人尚明栋发表讲话

在基础软件方面，尚明栋认为，基础软件的核心价值在两点，一是高效地调度、管理数据和算力，将原先复杂的大模型构建变得更加容易。二是通过对基础软件高效的工程化、模块化和自动化，提高训练的效率。基础软件效率的提升意味着算力的节省和成本的降低。

“所以，大模型未来的挑战在于，我们希望大模型能够落地各行各业，那么落地于千行百业就需要和各个行业的业务结合在一起，并结合行业的业务知识。”尚明栋说。

“AI存在风险，但我们不应该因噎废食”

然而，AIGC的发展也面临诸多争议，从发展的门槛和壁垒到AI的风险和安全性都受到颇多质疑。对此，在“聚焦·大模型时代AIGC新浪潮论坛”的圆桌讨论环节中，多位专家指出，生成式AI发展可能面临诸多挑战和风险，但我们不能“因噎废食”，需要在长期的发展中寻找应对的方案。

上海人工智能实验室主任助理乔宇认为，大模型还存在很多问题，例如人们常说的“幻觉”、价值对齐、效率等，但社会各界需要用发展的目光看待AI，安全和发展是“一体两翼”的关系，特别是中国的大模型还处于追赶阶段，需要从发展的角度去看待安全问题。

谈及大模型可能存在的价值观方面的问题，乔宇表示，大模型的价值观是由训练数据得来的，“我们是不是能从训练数据端去解决？有些模型用在专业领域的时候，围绕这个专业领域，我们对它有一些安全要求，有可能从中继承一些。所以要从大模型技术研发的不同环节来思考安全问题。”

乔宇强调，大模型的安全不单单是某一个科研团体、某一个产业领域或是中国单独面临的问题，它是全世界乃至全人类面临的问题，“所以我认为在安全领域，我们应该展开更多的国际交流和合作，来共同面对和解决。”

“聚焦·大模型时代AIGC新浪潮论坛”圆桌讨论环节

香港中文大学助理教授王历伟从人才和研究的角度切入，他认为，从人才培养的速度来看，很大的优秀科研人员基础可以降低未来研发的门槛，训练大模型的算力需求成本看起来也比较乐观。“我觉得从短期或中长期来看，无论是人才储备还是算力，大模型的研发门槛可能在慢慢降低。”

王历伟表示，科研人员需要关注如何理解和评价大模型的能力，“如果我们持续从一种评价方式去衡量大模型的能力，可能多多少少还是比较片面。”他认为，学术领域人士很适合去更多地探索安全性和AI治理等方向的内容。

蚂蚁集团机器智能部副总经理、蚂蚁安全天筭实验室主任张天翼表示，大模型带来的风险问题不一定是新的问题，但更加深度的应用可能造成更全面的影响，包括生成内容安全问题、技术安全、隐私问题、合规问题以及伦理问题等。

张天翼认为，当前大模型存在三方面的风险，一是技术相关问题，模型本身可能被攻击、被突破、被劫持。二是产业类风险，AI是否会带来垄断、劳动替代等问题。三是内容类的问题，是否会向用户提供不安全的内容。

他表示，大模型的风险问题没有“灵丹妙药”，必然是一个长期对抗和博弈发展的过程，“比如说现在安全行业内的一个很直接的应用，我们也会用大模型来对抗更多大模型中的风险，这也会是一个‘用魔法打败魔法’的方向。”

云天励飞副总裁、AI技术平台总经理肖嵘则为生成式AI的发展总结了四个问题，分别是生成内容存在“幻觉”的问题、工具使用和外部知识整合能力、逻辑推理能力和不具备持续学习能力的问题。

在安全问题上，肖嵘认为，大模型其实具备“价值观”，它所认定的知识不一定就是事实，“解决这个问题其实有两个路径，第一个是它为什么会产生有错的东西？可能它学的东西都是不对的……所以我们需要对语料有体系地治理，保证其安全、可控。第二个也是我们正在大力推动的，比如对模型输出的治理。”

但他也强调，AI是一种工具。“越强大的工具被用来作恶，可能影响也越大。”肖嵘说，“我认为，工具用得好不好，更多是人的问题。我们不应该因噎废食，不是看到强大的工具就不去使用，而是更多地想想怎么把它有序化。”

本文系观察者网独家稿件，未经授权，不得转载。

上一篇：抖音直播投流怎么投？三大方式介绍

下一篇：抖音来客 V8.1.5 安卓版

数字人、AI绘图……人工智能生成内容会带来怎样的变革？

推荐阅读

推荐产品

北京某某塑料板材有限公司

公司新闻

相关资讯

联系我们